
關於 Google Analytics 「不得追蹤單一個體」的誤解?

昨天 Google Analytics 把 Universal Analytics 送進公測,我終於有機會到處看看。新的 Measurement Protocol 要求每個 Request 都要送個 Unique-id 給 GA,以便辨識是同一人(使用 Web 版或行動 SDK 的人,程式會自己幫你搞定這一點,一切都跟以前一樣),因此我覺得或許我以前誤解了 Google「不得識別單一個體」的條文。後來看 Universal Analytics 的資料找到這條:

You will not upload any data that allows Google to personally identify an individual (such as certain names, social security numbers, email addresses, or any similar data), or data that permanently identifies a particular device (such as a mobile phone’s unique device identifier if such an identifier cannot be reset), even in hashed form.

「您不可以上傳任何能讓 Google 識別特定個人(如姓名、身分證字號、電子郵件地址等)或特定設備(例如手機上無法更動的唯一設備號碼)的資料,即使雜湊過也不行。」

這好像跟我原本的認知就已經不同了,畢竟他很強調「不可讓 Google 識別」,而不是不可讓我識別。於是又回頭看服務條款:

You will not (and will not allow any third party to) use the Service to track, collect or upload any data that personally identifies an individual (such as a name, email address or billing information), or other data which can be reasonably linked to such information by Google.

「您不可(亦不能授意第三方)使用此服務追蹤、搜集、上傳任何可用以識別單一個人的資料(如姓名、電子郵件地址、賬單資訊等),或其他可由 Google 合理連結此等資訊的資料。」

好像仍然只是在強調不可以陷 Google 於不義。也就是說,依照此兩條解釋,其實如果我自己為使用者定一個 ID(例如 35009a79-1a05-49d7-b876-2b884d),然後設定 Custom Value 去追這個 ID,並不違反 Google 的條款。因為只有我自己才可能知道 35009a79-1a05-49d7-b876-2b884d0f825b 是誰,Google 無從得知,除非他駭進我後台系統,或者我笨笨的在前台就把這個 ID 跟前述使用者個人資料連在一起。


