蒼蠅再小也是肉,聚沙成塔。
作者 | 芯芯
編輯 | 靖宇
你知道嗎,自己的數(shù)據(jù),現(xiàn)在已經(jīng)開始合法地被互聯(lián)網(wǎng)大廠們用作 AI 訓練了。
在新一波的 AI 競賽中,由于訓練模型需要大量數(shù)據(jù),當互聯(lián)網(wǎng)的普通數(shù)據(jù)挖掘殆盡,平臺上大量用戶個人內(nèi)容,便成了充滿誘惑的礦藏。
一些硅谷的科技公司如此渴望新數(shù)據(jù),開始偷偷摸摸把 AI 訓練加入到數(shù)據(jù)使用政策中,賦予自己使用人們數(shù)據(jù)的權利。
在過去一年多里,包括谷歌、Meta、Adobe、Zoom 和 X 等大公司紛紛更新其服務條款或隱私政策,允許自己利用用戶數(shù)據(jù)來訓練生成式 AI 模型。
這些互聯(lián)網(wǎng)大廠,都偷偷在「服務條款」里塞進了什么貨?
01
硅谷巨頭的「小動作」
隨著科技巨頭對數(shù)據(jù)的渴望越來越大,它們正在仔細重寫其條款和條件,以包含「人工智能」、「機器學習」和「生成式人工智能」等詞語。
為了避免用戶對隱私問題的反感,公司有時悄悄地進行這些更改。在許多情況下,用戶會在未閱讀一字的情況下點擊同意,毫無警覺地接受協(xié)議。
下面是硅谷大廠們在用戶服務條款中各自「夾帶私貨」的細節(jié):
谷歌
在 2022 年末,當 OpenAI 發(fā)布了 ChatGPT 并引發(fā)了全行業(yè)的追趕競賽后,谷歌的研究人員和工程師開始討論如何利用其他用戶數(shù)據(jù)。數(shù)十億字的內(nèi)容存儲在人們的 Google 文檔和其他免費 Google 應用中,但是公司的隱私政策限制了他們?nèi)绾问褂眠@些數(shù)據(jù)。
當時,谷歌的隱私政策規(guī)定公司只能使用公開可用信息來「幫助訓練谷歌的語言模型和構建像 Google 翻譯這樣的功能」。
去年 6 月,據(jù)紐約時報報道,谷歌的法律部門要求隱私團隊起草語言,以擴展公司可以使用消費者數(shù)據(jù)的范圍。
去年 7 月,谷歌對其隱私政策進行了修改,增加了公共信息可用于訓練其 AI 聊天機器人和其他服務的內(nèi)容。
谷歌將 Bard 和云端 AI 加入到用戶條款中|NYT
「我們使用公開可用的信息來幫助訓練谷歌的 AI 模型,并構建諸如谷歌翻譯、Bard 和云 AI 功能等產(chǎn)品和功能?!?/p>
為了安撫用戶,谷歌聲明稱,其隱私政策的變更「只是澄清了像 Bard(現(xiàn)為 Gemini)這樣的新服務也包括在內(nèi)。我們并沒有因為這種語言變化而開始在其他類型的數(shù)據(jù)上訓練模型。」
谷歌的 AI 訓練當然也有用最私人化的數(shù)據(jù),如給朋友和家人的信息。谷歌發(fā)言人表示,在得到一小群用戶許可的情況下,谷歌被允許在某些方面使用他們的個人電子郵件訓練其人工智能。
Meta
去年 Meta 就更新了相關隱私政策,用戶「在我們的產(chǎn)品和服務上提供的活動和信息」將被用來訓練其 AI,包括在使用像其 AI 工具時所寫或所說的一切。
Meta 表示,其 AI 不會讀取用戶在 Messenger 和 WhatsApp 等應用上與朋友和家人之間發(fā)送的消息,除非用戶在消息中 @ 了其 AI 聊天機器人。Meta 將與 AI 互動的責任推給用戶,表示人們應該「注意」他們在提示中所說的話,比如不要包括任何個人信息,如家庭地址或電話號碼。
Meta 聲明表示:「我發(fā)送給生成式 AI 功能的信息會發(fā)生什么?AI 可能會保留并使用您在聊天中分享的信息,以提供更個性化的響應或相關信息,我們可能會與可信賴的合作伙伴(如搜索提供商)共享您提出的某些問題,以提供更相關、準確和最新的響應。」
「使用公開可用的信息訓練人工智能模型是整個行業(yè)的慣例,并非我們服務獨有。」Meta 發(fā)言人在聲明中說。
X
X 在條款后方補了一句對于人工智能模型訓練的事項|NYT
馬斯克一直在構建一個 AI 項目。去年 9 月,X 在其隱私政策中添加了一句話,關于機器學習和人工智能。
「我們使用收集到的信息來提供和運營 X 產(chǎn)品和服務。我們還使用收集到的信息來改進和個性化我們的產(chǎn)品和服務,以便您在 X 上獲得更好的體驗,包括向您展示更相關的內(nèi)容和廣告、建議您關注的人和主題、啟用和幫助您發(fā)現(xiàn)關聯(lián)公司、第三方應用和服務。我們可能會使用收集到的信息和公開可用的信息來幫助訓練我們的機器學習或人工智能模型,以實現(xiàn)本政策中概述的目的。」
Snap
Snap 有些服務條款的變更只有幾個字。另一些則新增了整段內(nèi)容來解釋生成式人工智能模型的工作原理,以及它們對用戶數(shù)據(jù)的訪問類型。
例如,今年,Snap 更新了其聊天機器人 My AI 的數(shù)據(jù)收集的隱私政策。Snap 提醒用戶不要與其人工智能聊天機器人分享機密信息,因為這些信息將用于訓練。
Snap 對于 My AI 聊天機器人的條款改動較多|NYT
「My AI 是一個基于生成式 AI 技術構建的聊天機器人,設計理念確保安全。生成式 AI 是一種正在開發(fā)的技術,它可能會提供有偏見、不正確、有害或誤導性的答案。所以,你不應該依賴它的建議。您也不應該分享任何機密或敏感信息——如果您這樣做,My AI 會使用它。」
「當您與 My AI 互動時,我們會使用您分享的內(nèi)容和您的位置(如果您已啟用 Snapchat 的位置共享)以改進 Snap 的產(chǎn)品,包括增強 My AI 的安全性,并個性化您的體驗,包括廣告?!?/p>
Zoom
Zoom 去年 7 月開始更新其服務條款,說明會將用戶數(shù)據(jù)用于訓練 AI,但遭遇用戶和隱私提倡者的大量批評。在面臨社交媒體上的強烈反對聲音后,Zoom 去年 8 月又再次更新了服務條款,澄清未經(jīng)同意不會使用視頻、音頻或聊天內(nèi)容。
更新后的服務條款仍然要求用戶「在此授予 Zoom 永久性、全球性的、非獨占性的、免版稅的、可轉(zhuǎn)許可和可轉(zhuǎn)讓的許可及所有其他權利」使用客戶內(nèi)容。
這些權利包括「重新分發(fā)、發(fā)布、導入、訪問、使用、存儲、傳輸、審查、披露、保存、提取、修改、復制、共享、展示、復制、分發(fā)、翻譯、轉(zhuǎn)錄、創(chuàng)作衍生作品和處理」客戶內(nèi)容。
條款不再具體提及 Zoom 有權就客戶內(nèi)容進行「AI 和 ML 訓練」,而是更模糊地提到「服務開發(fā)、營銷、分析、質(zhì)量保證、機器學習、人工智能、培訓、測試、服務、軟件或 Zoom 其他產(chǎn)品、服務和軟件的改進,或以上任何組合。」
Adobe
今年 6 月初,Adobe 因在其隱私政策中加入了一句關于自動化的短語,激怒了不少創(chuàng)作者,許多用戶將其解讀為與 AI 數(shù)據(jù)抓取有關。
「我們訪問您的內(nèi)容:我們可能會通過自動和手動方法訪問、查看或聆聽您的內(nèi)容,但僅在有限的方式下,并且僅在法律允許的情況下。」
Adobe 公司的用戶對于數(shù)據(jù)被拿來用 AI 訓練比較敏感|NYT
這些條款影響了 Adobe 創(chuàng)意云套件的超過 2000 萬用戶,一些用戶認為這允許 Adobe 訪問、查看他們的內(nèi)容,包括受保密協(xié)議保護的作品。一些人認為 Adobe 正在監(jiān)視他們的工作,吸收用戶的藝術作品,并可能將其用于訓練 AI 模型。
在用戶強烈反對后,Adobe 更新了服務條款,明確表示不會使用客戶作品訓練 AI。
Adobe 通過博客文章澄清,這些變更是為了檢測和刪除非法內(nèi)容,例如兒童色情材料(CSAM),以及濫用內(nèi)容或行為,包括垃圾郵件和網(wǎng)絡釣魚。Adobe 不會使用存儲在 Adobe 云上的文件來訓練其 Firefly AI。
02
提前占好「免責」的坑
不過,巨頭們的小動作,還是有監(jiān)管在看著的。
美國聯(lián)邦貿(mào)易委員會(FTC)長期以來一直盯著與公司隱私政策有關的欺騙性和不公平行為。過去曾起訴過那些以偷偷摸摸的方式更改隱私政策、破壞對消費者的現(xiàn)有承諾的公司。
今年 2 月,美國聯(lián)邦貿(mào)易委員會警告科技公司,改變隱私政策以追溯性地抓取舊數(shù)據(jù)可能是不公平或欺騙性的,將追究「悄悄」更改隱私政策以挖掘用戶數(shù)據(jù)用于 AI 的公司。
FTC 指出,公司可能會被誘惑從其用戶群中挖掘現(xiàn)有數(shù)據(jù)以供 AI 模型使用,有「強大的商業(yè)動機」。FTC 稱公司潛在的困境是利益沖突?!甘袌鰠⑴c者應注意,任何背棄其用戶隱私承諾的公司都可能觸犯法律?!?/p>
不過,就在上周,微軟 AI CEO Mustafa Suleyman 公開稱互聯(lián)網(wǎng)的公開內(nèi)容可以被免費拿來訓練 AI,如此直白的發(fā)言引起了強勢的輿論反彈。
從硅谷巨頭們在用戶使用條款中的改動可以看出,各家確實都在利用產(chǎn)品優(yōu)勢,將用戶數(shù)據(jù)用于 AI 訓練之中。不過,具體哪些數(shù)據(jù)會拿來訓練,哪些不能,行業(yè)內(nèi)仍未達成一個共識——一項技術出現(xiàn)的早期,肯定會出現(xiàn)這種規(guī)則缺乏的「狂野西部」的階段。
而上述被動作手腳的使用條款,無疑是巨頭們?yōu)橹竺庳熖崆罢嫉目?。不出意外的話,國?nèi)一種大廠和 AI 公司,應該也已經(jīng)在用戶條款中修改、添加了 AI 訓練的內(nèi)容。
對于普通用戶而言,對于長達數(shù)十頁的用戶使用條款,99% 都會直接無視。但是,如果這個產(chǎn)品,能通過有限的數(shù)據(jù)復制出一個「你」的時候,用戶是不是該更謹慎一些?
*頭圖來源:視覺中國
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系極客君微信 geekparkGO
極客一問
你能接受
你的數(shù)據(jù)被用于 AI 訓練嗎?
中國小女孩向馬斯克報特斯拉BUG,馬斯克回復:Sure。
點贊關注極客公園視頻號,
發(fā)表評論