硅谷崇尚快速試錯的文化,但這可能不是我們想要的對待個人信息的方式。硅谷崇尚快速試錯的文化,但這可能不是我們想要的對待個人信息的方式。
導語:美國科學雜志nautil.us《鸚鵡螺》作者ChristinaLeuker&WouterVanDenBos近日發(fā)表了針對人工智能時代下如何保護人類的“不知情權”的深度報道。人工智能的出現(xiàn)能以無法預知的方式改變了現(xiàn)實生活中需要在選擇知道和不知道的平衡,同時讓我們在決定什么時候保持不知情的問題上變得復雜,研究故意不知情的心理將有助于設計適用于人工智能的不知情權法律,不過,這一嚴謹?shù)目茖W研究話題長期以來一直被忽略。
以下為文章全文:
柏林墻倒塌后,東德公民終于有機會閱讀到斯塔西(Stasi,東德的國家安全機構,被認為是當時世界上最有效率的情報和秘密警察機構之一)保存的關于他們的資料。然而迄今為止,只有大約10%的人真的去查閱了這些資料。
2007年,脫氧核糖核酸(DNA)結構的發(fā)現(xiàn)者之一詹姆斯·沃森(JamesWatson)表示,他并不想知道自己的載脂蛋白E(ApoE)基因信息。該等位基因被認為是阿爾茨海默癥的風險因子。
民意調查顯示,如果有選擇的話,大多數(shù)人寧愿不知道自己的死亡日期——甚至是快樂事件的發(fā)生日期也不想知道。
以上這些都是故意選擇不知道的例子。蘇格拉底可能會提出,未經(jīng)審視的生活不值得過;而霍布斯則會爭論稱,好奇心是人類最主要的激情;但還有許多古老的故事向我們描述了知道太多也會帶來危險。從亞當、夏娃和智慧樹,到盜取取火秘密的普羅米修斯,這些故事告訴我們,現(xiàn)實生活中需要在選擇知道和不知道之間達成微妙的平衡。
然而,如果出現(xiàn)一種技術,能以無法預知的方式改變這種平衡,同時讓我們在決定什么時候保持不知情的問題上變得復雜的話,又會帶來什么后果?這種技術其實已經(jīng)出現(xiàn)了,那就是人工智能。
人工智能可以利用相對較少的數(shù)據(jù)來找到模式并做出推論。例如,只需要幾個Facebook上的點贊就可以預測出你的個性、種族和性別。還有一種計算機算法聲稱,只需根據(jù)人們的照片,就能以81%的準確率區(qū)分同性戀和異性戀男性,而區(qū)分同性戀和異性戀女性的準確率為71%。另一種名為“替代性制裁的懲罰性罪犯管理分析”(CorrectionalOffenderManagementProfilingforAlternativeSanctions,COMPAS)的算法則可以通過青少年被捕記錄、家庭犯罪記錄、教育、社會隔離和休閑活動等數(shù)據(jù),來預測犯罪者再犯的可能性,準確率達到65%。
在這些例子中,結論和所用的數(shù)據(jù)可能在本質上存在著驚人的偏差(即使某些結果的有效性仍在爭論中)。這使得控制我們所知道的內容十分困難,而且也沒有什么法規(guī)來幫助我們保持不知道的狀態(tài):不存在受保護的“不知情權”。
于是,這就創(chuàng)造了一種氛圍,用Facebook的早期座右銘來說,我們很容易“快速行動,破除陳規(guī)”(movefastandbreakthings)。但是,當涉及到我們私人生活的細節(jié)時,“破除陳規(guī)”是否就是我們想要的呢?
幾十年來,政府和立法者都知道“潘多拉的盒子”有時候最好還是不要打開。至少在20世紀90年代,保護個人不知情權利的法律就已經(jīng)出臺。例如,1997年的“歐洲人權和生物醫(yī)學公約”(EuropeanConventiononHumanRightsandBiomedicine)規(guī)定:“每個人都有權了解其被收集的有關健康狀況的任何信息。但是,應當遵從個人不希望被告知的意愿。”類似的,1995年世界醫(yī)學協(xié)會的“患者權利宣言”(RightsofthePatient)中指出:“患者有權利明確要求不被告知(醫(yī)療數(shù)據(jù)),除非是為了保護其他人的生命。”
然而,為人工智能制定“不知情權”法規(guī)是完全不同的問題。雖然醫(yī)療數(shù)據(jù)受到嚴格管制,但人工智能所使用的數(shù)據(jù)往往掌握在名聲不佳的盈利性科技公司手中。人工智能處理的數(shù)據(jù)類型也更廣泛,因此任何相應的法律都需要對什么是“不知情權”有更深入的理解。研究故意不知情的心理將有助于設計適用于人工智能的不知情權法律。不過,令人驚訝的是,這一嚴謹?shù)目茖W研究話題長期以來一直被忽略,或許是因為某種隱含的假設,即故意忽略信息是不理性的。
心理學家拉爾夫·赫特維格(RalphHertwig)和法律學者克里斯托弗·恩格爾(ChristophEngel)近期發(fā)表了一篇文章,對故意選擇不知情的動機進行了細致分類。在他們識別出的動機中,有兩組尤其與面對人工智能時對不知情的需求密切相關。
第一組動機圍繞公正和公平展開。簡而言之,知識有時會破壞判斷力,而我們往往選擇以故意不知情作為回應。例如,學術論文的同行評議通常是匿名的。大多數(shù)國家的保險公司在登記之前不得獲取有關客戶健康狀況的細節(jié);他們只能知道一般的健康風險因素。這種考慮尤其與人工智能關系密切,因為人工智能可以產(chǎn)生極具偏見的信息。
第二組相關的動機是情緒調節(jié)和避免遺憾。赫特維格和恩格爾寫道,刻意的不知情可以幫助人們維持“珍視的信仰”,并避免“精神不適、恐懼和認知失調”。故意不知情其實非常盛行。調查中大約90%的德國人希望避免可能由于“預知諸如死亡和離婚等負面事件”而產(chǎn)生的負面情緒,40%到70%的人也不想知道正面事件,以幫助保持“對驚喜和懸念的積極感受”,比如不知道未出生孩子的性別。
這兩組動機能幫助我們理解在人工智能面前保護不知情權的必要性。舉例來說,人工智能“同志雷達”(gaydar)算法的潛在收益似乎接近于零,但是在公正性和公平性方面的潛在成本卻很高。正如《經(jīng)濟學人》(TheEconomist)所說的那樣,“在世界上同性戀社交不被接受或被認為非法的部分地區(qū),這樣的算法可能對安全構成嚴重威脅。”同樣的,NtechLab目前正在開發(fā)的種族識別人工智能系統(tǒng)所能帶來的潛在收益,與其對公正性和公平性的負面影響相比顯得蒼白許多。COMPAS累犯預測軟件具有比人類更高的準確性,但正如Dressel和Farid所寫,這“并不像我們想要的那種準確,尤其是從未來還懸而未決的被告者的角度來看”。預測個人預期壽命的算法,比如AspireHealth正在開發(fā)的算法,并不一定會讓人們的情緒調節(jié)變得更容易。
這些例子說明了識別個體不知情動機的影響,并且展示了知識和無知的問題可以有多復雜,特別是在涉及人工智能的時候。關于集體不知情在什么時候有益處,或者在道德上合理的問題,沒有現(xiàn)成的答案。理想的做法是單獨考慮每個案例,進行風險收益分析。理想情況下,鑒于爭論的復雜性和后果的重要性,這一分析將公開進行,考慮各種利益相關者和專家意見,并考慮所有可能的未來結果,包括最壞的情況。
這其中涉及的問題太多了……事實上,理想做法在大多數(shù)情況下都是行不通的。那么,我們又該如何做呢?
一種方法是控制和限制機器根據(jù)已采集數(shù)據(jù)進行的推理。例如,我們可以“禁止”使用種族作為預測變量的司法算法,或者從潛在求職者的預測分析中排除性別。但是,這種方法也存在問題。
首先,限制大公司使用信息的成本太高,技術難度也很大。這需要這些公司將算法開源,同時要求大型政府機構不斷對其審查。另一方面,一旦采集到大量的數(shù)據(jù)集,總是會有很多迂回的方法來推理出“禁止的知識”。假設政府宣布使用性別信息來預測學術成功是非法的,那就可能出現(xiàn)使用“擁有汽車類型”和“最喜歡的音樂流派”作為性別替代指標,直接進行替代指標的二級推理。有時候,盡管一家公司的意圖是好的,但有關性別的推理也可能意外地嵌入到算法中。這些二級推理導致對算法的審查更加困難。一個分析中包含的變量越多,發(fā)生二級推理的可能性就越大。
麻省理工學院的研究者在網(wǎng)站(moralmachine.mit.edu)上根據(jù)人們自己選擇的數(shù)據(jù)類型,測試他們在機器即將做出決定的情況下表現(xiàn)出的道德直覺。麻省理工學院的研究者在網(wǎng)站(moralmachine.mit.edu)上根據(jù)人們自己選擇的數(shù)據(jù)類型,測試他們在機器即將做出決定的情況下表現(xiàn)出的道德直覺。
保護不知情權權更激進——也可能更有效——的方法是第一時間防止數(shù)據(jù)被收集。2017年,德國做出了一項開創(chuàng)性的舉措,立法禁止自動駕駛汽車通過種族、年齡和性別來識別道路上的人。這意味著汽車將無法通過這些類別的數(shù)據(jù)來做出駕駛決策,尤其是在事故不可避免時需要做出的決策。
基于相同的思維方式,歐盟推出了新的《通用數(shù)據(jù)保護條例》(GeneralDataProtectionRegulation,GDPR),并于2018年5月生效。該條例規(guī)定,只允許公司在提供明確的指定服務時,收集和存儲必需的最少量數(shù)據(jù),并且獲得客戶對其數(shù)據(jù)使用方式的同意。這種對數(shù)據(jù)獲取的限制可能也會阻止二級推理。但《通用數(shù)據(jù)保護條例》的一個重要局限是,公司可以為自己設定非常寬泛的目標。例如,如今已經(jīng)關門的劍橋分析(CambridgeAnalytica)公司的明確目標是評估用戶的個性,因此在技術上,它對Facebook數(shù)據(jù)的收集符合《通用數(shù)據(jù)保護條例》的規(guī)定。同樣的,只要用戶同意——許多人即使在獎勵相當微薄的情況下也會同意分享自己的數(shù)據(jù)——《通用數(shù)據(jù)保護條例》對數(shù)據(jù)和給定服務之間一致性的關注就無法排除道德上有問題的數(shù)據(jù)類別,也不能完全阻止公司從數(shù)據(jù)中介那里購買被排除的數(shù)據(jù)。研究人員發(fā)現(xiàn),麻省理工學院的一些學生會分享他們朋友的聯(lián)系數(shù)據(jù),只為了獲得一小片披薩。顯然,我們還需要更多的限制手段,但究竟需要多少呢?
美國程序員、自由軟件活動家理查德·斯托曼(RichardStallman)說:“利用數(shù)據(jù)來害人的方法太多了,以至于唯一安全的數(shù)據(jù)庫就是從未被收集過的數(shù)據(jù)庫。”然而,如果對數(shù)據(jù)采集的限制過于嚴厲,又可能會阻礙人工智能的發(fā)展,并減少我們從中獲得的收益。
誰應該權衡其中的利弊?首先應該是我們自己。
在大多數(shù)情況下,我們談論的其實是你我作為個人所擁有的數(shù)據(jù)。我們一直都很粗心大意,將這些數(shù)據(jù)拱手讓給各種閃亮的app,絲毫不考慮后果。事實上,我們一直在放棄我們的數(shù)據(jù),以至于忘記了一開始它就是屬于我們的。收回數(shù)據(jù)將使我們每個人都能決定哪些事情想知道,哪些不想知道。讓數(shù)據(jù)回到合適的人——也就是我們自己——手中,就可以巧妙地解決我們討論的許多艱巨問題。我們不再需要制定通用的預見性指導規(guī)范,相反的,數(shù)以百萬計的個體將根據(jù)自己的是非觀來決定自身數(shù)據(jù)的用途。我們可以對公司如何使用數(shù)據(jù)做出實時反應,根據(jù)他們對待數(shù)據(jù)的方式來進行懲罰或獎勵。
關于把數(shù)據(jù)放回人們手中,計算機科學哲學家杰倫·拉尼爾(JaronLanier)提出了一個經(jīng)濟學上的論據(jù)。他指出,通過將我們自己的個人數(shù)據(jù)賣給大公司,我們應該都能從中受益。這種方法存在著兩個問題。首先,它混淆了數(shù)據(jù)使用和所有權的道德規(guī)范。在回答數(shù)據(jù)應該如何被使用的問題時,免費提供數(shù)據(jù)的意愿在道德完整性上是很好的試金石。一個小眾群體中有多少人會愿意免費提供數(shù)據(jù),以創(chuàng)建一個像“同志雷達”這樣的面部識別應用程序?又有多少人會愿意為此付費?另一方面,大多數(shù)人會很樂意貢獻他們的數(shù)據(jù)來尋找治療癌癥的方法。第二個問題是,賦予個人數(shù)據(jù)(較高的)經(jīng)濟價值可能會迫使人們分享他們的數(shù)據(jù),并使數(shù)據(jù)隱私成為富人的特權。
這并不是說個人的單獨行動就足夠了,社會機構的集體行動也是必需的。即使只有小部分人口分享他們的敏感數(shù)據(jù),其結果也可能具有大多數(shù)人反對的高預測準確性。并不是所有人都明白這一點。為了防止不必要的后果,我們需要更多的法律和公共討論。
《經(jīng)濟學人》曾寫道,世界上最寶貴的資源不再是石油,而是數(shù)據(jù)。然而,數(shù)據(jù)與石油有著很大不同。數(shù)據(jù)是無限的資源,由個人所有,并且通常是在沒有交易價值的情況下進行交換。從石油中獲利便殺死了石油市場。作為第一步,從數(shù)據(jù)中獲取利潤將為我們提供空間,用于創(chuàng)造和維持能在人工智能到來之后延續(xù)的道德標準,并為管理集體的不知情權鋪平道路。換句話說,在數(shù)據(jù)成為現(xiàn)代世界最有用的商品之一的同時,它也需要成為最便宜的商品之一。(任天)
(責任編輯:蘇玉梅)