數據倫理視角下的數據隱私與數據管理
來源:《新聞愛好者》2019年第8期
【摘要】隨著大數據進入大眾的視野,數據倫理也逐漸成為人們所關注的焦點。數據倫理應是從數據視角對人的各種行為所進行的倫理關注。在數據倫理的范疇中,隱私為數據倫理研究的核心,而數據管理則構成數據倫理的內容。由此出發,“權利”與“權力”的重構應成為思考或者解決數據倫理問題的路徑。具體體現為以下三點。一、網絡平台與網絡用戶關於數據的新契約思路﹔二、網絡平台數據管理的正確價值觀引導﹔三、數據管理要進行嚴格的倫理風險評估。
【關鍵詞】數據隱私﹔數據管理﹔隱私審慎
“大數據”廣泛應用於各行各業,關於“數據”的探討范圍越發寬廣。目前在互聯網和大數據深度發展的基礎上,人工智能的快速發展催發著傳播智能時代的到來,由此“數據”問題被進一步強化,其所具有的意義亦由技術層面而延展至市場、社會層面。在智能傳播時代,數據與網民個人的隱私之間有著勾連,也因此使數據倫理問題日漸凸顯。
一、數據隱私與數據管理:數據倫理范疇的核心與內容
“數據”首先是一個科學的概念,是指“能夠被數字化傳遞或處理的數字形式信息”[1],是對於已經發生的行為或者事件的客觀記錄與呈現。數據與信息之間存在著密切的關聯,客觀的數據中包含的是人或物的信息。因此“數據代表了物或人所具備的特征”[2]。從社會視角來看,這些特征都是基於人而產生的。隨著互聯網的普及化,網民的各種網絡行為構成了大數據。所以,數據倫理應是從數據視角對人的各種行為所進行的倫理關注。在倫理學中,正當與善是兩大主題。在數據倫理的范疇中,這兩大主題聚焦為數據隱私與數據管理。其中,隱私為數據倫理研究的核心,而數據管理則構成數據倫理的內容。
(一)數據倫理研究的現實驅動
數據科學屬於信息科學的范疇。所以,關於數據倫理的關注還應回溯到信息倫理學的范疇之中。信息倫理學是伴隨著信息技術的發展而逐漸形成的研究領域。信息倫理學的興起與控制論的創始人諾伯特·維納分不開。20世紀中葉,信息技術的發展使得人們開始了關於人工智能的設想與實踐。維納具有預見性地認為,讓機器像人一樣思考並非不可實現,但是一旦人出現問題,那麼人工智能體將會對人類社會帶來不可控制的災難。從倫理的角度,維納稱信息技術發展的責任為“偉大的正義原則”,后來的學者則將這種責任原則具體化為“自由”“平等”“仁愛”等道德規范。此后,隨著信息科學的發展,肇始於維納的信息倫理思想的研究元素與研究框架逐漸清晰和完善。美國學者詹姆斯·摩爾強調指出,新興信息技術的發展需要有更好的技術倫理規范,進而他提出了摩爾定律:“伴隨著技術革命,社會影響增大,倫理問題也增加了。”[3]信息科學在當下表現為互聯網、大數據及正在興盛的人工智能等技術的迭代發展,信息倫理學關注的內容正是這些技術在與社會相互作用的過程中不時凸顯的道德規范及其困境問題。計算機倫理、網絡用戶的在線信息、互聯網與信任、信息技術與個人數據等不斷充實和豐富著信息倫理學的內容。
作為信息科學的一隅,數據科學在當下發展迅猛,並且以“大數據”的形式凌空飛入了大眾的視野。當下的數據不僅僅只是科學家們研究的內容,也成為社會個體關注自身權益的載體。
目前的“大數據”在很大程度上積累於網民們的網絡行為。數據是人們網絡行走所留下的網絡痕跡。網民們的網絡行為包括各種網絡訪問、搜索、社交等,人們的網絡行為留下的網絡痕跡,被服務器存儲下來就成了數據。其本質是指相對於所調查的對象而具有的全樣本數據的特點。但無論是就這個概念產生的技術背景,還是目前大數據處理的技術特征,人們更多地將大數據指向互聯網的使用所形成的數據。因此在一定意義上,“大數據”等同於“網絡數據”。網絡行為的產生需要一定的條件,在網絡痕跡中包含著大量的個人信息,隨著智能時代的到來,將會有更多的個人信息通過各種方式進入到數據世界中,在積澱著數據科學研究基礎的同時,也將使數據的應用及其結果面臨著巨大的數據倫理風險。在具體的數據隱私以及數據管理中,數據倫理風險的主體則具體化為網絡用戶與網絡平台。
(二)個人信息與隱私審慎
隱私來自於個體對自身信息的管理,因此信息也就成為從數據到隱私的一個關鍵的中介。對於網絡平台而言,網絡用戶的行為首先是以數據的形式存在的,進而根據一定的利益需求而對其中的信息進行分析,關於隱私的倫理問題繼而產生。
“現代哲學的解釋提出這個假設:隱私被視為一種權利,一種保護自己不受他人或機構行為侵犯的方法。隱私承載著支配和受限訪問的內涵”。[4]因此,對於“隱私”而言,“支配”與“受限訪問”體現著其本質的主觀性,也就是“隱私”的邊界具有主觀的審慎性。對於不同的個體而言,隱私存在著邊界的模糊性。由於關乎個體的自我信息,所以,無論是從“正當”而言,還是從“善”而言,在具體的數據管理中,都存在著一定的倫理問題。
(三)數據管理與倫理風險
數據管理包括兩個方面的內容,其一是數據的挖掘與存儲,其二是數據的利用。在數據管理中,由於數據來源的特殊性,所以在數據倫理中,隱私成為出現倫理問題的核心。進而,圍繞著個人信息以及隱私的主觀審慎,數據管理成為倫理問題的內容構成。
在這裡,存在的倫理問題是,平台獲取用戶的哪些信息?獲取的手段是怎樣的?這是倫理范疇中的常規問題。用戶和平台之間,存在著一定的信息不對稱。每個網絡平台都有自己的技術邏輯,對於平台背后的支持,很多用戶並不是很清楚,許多用戶是把平台作為一種公共產品進行使用,但是平台方確實非常清楚。這種不對等的情況,對於用戶而言,具有一定意義上的不公平性,換句話說,平台方獲取數據具有一定的不正當性。同時各種智能性設備,可以在人毫不知情的情況下獲取信息,形成數據,其中可能存在隱瞞甚或欺騙。
從倫理的范疇來看,在平台和用戶間存在著數據獲取的不正當性。在資本的驅動下,平台不僅僅只是存儲數據的倉庫,更希望從這些倉庫的內容中能夠為資本帶來市場價值。數據的價值,一方面是直接提取用戶的個人信息,另外是從中洞察出用戶的生活習慣、消費方式等。在這裡,另一個問題浮出水面,即如何使用用戶數據。
二、網絡傳播中的數據類型與數據管理
信息技術的發展促使傳播從形式到內容都在發生變化,而這些變化在一定意義上與數據有關,因此,數據管理就成為智能傳播的基礎。智能化傳播在一定程度上達到了傳播最初的初衷,能夠將傳播內容與受眾群體進行密切關聯,但同時,這也帶來了更大的爭議。因此,從形式上來看,具有導向和溫度的傳播被轉讓給了冰冷的“算法”。所謂算法就是對網絡用戶所積累的數據進行的挖掘、歸類,基於這種定義,“算法”也就是數據管理。
(一)數據類型及其倫理風險
根據網絡使用者網絡痕跡的留存方式及其特點,可以將數據區分為如下類型。
其一,從平台所積聚的數據來源看,可以區分為主動型數據和被動型數據。主動型數據是指用戶主動留下來的數據。比如用戶使用引擎類平台尋找信息、訂閱信息,利用社交平台進行人際交往或狀態表達等。這些網絡行走行為一般源於用戶自主的選擇,對於平台而言,這些數據屬於用戶主動貢獻的數據。但同時,很多平台在存儲用戶主動數據之外,還會附加一些條件,比如要求用戶駐留一些具體的個人信息,比如地理位置、運動數據等。這類數據可以歸類為被動型數據。而從技術的可能性上來講,當用戶使用平台時,一些物理的個人信息已經駐留在平台的大數據存儲器中了。而這些附加條件,在一定意義上是為了規避用戶“知情”的權利規范。這些做法,從形式上來看,仿佛體現了平台的責任和對用戶知情同意的提醒。但實質上依然是技術工具主義的表現。
其二,從數據所反映的用戶特征來看,數據又可分為直接型數據和間接型數據,這是從數據的使用目的角度進行區別的。直接型數據是指直接反映用戶特征的數據。主要是在搜索引擎類平台積聚,這類平台留存的用戶的數據具有消費的直接性,也就是直接用關鍵詞表達用戶的網絡使用需求。間接型數據是指在數據自身並沒有直接反映消費需求,信息傳播者在對相關數據進行分析的基礎之上,對受眾或者網民的需求特征進行研判。這類數據往往產生於社交媒體平台或者信息推薦類引擎之中。通過用戶的人際交往特點、信息獲取偏好,對消費者進行畫像,將其標簽化,進而實現信息的精准推送。
數據是對於網絡使用者網絡行走的記錄,當其成為數據時,也必然伴隨著一定的倫理風險。從數據的來源看,很多數據是在平台使用者不知情或者不情願的條件下被獲取的,同時,技術的發展使智能化獲取用戶的信息更為便捷,如各類攝像頭、無人機或傳感器等,用戶在不知情的情況下,信息已被提取或收集。這種形式使得平台獲取數據的正當性更受質疑。
從用戶特征來看,通過數據對用戶的日常生活進行勾勒和判斷,繼而實現信息的精准推送。而這一點,則是對用戶“不被打擾”的權利的一種侵犯。
由此,對數據類型的分析意在明確網絡用戶與數據的關系。無論是網絡平台還是數據挖掘公司,首先都存在著數據獲取的道德性拷問,也就是獲取數據的手段是否適宜。
(二)信息傳播的“繭房”效應
與獲取數據手段正當性相關的還有一個更為嚴重的倫理問題,這就是信息傳播的“繭房效應”。“信息繭房”是隨著智能化傳播而產生的一種現象。在一般意義的傳播范疇中,它是指人們討論這種現象背后的技術邏輯所導致的用戶信息閱讀的自我封閉和窄化現象。平台往往利用這種“繭房”現象,進而實現其“繭房”效應,也就是根據對用戶的閱讀興趣判斷其生活方式,進而向其推送一定的產品信息。從形式上來看,這確實實現了對消費者的精准洞察和產品信息的精准投放。但是,作為用戶(消費者)而言,是在一個狹窄的信息空間中接受這類信息。這就使網絡平台與網絡用戶存在著一定的信息不對稱問題。進而強化了信息傳播備受詬病的“洗腦”和“控制”問題。
(三)數據管理與倫理風險
互聯網是伴隨著用戶的網絡使用而發展起來的,因此數據的形成邏輯為:個體的網絡用戶由於自身的需求形成網絡行為,進而成為各類網絡平台存儲的客體。也就是說在數據的呈現樣態中,個體用戶貢獻數據,網絡平台積聚數據。隨著算法應用的普遍性及其所體現的智能化傾向,當網絡行為進入算法邏輯時,人們開始意識到許多網絡平台的資本屬性。因為數據作為算法的核心要素,其實就是用戶自身的信息集合。這就涉及了伴隨著互聯網的發展一直存在的一個問題:用戶的個人隱私。人工智能算法時代,使這個問題具有進一步的發展。從數據主體來看,是網絡用戶與網絡平台之間的關系問題﹔從數據的維度來看,就是數據產生、獲取與應用問題。其本質是消費者和資本之間的關系。在這樣的情境中,問題的實質嬗變為資本是如何獲取消費者的信息以及使用的方式和目的的問題。
三、權利與權力的重構:解決數據倫理問題的路徑
(一)網絡平台數據管理的正確價值觀引導
由於基於算法的數據管理的技術屬性,人們更多強調從技術層面討論傳播所存在的倫理問題。但是所有的技術問題最后都會回歸為人的問題。智能技術所呈現的數據倫理的困境並不是無解的,其答案也非常明確。這就是數據管理中的價值觀問題。
陳昌鳳教授認為,作為未來傳播發展的趨勢,智能化的發展也會帶來傳播倫理的困境。這個問題如何解決,陳昌鳳教授認為,智能算法技術的應用,應當具有正確的價值引導。“在進行人工智能價值觀引導方面,可參考西方逆向工程學等學科類方法,打開內部的‘黑匣子’,了解其內部運作機理及價值觀形成的錯誤節點,以進行正確的價值觀引導”。[5]
(二)網絡平台與網絡用戶關於數據的新契約思路
在智能傳播時代,網絡平台與用戶應當形成關於“權利”與“權力”的新契約思路
“隱私”應當是在智能化時代傳播所遭遇的重要倫理問題。就信息傳播而言,客觀地說,“隱私”並不是一個新鮮的話題。在任何技術條件下,都存在著獲取用戶信息手段的適宜性問題。但在當下的技術背景下,由於網絡用戶與網絡平台之間的關系,關於“隱私”的認識也存在著一些新的變化。
毋庸置疑,在互聯網時代,人們對於個人信息的管理也出現了一些新的變化。用戶貢獻數據,平台積聚數據,在互聯網空間已成為常態。關於數據的獲取與使用,在用戶與平台之間,存在著新契約的基礎。新契約應當建立在用戶與平台之間關系的基礎之上。平台能夠為用戶提供用戶認為有價值的內容,在此基礎之上,用戶應當對個人信息的權利進行一定程度的讓渡﹔而平台在為用戶提供真實准確信息的基礎之上,在用戶授權的條件下,基於一定的社會責任而使用用戶的數據。
(三)數據管理要進行嚴格的倫理風險評估
由於數據中存在的個人隱私的不確定性,在數據管理中,應當對數據的獲取和應用過程進行嚴格的倫理評估。如果說在獲取階段的隱患更多涉及的是用戶和平台之間關於“隱私”的邊界的話,與之而來的一個相關的話題便是“打擾性”問題。“隱私”的實質是個人與公共的距離問題,因此導致的問題則是,即使數據獲取的手段是適宜的、正當的,但用戶是否願意接受相關信息,是否願意自己的社交或者閱讀空間受到打擾?這些問題都應當作為網絡平台首要進行的數據倫理考量。
參考文獻:
[1]戴維·赫佐格.數據素養:數據使用者指南[M].沈浩,等,譯.中國人民大學出版社,2018:4.
[2]戴維·赫佐格.數據素養:數據使用者指南[M].沈浩,等,譯.中國人民大學出版社,2018.
[3]尤瑞恩·范登·霍溫,等.信息技術與道德哲學[M].趙迎歡,等,譯.科學出版社,2014:13.
[4]菲利普·帕特森,等.媒介倫理學:問題與案例[M].李青藜,譯.北京:中國人民大學出版社,2006.
[5]陳昌鳳.媒介倫理新挑戰:智能化傳播中的價值觀賦予[J].新聞前哨,2018(12).
(作者為重慶大學新聞與傳播學院碩士生)
分享讓更多人看到
推薦閱讀
相關新聞
- 評論
- 關注