大數據真的“公正無(wú)私”嗎?
stark 2016.05.10 17:44 大數據概念股

在信息化時(shí)代,憑借著(zhù)對強大預測技術(shù)的使用,大數據業(yè)務(wù)正逐漸成為越來(lái)越多機構轉型過(guò)程中的核心資產(chǎn),但大數據的流行也令依托其而生的決策機制成為了研究人員們關(guān)注的重點(diǎn)。基于大數據所做的決策真能做到絕對的“公正無(wú)私”嗎?在專(zhuān)注研究大數據對公共生活以及社會(huì )產(chǎn)生影響的一些研究人員看來(lái),這個(gè)問(wèn)題的答案似乎并不是肯定的。
據美國CNBC網(wǎng)站5月9日報道,日前,紐約大學(xué)就組織了一場(chǎng)這方面的研究活動(dòng),該活動(dòng)關(guān)注的重點(diǎn)包括大數據在機器學(xué)習過(guò)程中的運用,以及數據挖掘技術(shù)在幫助公眾以及私營(yíng)企業(yè)管理者進(jìn)行決策的過(guò)程中引發(fā)的問(wèn)題等。
報道稱(chēng),參與該研究活動(dòng)的專(zhuān)家包括政策研究者、技術(shù)員以及新聞?dòng)浾叩鹊取_@些人集中探討了大數據在幫助人們依托事實(shí)做出決策的同時(shí),是如何“無(wú)心地”設定了具有偏見(jiàn)性、歧視性的規則,從而催生相對應的篩選過(guò)程的。
在這一場(chǎng)景中,所謂的規則其實(shí)也就是通常我們所說(shuō)的“算法”,即為了實(shí)現某一特定目標而催生的一系列在程序代碼設定下運作的數學(xué)計算。批評人士認為,許多的算法其實(shí)都蘊含著(zhù)偏見(jiàn),并在不斷強化其內置的假設。
目前政府機構已經(jīng)開(kāi)始審查因大數據的應用而催生的一些道德問(wèn)題。上周,美國白宮發(fā)布的一份報告就認為,如果運用不得當,一些數據的收集極有可能潛在地引發(fā)對公民權利的侵犯,該報告呼吁應盡快建立對話(huà)機制,以確定如何在將對發(fā)揮技術(shù)潛力的同時(shí),盡可能地縮小侵犯公民隱私、引發(fā)不公正待遇等方面的風(fēng)險。
本次研究活動(dòng)參與者之一、同時(shí)現任普林斯頓大學(xué)信息技術(shù)政策研究中心(the Center for Information Technology Policy at Princeton University)研究員的梭倫·巴羅卡(Solon Barocas)在2014年發(fā)表的名為《大數據的差異性影響》的報告中就指出,“推崇數據挖掘等依賴(lài)算法的技術(shù)的人們認為,這類(lèi)的決策過(guò)程完全摒棄了人類(lèi)偏見(jiàn),但事實(shí)上,算法到底有多準確,完全要看數據本身。”
巴羅卡研究的正是機器學(xué)習等領(lǐng)域在實(shí)際應用中產(chǎn)生的影響,以及其可能引發(fā)的道德以及認知問(wèn)題。他還強調,數據的挖掘很有可能受到上一次決策過(guò)程的影響,或者反映一些社會(huì )廣義范圍內存在的偏見(jiàn)。
換句話(huà)來(lái)說(shuō),巴羅卡認為,機器學(xué)習的系統,就是在運用人類(lèi)所設計的算法計算人類(lèi)所制造的數據,因此,每一個(gè)數據中都有可能蘊含著(zhù)這份數據制造者所懷有的一些潛在偏見(jiàn)。
在因大數據而生的“歧視”中,最經(jīng)常被引用的一個(gè)案例來(lái)自于哈佛大學(xué)數據隱私實(shí)驗室(Data Privacy Lab at Harvard University)負責人拉坦婭·斯威尼(Latanya Sweeny)所進(jìn)行的一項研究,該案例引用了在互聯(lián)網(wǎng)上搜索一些特定姓名時(shí),包括谷歌等渠道所反饋給搜索人的結果。斯威尼發(fā)現,比較生僻、容易和黑人聯(lián)系在一起的名字,搜索后顯示結果中包含的逮捕記錄數量,要明顯高于用白種人常見(jiàn)名搜索所得。谷歌隨后修正了這一問(wèn)題,但他們究竟是如何做到的,這一點(diǎn)從來(lái)沒(méi)有對外公開(kāi)過(guò)。
大數據的廣泛應用,在過(guò)去幾年里還引發(fā)了其他一些對于該技術(shù)使用不當以及具備偏見(jiàn)性的指控,這些指控來(lái)自于方方面面。這其中也包括執法部門(mén)使用的犯罪預測技術(shù)等等。很顯然,在一些人眼中,運用大數據技術(shù)給人們帶來(lái)的便利,需要和使用該項技術(shù)解決社會(huì )問(wèn)題時(shí)可能引發(fā)的風(fēng)險放在一起均衡地考慮。
但大數據技術(shù)的推崇者們認為,問(wèn)題其實(shí)并不在于“大數據歧視”,只是因為數據專(zhuān)家們誤讀了數據挖掘和統計學(xué)習所得的結果。他們認為,大數據帶來(lái)的福利,要遠比它所引發(fā)的擔憂(yōu)重要。
“在我學(xué)術(shù)研究以及從事咨詢(xún)的生涯中,我已經(jīng)見(jiàn)證了無(wú)數個(gè)運用大數據進(jìn)行決策、分析,給企業(yè)、機構以及消費者帶來(lái)便利的案例,”紐約大學(xué)斯特恩商學(xué)院商業(yè)分析中心(Center for Business Analytics at New York University‘s Stern School of Business)主任德亞·高斯(Anindya Ghose)表示,“說(shuō)句實(shí)話(huà),我不太能理解那些大數據技術(shù)的批評者們兜售的數據分析應用有多’恐怖的觀(guān)點(diǎn)。”
“對那些批評者,以及對我們心存警惕的人們,我要說(shuō)一句,處理好你的情緒,大數據分析將常青不朽,”高斯說(shuō)。
大數據概念股:東方國信、易華錄、拓爾思、銀之杰、東方網(wǎng)力、天璣科技、科華恒盛、宜通世紀、榮之聯(lián)、紫光股份、海蘭信、創(chuàng )意信息。
大數據概念股
那么問(wèn)題來(lái)了:最值得配置的大數據概念股是哪只?即刻申請進(jìn)入國內首個(gè)免費的非公開(kāi)主題投資交流社區概念股論壇參與討論!
申明:本文為作者投稿或轉載,在概念股網(wǎng) http://m.qdjiwuji.com/ 上發(fā)表,為其獨立觀(guān)點(diǎn)。不代表本網(wǎng)立場(chǎng),不代表本網(wǎng)贊同其觀(guān)點(diǎn),亦不對其真實(shí)性負責,投資決策請建立在獨立思考之上。