科技行者借助區塊鏈,Salesforce希望阻止有偏見的機器人破壞價值1萬億美元的機會

借助區塊鏈,Salesforce希望阻止有偏見的機器人破壞價值1萬億美元的機會

借助區塊鏈,Salesforce希望阻止有偏見的機器人破壞價值1萬億美元的機會

借助區塊鏈,Salesforce希望阻止有偏見的機器人破壞價值1萬億美元的機會

2019年6月26日 科技行者
  • 分享文章到微信

    掃一掃
    分享文章到微信

  • 關注官方公眾號-科技行者

    掃一掃
    關注官方公眾號
    科技行者

2015年6月,谷歌照片的面部識別軟件將一位黑人計算機開發人員的照片標記為“大猩猩”。問題很難解決,據Wired報道,截止到2018年1月,谷歌的應對方法都非常簡單——干脆不將任何東西識別為大猩猩、黑猩猩或者猴子。

來源:科技行者 2019年6月26日

關鍵字:人工智能 區塊鏈

2015年6月,谷歌照片的面部識別軟件將一位黑人計算機開發人員的照片標記為“大猩猩”。類似的問題很難解決,據Wired報道,截止到2018年1月,谷歌的應對方法都非常簡單——干脆不將任何東西識別為大猩猩、黑猩猩或者猴子。

接下來的一年里,美國公民自由聯盟(American Civil Liberties Union)和16家其他機構抗議將數據用于創建“預測性警務”算法——這些算法旨在預測犯罪可能發生的地方,他們認為這些數據“極度有限并且帶有偏見”,這種做法無法降低犯罪率,而且會讓原本已經受到警察高度重視的社區得到更多的關注。

然后,就在去年,據報道,亞馬遜關閉了一項為期數年的項目,該項目旨在讓人工智能算法對數百份簡歷進行分類,以方便招聘工作,但是被發現用于訓練算法的數據對女性求職者存在偏見。

人工智能背后的算法帶有偏見的原因有很多。但是最常見的解釋是,用于訓練這些算法的數據本身就是帶有偏見的——“進去的是垃圾,出來的也是垃圾”。由于數據來源于非常廣泛的、不斷變化的數據源,算法從中學到的“東西”可能很難進行逆向工程,這讓理解人工智能為什么會變得帶有偏見變成了一件幾乎不可能的任務。

Salesforce的區塊鏈主管Adam Caplan認為,使用類似于跟蹤比特幣交易的共享分布式分類賬,或者區塊鏈技術對混亂的數據進行構建并跟蹤是一種可能的解決方案。在第五屆區塊鏈年度峰會(Blockchain Summit)上,Caplan介紹了這家消費者資源管理(CRM)巨頭是如何利用區塊鏈跟蹤偏見數據的來源。此次峰會旨在激發有益于社會的跨學科項目,由福布斯區塊鏈50強的成員Bitfury主持。

Caplan上個月領導了Salesforce Blockchain的發布,他表示:“在這些算法如何制作以及有哪些因素會影響它們方面,區塊鏈可能非常強大。如果人工智能存在偏見,區塊鏈能夠幫助我們理解偏見是如何產生的。”如果新的項目能夠成功,Salesforce相信它可以幫助解鎖超過1萬億的人工智能收入。Caplan表示,Salesforce對利用區塊鏈跟蹤數據的研究是由公司內部的人工智能團隊在管理。

盡管Salesforce現在并沒有透露太多關于該項目的信息,但是Caplan表示,這項研究最終可被用于在各種算法中識別偏見數據的來源,包括越來越多的聊天機器人和類似虛擬名人Lil Michaela之類的人工智能化身,Lil Michaela在Instagram上有160萬的粉絲。

隨著亞馬遜的Alexa和Apple的Siri等更先進的個人助理的崛起,Salesforce委托完成的一份2017年研究報告預測到2021年將產生1.1萬億美元的新收入和80萬個新的工作崗位。僅Salesforce客戶就將占到這些收入中的2930億美元并創造155,000個新的工作崗位。也就是說,這些估算是建立在算法不會行為不端的假設之上。

雖然Caplan認為算法中的大多數偏見都是無意的,但他表示,Salesforce正在積極尋找方法,讓該公司的客戶可以防患于未然,在數據集帶來問題之前,對數據進行深入挖掘。Caplan表示:“當然,我們正在考慮多樣性、包容性和偏見,以及我們如何才能確保企業在做正確的事情,并保持透明度。”

為了介紹那些企業可能最先會從這項研究中受益,Caplan上個月推出了Salesforce Blockchain,這個項目使用Hyperledger Sawtooth,幫助企業和教育機構更容易建立小組,通過使用共享分布式分類賬,減少不必要的中間人環節,幫助他們節省金錢或者時間。在發布時,Salesforce宣布已經有四家客戶在使用該區塊鏈平臺,包括金融信息巨頭S&P Global和亞利桑那州立大學。

大多數算法都是在內部開發的,因此可以使用現有的集中式代碼庫(如GitHub)進行跟蹤,這些代碼庫允許開發人員在確認錯誤修復和修改之前查看彼此的代碼。但是,另一位區塊鏈峰會參與者David Treat——埃森哲的區塊鏈業務聯合負責人表示,未來,人工智能可能會被要求根據私有的數據做出決策,各種互相競爭的組織之間不太可能共享數據,而是互相隔離。

在同一個小組對話環節中,Treat表示,編寫算法來回答復雜問題的公司歷來不愿意與競爭對手分享數據——無論他們自己可能獲得什么收益——因為他們擔心可能會意外地幫助競爭對手。但這種情況限制了另一種可能消除算法偏見的途徑:來自更為多樣化來源的、更多的數據傾向于抵消算法在訓練中意外習得的偏見。

為此,埃森哲也在探索區塊鏈技術。這家咨詢公司正在開發一種所謂的同形加密的、修正版本的區塊鏈技術,允許數據科學家對加密數據進行操作,而無需解密數據本身。目前,埃森哲正在為共享區塊鏈會計系統或另一個類似的分布式分類賬系統的合作公司定制所謂的共享同形加密(SHE)的技術。

算法可以利用競爭公司提供的數據中學習,而無需知道數據是什么,并能夠精確確定偏見是何時被引入的。

Treat表示:“如果我想開發一種實際的人工智能算法,我希望它能夠使用跨組織的數據集,并給我們一個很好的答案。同時,我還希望知道數據從哪里來,被如何使用,如果你希望能夠在使用中保持公平和負責任,這是非常重要的。”


    最新文章
    熱門標簽
    北京快乐8