數(shù)據(jù)孤島下的 AI 向善與聯(lián)邦遷移學習
有了這樣一種聯(lián)盟,那可以應用到什么領域呢?將聯(lián)邦學習應該到推薦系統(tǒng)是目前做的比較多的。我們每個人的手機上都有很多短視頻推薦系統(tǒng)以及新聞推薦系統(tǒng),個性化的推薦使得千人千面,我們每天或多或少都會使用,而我們每個人的點擊數(shù)據(jù)都是記錄在手機上的,這個數(shù)據(jù)是非常隱私的。傳統(tǒng)的做法是把數(shù)據(jù)移到云端,在云端進行模型化,再把模型遷移到本地來。
而有了聯(lián)邦學習,可以讓數(shù)據(jù)不出本地,同時可以讓模型個性化。本地的推薦系統(tǒng)可以作為一個單獨的任務,而任務相當于對本地的一種任務分解。這種分解分為兩部分知識,一種是大家共有的知識,另一種是自己特有的本地的特征向量。如果把大家共有的向量一起做一個模型,這模型就非常的強大,同時可以既更新模型,又能夠起到在本地進行個性化服務的效果,數(shù)據(jù)也不出本地。這種聯(lián)邦的推薦架構就把數(shù)據(jù)給隔開了。
在金融領域,銀行著重于風險控制,但是缺乏系統(tǒng)性的風險控制技術,這取決于大數(shù)據(jù)的存在。大家比較誰的風險控制更好,比誰的數(shù)據(jù)樣本多,誰的數(shù)據(jù)種類多。而利用聯(lián)邦學習,可以把銀行、金融持牌公司、第三方公司的數(shù)據(jù)聚合在一起,獲得更多特征,取得更好的模型效果。
特別要講的是醫(yī)學,雖然醫(yī)學是機器學習很好的應用領域,但是我們發(fā)現(xiàn)醫(yī)學里的數(shù)據(jù)非常珍貴,非常少的,其中一個原因是用戶數(shù)據(jù)都是具有高度用戶隱私的,因此醫(yī)院和研究機構不愿意共享這些數(shù)據(jù),所以每一個地方數(shù)據(jù)很少以至于不足以建模。那如果在醫(yī)院之間進行橫向聯(lián)邦縱向聯(lián)邦,無形中把數(shù)據(jù)總量和特征也增大了。
最近和騰訊實驗室合作,在不同地區(qū)的本地醫(yī)院用聯(lián)邦學習把腦卒中發(fā)病的病人特征做一個預測模型,根據(jù)病人的表現(xiàn)預測他得該病的概率有多高,最終準確率提高了 80% 以上,尤其在數(shù)據(jù)很少的小型醫(yī)院,準確率甚至能提升 20% 以上。
我們還建立了國際產(chǎn)業(yè)聯(lián)盟,有很多不同行業(yè)的公司和機構參與,我們希望能進行人才培養(yǎng),并且對政府進行政策的建議,以及評估咨詢等。最后,再總結(jié)一下,聯(lián)邦學習是眾多人工智能和社會相結(jié)合的一個,也不是唯一的一個,我希望以后的人工智能不僅僅關心算法,而且要關心 AI 向善的問題,也就是 AI 要用在人類社會,那么用戶的隱私和數(shù)據(jù)的安全也要被考慮進來。不僅要建立算法,還得建立算法的合作機制和生態(tài)。
學術頭條原創(chuàng)文章。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月8日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機器人及智能工廠展
-
7月31日免費預約>> OFweek 2025具身智能機器人產(chǎn)業(yè)技術創(chuàng)新應用論壇
-
免費參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題