是否有可能,為AI加上安全鎖?
見(jiàn)識(shí)過(guò)刀劍與毒藥
癡迷于火藥和武器
與他人說(shuō)話(huà)時(shí)常懷著恐懼
在每一處景象里看到了災(zāi)禍
每一次時(shí)鐘響起,都會(huì)戰(zhàn)栗不安
但卻未厭惡那不可抗拒的壓迫
——波德萊爾《惡之花》
不能偏廢的用與防,是人類(lèi)在馴服技術(shù)這頭猛獸時(shí)永恒的主題。于是我們有了無(wú)比復(fù)雜的電力保護(hù)系統(tǒng),有了交通規(guī)則與無(wú)數(shù)交通安全設(shè)備,有了宏大的互聯(lián)網(wǎng)安全產(chǎn)業(yè)。
我們不會(huì)因?yàn)殚W電的猙獰與觸電的危險(xiǎn),就決定給城市斷電,而是要去一層層限制它,保護(hù)它,讓技術(shù)安全地為人類(lèi)服務(wù)。
這樣的邏輯,今天正在AI面前重新上演。大概就像人類(lèi)第一次面對(duì)火焰時(shí)的恐慌一樣,一百多年的科幻文化,讓大眾在面對(duì)AI時(shí),首先想起的是機(jī)器人統(tǒng)治地球的恐懼。其實(shí)這事兒就像行星撞地球一樣,是個(gè)確實(shí)可能發(fā)生但誰(shuí)也不知道多久后才能發(fā)生的狀況。
然而隨著AI的發(fā)展與應(yīng)用,這門(mén)新技術(shù)所暴露出來(lái)的危險(xiǎn)與不確定性確實(shí)也漸漸浮出水面。那么針對(duì)AI的“絕緣膠布”和“空氣開(kāi)關(guān)”在哪呢?
不久之前,Deepmind在博客中透露了這樣一個(gè)消息,針對(duì)AI模型可能表現(xiàn)出的混亂和失控,他們準(zhǔn)備研發(fā)一種“AI保險(xiǎn)機(jī)制”,在緊要關(guān)頭給AI“斷電”。一旦發(fā)現(xiàn)AI的惡意傾向,就主動(dòng)終止AI的活動(dòng)。
目前這個(gè)領(lǐng)域的研究,更多還是處在方向性的探索上。但是還是有一些問(wèn)題需要我們來(lái)探索:假如真的有AI保險(xiǎn)電閘這種裝置,它要在哪些情況下終止AI工作?類(lèi)似領(lǐng)域還有哪些方法在嘗試保證AI安全?給AI裝上安全鎖這種想法,又有哪些困難,甚至不靠譜的地方?
要防范的,是哪些“AI之惡”?
首先,還是要堅(jiān)定地給“AI之惡”打上引號(hào)。這就像火的使用,大概是人類(lèi)歷史上造成損失最嚴(yán)重的一種技術(shù)應(yīng)用,但至少今天沒(méi)有人討論“火之惡”或者“普羅米修斯的原罪”。
而AI有點(diǎn)不同的是,深度神經(jīng)網(wǎng)絡(luò)的復(fù)雜性構(gòu)成了AI運(yùn)行邏輯在某些環(huán)境下的不可解,也就是廣受關(guān)注的AI黑箱問(wèn)題。美國(guó)小說(shuō)家霍華德·洛夫克拉夫特堅(jiān)定的認(rèn)為,人類(lèi)最大的恐懼,就是對(duì)未知的恐懼。
而深度學(xué)習(xí)作為今天AI技術(shù)的主要實(shí)踐方式,確實(shí)還蒙有太多面紗。姚期智院士就曾判斷,今天深度學(xué)習(xí)中有很多東西是非科學(xué)的。對(duì)其神秘性的破解,已經(jīng)成為AI學(xué)科的主要問(wèn)題。
那么依舊神秘的AI,在應(yīng)用中帶來(lái)了哪些危險(xiǎn)可能性呢?
關(guān)于AI的負(fù)面報(bào)道雖然遠(yuǎn)低于正面案例數(shù)量,但其實(shí)數(shù)量也已經(jīng)不少。歸結(jié)起來(lái),有三個(gè)方面的危險(xiǎn),是我們今天主要需要面對(duì)的:
一、從數(shù)據(jù)到歧視
AI是能學(xué)會(huì)罵人和種族歧視的,這事兒想必大家都知道。最出名的案例,就是2016年3月,微軟上線(xiàn)了名為T(mén)ay 的聊天機(jī)器人,但是上線(xiàn)不到一天,Tay 就從一個(gè)單純可愛(ài)的19歲女孩變成了一個(gè)滿(mǎn)口臟話(huà)與種族歧視言論的“AI瘋子”,于是微軟緊急下架了這款產(chǎn)品。這種情況,已經(jīng)在多個(gè)AI聊天應(yīng)用與語(yǔ)音助手中顯現(xiàn)了出來(lái),甚至很多導(dǎo)購(gòu)、安全識(shí)別類(lèi)的AI應(yīng)用,也都悄然學(xué)會(huì)了看人下菜碟的本來(lái)。
其本質(zhì)問(wèn)題在于,AI會(huì)去學(xué)習(xí)吸收社交網(wǎng)絡(luò)上的對(duì)話(huà)數(shù)據(jù),然而一頓操作下來(lái),學(xué)到的都是不堪入目的東西。深度學(xué)習(xí)是建立在大數(shù)據(jù)基礎(chǔ)上的,但如果數(shù)據(jù)中夾雜了不那么美好的數(shù)據(jù),AI就可能將這些內(nèi)容帶入為行為模式。
但是如何分辨什么才是好內(nèi)容呢?這個(gè)模棱兩可的問(wèn)題依舊沒(méi)什么好的答案。
二、作為武器與黑產(chǎn)工具的AI
人不止可以教壞AI,還可以直接運(yùn)用AI作惡。這個(gè)領(lǐng)域的案例屢見(jiàn)不鮮,英國(guó)在2015年就開(kāi)始發(fā)現(xiàn)利用AI模型模仿用戶(hù)語(yǔ)氣來(lái)進(jìn)行的郵件與電信詐騙;很多黑客展現(xiàn)了利用AI來(lái)盜取密碼和破解安全鎖的能力;甚至在國(guó)內(nèi),很多不法分子已經(jīng)開(kāi)始使用AI識(shí)別技術(shù)來(lái)刷電商賬戶(hù)和訂單,從而支撐黑產(chǎn)的運(yùn)行。
三、不靠譜的機(jī)器直覺(jué)
AI作為一種算法,顯然是不以人的常識(shí)為常識(shí)的,但是很多時(shí)候無(wú)論普通人還是科研人員都會(huì)忽視這一點(diǎn)。著名的案例是Deepmind在一個(gè)賽艇游戲中訓(xùn)練AI時(shí),發(fā)現(xiàn)深度學(xué)習(xí)模型最終得出的結(jié)論不是一般人類(lèi)玩家選擇的路線(xiàn),而是在游戲中瘋狂轉(zhuǎn)圈。雖然是個(gè)游戲,但卻發(fā)人深醒,比如AI在無(wú)人駕駛場(chǎng)景里,或許是不按照人類(lèi)交通規(guī)則來(lái)思考問(wèn)題的,它可能直接從高架橋上飛下去,或者選擇逆行來(lái)獲得更好的通過(guò)效率。
這也不是危言聳聽(tīng),今天的研究已經(jīng)發(fā)現(xiàn),在路牌上做一點(diǎn)點(diǎn)手腳,就可能對(duì)計(jì)算機(jī)視覺(jué)產(chǎn)生干擾。畢竟機(jī)器即使能看,也不是人類(lèi)的“看法”。
顯然,這些問(wèn)題在未來(lái)的AI應(yīng)用中都足夠復(fù)雜與危險(xiǎn)。那么問(wèn)題來(lái)了之后,解決方案有哪些呢?
檢察官、行刑者與道德家:我們用什么給AI上鎖?
AI本身的失控可能與安全隱患,或許是不同于人類(lèi)歷史上任何技術(shù)風(fēng)險(xiǎn)的。它吸納大量數(shù)據(jù),又進(jìn)行了復(fù)雜的內(nèi)部轉(zhuǎn)換,所以留給人類(lèi)的困難之處在于,它不是像汽油或電力那樣具有簡(jiǎn)單的安全規(guī)律,而是難以捉摸的隱秘bug。
我們經(jīng)常聽(tīng)AI開(kāi)發(fā)者講述這樣一個(gè)情況:模型跑了一遍,OK挺好的,再跑一遍,出問(wèn)題了,哪出的問(wèn)題,不知道……再多來(lái)兩遍,好像又好了?
顯然在工業(yè)這樣的關(guān)鍵生產(chǎn)領(lǐng)域,部署這樣天馬行空的員工是不合適的。那么如何給AI裝上安全保險(xiǎn)裝置呢?可以看到今天業(yè)界有這樣幾種思路。需要注意的是,這不是涇渭分明的流派之爭(zhēng),真正在實(shí)踐AI安全的時(shí)候,是需要綜合解決方案共同努力的。
一、行刑者
話(huà)題回到我們最開(kāi)始提到的DeepMind。他們正在研發(fā)的AI安全技術(shù),形象一點(diǎn)形容就是在復(fù)雜AI任務(wù)的背后,站立一位隨時(shí)待命的“AI行刑者”。通過(guò)再研發(fā)一個(gè)功能強(qiáng)悍,有一套自身安全邏輯的AI系統(tǒng),基于強(qiáng)化學(xué)習(xí)機(jī)制,來(lái)隨時(shí)監(jiān)控其他AI模型的工作。一旦有出格舉動(dòng),立馬跳閘斷電。
事實(shí)上,“可中斷”概念一直都是DeepMind在AI安全領(lǐng)域的核心理念。去年12月,他們就發(fā)布了名為《安全可中斷智能體》的研究成果,展示了如何保證在中斷再啟動(dòng)的環(huán)境下,智能體的運(yùn)行效果不會(huì)受損。
讓AI去監(jiān)視AI,雖然技術(shù)上非常前沿,也留有若干問(wèn)題,但大概是未來(lái)AI安全鎖的主要研究方向,因?yàn)槊鎸?duì)越來(lái)越復(fù)雜的深度神經(jīng)網(wǎng)絡(luò),其他問(wèn)題追溯模式可能會(huì)消耗難以承擔(dān)的人工成本。
然而這種新技術(shù)帶來(lái)的首要疑惑,顯然是“誰(shuí)來(lái)監(jiān)督監(jiān)督者”?

發(fā)表評(píng)論
登錄
手機(jī)
驗(yàn)證碼
立即登錄即可訪(fǎng)問(wèn)所有OFweek服務(wù)
還不是會(huì)員?免費(fèi)注冊(cè)
忘記密碼請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
7月22-29日立即報(bào)名>> 【線(xiàn)下論壇】第三屆安富利汽車(chē)生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠(chǎng)展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
-
8月5日立即報(bào)名>> 【在線(xiàn)會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
推薦專(zhuān)題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 深圳跑出40億超級(jí)隱形冠軍:賣(mài)機(jī)器人年入6.1億,港股上市
- 7 特斯拉Robotaxi上路,馬斯克端上畫(huà)了十年的餅
- 8 “AI六小虎”到了下一個(gè)賽點(diǎn)
- 9 AI視頻,攪動(dòng)1.5萬(wàn)億市場(chǎng)
- 10 張勇等人退出阿里合伙人