谷歌DeepMind團(tuán)隊(duì)圍棋類(lèi)AI新進(jìn)展:AlphaGo升級(jí)版AlphaZero強(qiáng)勢(shì)來(lái)襲
近日,據(jù)外媒報(bào)道,谷歌DeepMind團(tuán)隊(duì)帶來(lái)了一個(gè)全新的通用的版本。這個(gè)程序被稱(chēng)為AlphaZero,它教會(huì)自己在短短三天內(nèi)玩三種不同的棋盤(pán)游戲(國(guó)際象棋、圍棋和日本版國(guó)際象棋),沒(méi)有人為干預(yù),這一描述成就的論文發(fā)表在《科學(xué)》雜志上。
DeepMind首席執(zhí)行官兼聯(lián)合創(chuàng)始人Demis Hassabis說(shuō)“從完全隨機(jī)的游戲開(kāi)始,AlphaZero逐漸學(xué)會(huì)了什么是好的游戲,并形成了自己對(duì)游戲的評(píng)價(jià)。從這個(gè)意義上講,它不受人類(lèi)對(duì)游戲思考方式的限制!
AlphaZero是DeepMind旗下AlphaGo的直系后代。2016年,AlphaGo打敗了圍棋(人類(lèi))世界冠軍李世石(Lee Sedol),成為世界各地的頭條新聞。AlphaGo并不滿足于此,去年獲得了一次重大升級(jí),能夠在不需要人工干預(yù)的情況下自學(xué)獲勝策略。
通過(guò)一遍又一遍地與自己下棋,AlphaGo Zero (AGZ)訓(xùn)練自己在短短三天時(shí)間內(nèi)從零開(kāi)始,以0比100完勝最初的AlphaGo 100。它得到的唯一輸入是游戲的基本規(guī)則。
AlphaZero通過(guò)應(yīng)用大量處理能力,5,000張?zhí)幚韱卧═PU),相當(dāng)于一臺(tái)非常大的超級(jí)計(jì)算機(jī),很快地學(xué)會(huì)了玩三種棋盤(pán)游戲中的每一種。
不像以前的國(guó)際象棋機(jī)器那樣以極快的速度處理人類(lèi)的指令和知識(shí),AlphaZero會(huì)產(chǎn)生自己的知識(shí),它只需幾個(gè)小時(shí)即可完成,其結(jié)果已超過(guò)任何已知的人或機(jī)器。
但是,AlphaZero的基本算法實(shí)際上僅適用于可以采取相當(dāng)數(shù)量的操作問(wèn)題。它還需要一個(gè)強(qiáng)大的環(huán)境模型,即游戲規(guī)則。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
7月8日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車(chē)生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
推薦專(zhuān)題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 特斯拉Robotaxi上路,馬斯克端上畫(huà)了十年的餅
- 7 張勇等人退出阿里合伙人
- 8 AI的夏天:第四范式VS云從科技VS地平線機(jī)器人
- 9 深圳跑出40億超級(jí)隱形冠軍:賣(mài)機(jī)器人年入6.1億,港股上市
- 10 AI視頻,攪動(dòng)1.5萬(wàn)億市場(chǎng)