深大教授石大明:深度學(xué)習(xí)在神經(jīng)網(wǎng)絡(luò)中的作用
11月12-13日,由OFweek中國高科技行業(yè)門戶、高科會主辦的“OFweek2018(第三屆)中國高科技產(chǎn)業(yè)大會”在深圳成功舉辦。在13日“OFweek2018(第三屆)人工智能產(chǎn)業(yè)大會AI技術(shù)專場”上,深圳大學(xué)計算機(jī)與軟件學(xué)院特聘教授石大明帶來了“從神經(jīng)網(wǎng)絡(luò)到深度學(xué)習(xí)”的主題演講,針對深度學(xué)習(xí)在神經(jīng)網(wǎng)絡(luò)的發(fā)展方向進(jìn)行了詳細(xì)分析。
深圳大學(xué)計算機(jī)與軟件學(xué)院特聘教授石大明
神經(jīng)網(wǎng)絡(luò)是一門重要的機(jī)器學(xué)習(xí)技術(shù),也是目前最為火熱的研究方向,即深度學(xué)習(xí)的基礎(chǔ)。石大明教授首先詳細(xì)分析了人工智能兩大學(xué)派:符號主義與連接主義,緊接著又講述了機(jī)器學(xué)習(xí)的兩大方法:有監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí),循序漸進(jìn)。
神經(jīng)網(wǎng)絡(luò)發(fā)展包含四個里程碑,分別是感知器、多層感知器、支持向量機(jī)、深度學(xué)習(xí),并對神經(jīng)網(wǎng)絡(luò)中的難點(diǎn)進(jìn)行了分析。他提出,深度學(xué)習(xí)在神經(jīng)網(wǎng)絡(luò)發(fā)展中的地位實(shí)質(zhì)是靠強(qiáng)大的計算和存儲能力進(jìn)行搜索而完成自動特征提取,同時具有理論上無突破,缺乏網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)優(yōu)化等缺點(diǎn)。石大明表示,深度學(xué)習(xí)的發(fā)展方向應(yīng)當(dāng)是:結(jié)合領(lǐng)域知識的特征提取的同時,定量優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)。
深度學(xué)習(xí)不是萬能的
大腦的工作過程,是一個對接收信號不斷迭代、不斷抽象概念化的過程。例如,從原始信號攝入開始,接著做初步處理、抽象,再進(jìn)一步抽象,最后識別人臉。這個過程其實(shí)和人們的常識是相吻合的,因?yàn)閺?fù)雜的圖形,往往就是由一些基本結(jié)構(gòu)組合而成的。因此,石大明介紹到:大腦是一個深度架構(gòu),認(rèn)知過程也是深度的。深度學(xué)習(xí),恰恰就是通過組合低層特征形成更加抽象的高層特征。
深度學(xué)習(xí)通過學(xué)習(xí)深層非線性網(wǎng)絡(luò)結(jié)構(gòu),只需簡單的網(wǎng)絡(luò)結(jié)構(gòu)即可實(shí)現(xiàn)復(fù)雜函數(shù)的逼近,并展現(xiàn)了強(qiáng)大的從大量無標(biāo)注樣本集中學(xué)習(xí)數(shù)據(jù)集本質(zhì)特征的能力。深度學(xué)習(xí)能夠獲得可更好地表示數(shù)據(jù)的特征,同時由于模型的層次深、表達(dá)能力強(qiáng),因此有能力表示大規(guī)模數(shù)據(jù)。對于圖像、語音這種特征不明顯的問題,深度模型能夠在大規(guī)模訓(xùn)練數(shù)據(jù)上取得更好的效果。相比于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò),深度神經(jīng)網(wǎng)絡(luò)作出了重大的改進(jìn),在訓(xùn)練上的難度可以通過“逐層預(yù)訓(xùn)練”來有效降低。
石大明認(rèn)為,深度學(xué)習(xí)并不是萬能的,其需要結(jié)合特定領(lǐng)域的先驗(yàn)知識,需要和其他模型結(jié)合才能得到最好的結(jié)果。此外,類似于神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)的另一局限性是可解釋性不強(qiáng),像個“黑箱子”一樣不知為什么能取得好的效果,以及不知如何有針對性地去具體改進(jìn),而這有可能成為產(chǎn)品升級過程中的阻礙。
深度學(xué)習(xí)應(yīng)用最廣泛的三個主要研究領(lǐng)域
深度學(xué)習(xí)極大地促進(jìn)了機(jī)器學(xué)習(xí)的發(fā)展,收到世界各國相關(guān)領(lǐng)域研究人員和高科技公司的重視,石大明表示語音、圖像和自然語言處理是深度學(xué)習(xí)算法應(yīng)用最廣泛的三個主要研究領(lǐng)域:
1、深度學(xué)習(xí)在語音識別領(lǐng)域研究現(xiàn)狀
長期以來,語音識別系統(tǒng)大多是采用GMM來描述每個建模單元的概率模型。由于這種模型估計簡單,方便使用大規(guī)模數(shù)據(jù)對其訓(xùn)練,有較好的區(qū)分度訓(xùn)練算法,在很長時間內(nèi)占據(jù)了語音識別應(yīng)用領(lǐng)域主導(dǎo)性地位。
2、深度學(xué)習(xí)在圖像識別領(lǐng)域研究現(xiàn)狀
對于圖像的處理是深度學(xué)習(xí)算法最早嘗試應(yīng)用的領(lǐng)域。起初卷積神經(jīng)網(wǎng)絡(luò)在小規(guī)模的問題上取得了當(dāng)時世界最好成果。但是在很長一段時間里一直沒有取得重大突破。主要原因是卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用在大尺寸圖像上一直不能取得理想結(jié)果,而現(xiàn)在的深度學(xué)習(xí)網(wǎng)絡(luò)模型已經(jīng)能夠理解和識別一般的自然圖像。深度學(xué)習(xí)模型不僅大幅提高了圖像識別的精度,同時也避免了需要消耗大量時間進(jìn)行人工特征的提取,使得在線運(yùn)行效率大大提升。
3、深度學(xué)習(xí)在自然語言處理領(lǐng)域研究現(xiàn)狀
自然語言處理問題是深度學(xué)習(xí)在除了語音和圖像處理之外的另一個重要的應(yīng)用領(lǐng)域。深度學(xué)習(xí)在自然語言處理上取得的成果和在圖像語音識別方面相差甚遠(yuǎn),仍有待深入研究。
更多詳細(xì)內(nèi)容,敬請關(guān)注OFweek人工智能網(wǎng)后續(xù)專題報道。

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月8日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題