車萬翔教授:ACL 2010-2020 研究趨勢總結(jié)
本周要跟大家分享的是來自TechBeat社區(qū)的一篇優(yōu)質(zhì)好文。本文中,車萬翔教授從ACL的投稿及錄用趨勢,到各個(gè)研究領(lǐng)域的發(fā)展現(xiàn)狀,都發(fā)表了自己的一些看法,希望對相關(guān)領(lǐng)域的研究者能有所幫助!
導(dǎo)讀:
2020年5月23日,有幸受邀在中國中文信息學(xué)會青年工作委員會主辦的AIS(ACL-IJCAI-SIGIR)2020頂會論文預(yù)講會上介紹了ACL會議近年來的研究趨勢,特整理成幻燈片配文字版,希望對相關(guān)領(lǐng)域的研究者有所幫助。由于視野所限,時(shí)間倉促,特別是ACL 2020的錄用論文列表剛發(fā)布不久,因此統(tǒng)計(jì)的數(shù)據(jù)和得出的結(jié)論難免有失偏頗,如有不當(dāng)之處,還敬請指出。另外,特別感謝組內(nèi)的多位博士生幫助進(jìn)行數(shù)據(jù)整理。
首先來看一下2010年到2020年這11年來,ACL長文的錄用情況和趨勢,可以看出從2018年開始,投稿和錄用的數(shù)量急劇上升,說明作為人工智能皇冠上的明珠,自然語言處理領(lǐng)域越來越受到研究界的關(guān)注。另外,ACL的錄用率多年來基本保持穩(wěn)定,一直在25%左右。
再來看一下今年錄用文章標(biāo)題的詞云,從中可以看出大家關(guān)注比較多的任務(wù)有生成、翻譯、對話、問答、抽取、句法等方向,用到的方法多涉及到神經(jīng)、網(wǎng)絡(luò)、注意力、圖等。另外,從文章作者的詞云可以看出前幾名的基本都是中國的大姓,這也反應(yīng)出華人作者在ACL頂會上已經(jīng)占據(jù)非常大的比例。
為了更直觀的了解近年來ACL各個(gè)研究領(lǐng)域的變化趨勢,我們做了一個(gè)領(lǐng)域趨勢競賽圖,幫助大家更好地看出各個(gè)研究領(lǐng)域此消彼長的變化過程。特別說明的是,我們的領(lǐng)域是參考ACL 2019進(jìn)行劃分的,由于其它年份的領(lǐng)域劃分方式不盡相同,我們采用人工的方式進(jìn)行了映射。另外,由于2020年目前只有文章列表,還沒有領(lǐng)域數(shù)據(jù),所以也是人工逐篇文章分的類,因此具有一定的主觀性,有可能不是特別準(zhǔn)確。
從這段視頻中,我們可以看到幾個(gè)非常明顯的趨勢,比如人機(jī)對話等新興領(lǐng)域上升勢頭迅猛,而句法分析、機(jī)器翻譯等傳統(tǒng)領(lǐng)域有所衰落。下面,就幾個(gè)變化比較明顯的領(lǐng)域分別加以介紹。
人機(jī)對話異軍突起
2015年之前,ACL上幾乎沒有人機(jī)對話的文章發(fā)表,但是從2016年開始,隨著語音識別技術(shù)的突破,NLPer開始重視人機(jī)對話的研究,今年ACL該方向上的研究重點(diǎn)和研究趨勢如下圖所示。
機(jī)器學(xué)習(xí)持續(xù)熱門
可以看到近10年來,機(jī)器學(xué)習(xí)的熱度一直居高不下,特別是隨著預(yù)訓(xùn)練模型的成功,NLP模型大有被大一統(tǒng)的趨勢。下面的一些機(jī)器學(xué)習(xí)研究方向?yàn)榻衲闍CL所重點(diǎn)關(guān)注。

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
7月8日立即報(bào)名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題