丨趨勢丨下一代 AutoAI:算法的迭代變成數(shù)據(jù)的迭代
前言:
深度學(xué)習(xí)問世以來,隨著神經(jīng)網(wǎng)絡(luò)架構(gòu)趨于固定和成熟,轉(zhuǎn)而尋找改進(jìn)數(shù)據(jù)的方法,已經(jīng)成了AI 研發(fā)的新出口。
AutoAI自動執(zhí)行高度復(fù)雜的任務(wù),為數(shù)據(jù)尋找并優(yōu)化最好的機(jī)器學(xué)習(xí)模型、特征和模型超參數(shù)。
作者 | 方文
圖片來源 | 網(wǎng) 絡(luò)
AutoAI在人工智能全生命周期中自動建模
AutoAI是最先進(jìn)的自動化機(jī)器學(xué)習(xí)產(chǎn)品可以有效地分析歷史數(shù)據(jù),創(chuàng)建自定義機(jī)器學(xué)習(xí)管道并對其進(jìn)行排名。
它包括自動化特征工程——可擴(kuò)展和增強(qiáng)數(shù)據(jù)的特征空間以優(yōu)化模型性能。
AutoAI可以在幾分鐘內(nèi)完成通常需要整個數(shù)據(jù)科學(xué)家團(tuán)隊(duì)數(shù)個小時到數(shù)天才能完成的工作。自動化功能包括數(shù)據(jù)準(zhǔn)備、模型開發(fā)、特征工程和超參數(shù)優(yōu)化。
整個建模過程端到端的自動化可以顯著節(jié)省資源。AutoAI顯著提高了生產(chǎn)力,只需點(diǎn)擊幾下鼠標(biāo),即使是只有基本數(shù)據(jù)科學(xué)技能的人,也可以使用自定義數(shù)據(jù)自動選擇、訓(xùn)練并調(diào)優(yōu)高性能機(jī)器學(xué)習(xí)模型。
然而,專業(yè)的數(shù)據(jù)科學(xué)家可以快速迭代可能的模型和管道,并試驗(yàn)最新的模型、特征工程技術(shù)和公平算法,無需從頭開始編寫管道代碼就可以完成這一切。
數(shù)據(jù)科學(xué)家的新語義能力
數(shù)據(jù)科學(xué)家理解了數(shù)據(jù)的語義,就有可能利用領(lǐng)域知識來擴(kuò)展特征空間,從而提高模型準(zhǔn)確性,這種擴(kuò)展可以使用來自內(nèi)部或外部數(shù)據(jù)源的補(bǔ)充數(shù)據(jù)來完成。
AutoAI檢測到正確的語義概念,程序就會使用這些概念廣泛搜索現(xiàn)有代碼、數(shù)據(jù)和文獻(xiàn)中可能存在的相關(guān)特征和特征工程操作。
AutoAI可以使用這些新的、語義豐富的特征來提高生成模型的準(zhǔn)確性,并通過這些生成的特征提供可供人類閱讀的解釋。
即使沒有評估這些語義概念或者新功能的專業(yè)知識,數(shù)據(jù)科學(xué)家們還是可以試用AutoAI。但是,想要理解發(fā)現(xiàn)的語義概念并與之交互的數(shù)據(jù)科學(xué)家可以使用Semantic Feature Discovery(語義特征發(fā)現(xiàn))可視化資源管理器來探索發(fā)現(xiàn)的關(guān)系。
AutoAI 的三個階段
第一階段:模型設(shè)計(jì)、調(diào)參自動化
當(dāng)前,很多學(xué)者都已經(jīng)注意到,學(xué)術(shù)界或者工業(yè)界的優(yōu)秀人才所聚焦的研發(fā),花費(fèi)太多時間用于模型結(jié)構(gòu)設(shè)計(jì)以及調(diào)參,但實(shí)際上它本不應(yīng)該成為研究的主要內(nèi)容。有沒有一種自動化的方法,讓深度學(xué)習(xí)的網(wǎng)絡(luò)架構(gòu)在面對一個問題的時候,能自主的演化其架構(gòu),這才是關(guān)鍵。
第二階段:簡單模型訓(xùn)練的軟件化
第一階段的自動化主要面向?qū)I(yè)的算法研究人員,第二階段的系統(tǒng)化則面向一般的 AI 從業(yè)人員。主要目標(biāo)是在給定標(biāo)注好的數(shù)據(jù)的情況下,通過可視化的操作界面實(shí)現(xiàn)模型的訓(xùn)練。
第三階段:數(shù)據(jù)迭代自動化
在算法設(shè)計(jì)自動化的基礎(chǔ)上,正在發(fā)生一些變化。模型和數(shù)據(jù)到底哪一個更重要 ,在設(shè)計(jì)化的工業(yè)生產(chǎn)中,以模型為中心的技術(shù)研發(fā)已經(jīng)轉(zhuǎn)化成以數(shù)據(jù)為中心的技術(shù)研發(fā)。
數(shù)據(jù)的迭代越來越重要
在工業(yè)化大規(guī)模發(fā)展中,大家正在慢慢地從模型為中心的生產(chǎn)轉(zhuǎn)化為以數(shù)據(jù)為中心。
可從兩個維度來提高它的性能,一是以模型為中心的方法,即想盡各種辦法提高模型設(shè)計(jì)的復(fù)雜度、技術(shù)含量等;
二是以數(shù)據(jù)為中心的方法,比如加數(shù)據(jù)(加數(shù)據(jù)也是有一些科學(xué)方法的,并不是加了數(shù)據(jù)后性能一定會提高)、檢查數(shù)據(jù)有沒有問題等等。
會發(fā)現(xiàn),以數(shù)據(jù)為中心的方法比以模型為中心的方法能更多地提高性能。
做模型生產(chǎn)時也得到這樣一個結(jié)論:越到后面,數(shù)據(jù)的迭代越來越重要。因?yàn)樗心P偷姆⻊?wù)實(shí)際上是針對某一個特定場景,使用的是特定的數(shù)據(jù)。
結(jié)尾:AutoAI未來適配率極高
如今,有自動化 AI 模型生產(chǎn)平臺需求的,已經(jīng)不僅僅是谷歌、微軟、Meta、IBM、蘋果等大公司了,我們國內(nèi)就有不少房地產(chǎn)公司開始投入 AI。他們都有人才的需求,自動化的 AI 可以降低他們的成本。地產(chǎn)公司、物業(yè)公司,以及像寧德時代這樣做電池的公司,都在慢慢引入AI來解決實(shí)際問題。
AI是一個非常基礎(chǔ)的能力,可以提高我們做事情的效率,AI并不改變行業(yè),但是可以提升所在行業(yè)的生產(chǎn)效率,所以這種影響是全方位的,已經(jīng)慢慢地波及到非技術(shù)類公司了。
更不用說現(xiàn)在廣泛的制造業(yè),制造過程中的很多環(huán)節(jié)都可以利用到AI的能力。如果想提高自己的國際競爭力,提升自己的生產(chǎn)質(zhì)量,就需要AI的能力去賦能生產(chǎn)。
部分內(nèi)容來源于:雷鋒網(wǎng):下一代 AutoAI:從模型為中心,到數(shù)據(jù)為中心;至頂頭條:IBM的AutoAI讓數(shù)據(jù)科學(xué)家更高效,但可怕的是它正在變得太智能了;AI科技評論:下一代AutoAI:從模型為中心,到數(shù)據(jù)為中心
原文標(biāo)題 : AI芯天下丨趨勢丨下一代 AutoAI:算法的迭代變成數(shù)據(jù)的迭代

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月8日立即報(bào)名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題