你在淘寶上看到的圖片和視頻 到底怎樣一步步被AI接管?
在讓AI協助人類的這條路上,阿里帶來了“魯班”和Aliwood兩套AI工具,它們將成為淘寶店家日后的重要利器。
給你一秒鐘,你能設計出8000張海報嗎?
不要那種粗制濫造的效果,而是能掛在雙十一淘寶網站,被上億人看到的那種,帶有獨特設計風格的作品,你能做到嗎?
不開玩笑,即便效率最高的設計師,也只能說這是Mission Impossible,但一位2015年入職阿里巴巴的新員工魯班,只用了兩年多時間,就達到了這個效率,而且到今年雙11時,它將很可能成為具有阿里巴巴P6設計師水平的員工。這是什么概念?在阿里,這個等級可以擔綱中等設計項目主創(chuàng)人員。
你可能猜到了,這位魯班并不是人,而是來自阿里巴巴的人工智能產品,而它能擁有這樣速度,得益于人工智能技術近年來的迅速崛起,就在今天下午(4月21日),在UCAN大會上,我們見到了煥然一新的魯班系統(tǒng),這一次,它給人帶來的想象更加豐富。
阿里巴巴智能設計實驗室負責人吳春松
在2015年之前,淘寶商品推薦都是通過人工運營控制,但龐大的用戶需求和運營資源的不對等帶來的問題,需要通過技術解決。如果你是淘寶老用戶,你會發(fā)現如今的淘寶是“千人千面”的,每個人都會有屬于自己的商品首頁,而專屬于每個人的頁面信息,就需要大量的圖片支持,這就是魯班誕生的原因。
和人學習的過程類似,作為AI設計師的魯班,也是從模仿開始,當輸入海量設計海報、banner等信息之后,它會對于其中的背景、主體、修飾等元素進行識別,由此理解它們間的關系。隨后,魯班會“照貓畫虎”一樣對這些素材進行組合,嘗試風格不同的組合后,這些隨機生成的圖片會通過機器來判斷并進行打分,因此生成一系列最優(yōu)結果反饋給神經網絡,并最終成為阿里電商平臺對外展示的海報、banner等圖像。
“2016年的雙 11,魯班制作了 1.7 億張廣告banner,如果全靠設計師人手來完成,假設每張圖耗時 20分鐘,滿打滿算需要100個設計師連續(xù)做 300年!薄棒敯唷眲(chuàng)始人、阿里巴巴智能設計實驗室負責人吳春松(花名樂乘)告訴我們,因為每年雙 11 的海量設計需求,設計師需要有這樣的工具幫助提升效率。
實際上,從2016年以來,如果你打開淘寶,遇到雙 11 等大型活動,看到那些花花綠綠充滿設計風格的海報作品,不要懷疑,它們的確有不少是機器生成的,并且沒有一張完全一樣。到2017年,魯班一天就能完成4000萬張海報,平均每秒8000張。2018年,從新手做起兩年時間后,魯班終于迎來了對外開放的時刻。
樂乘告訴我們,今年魯班將會改名“鹿班”,并在五月份把核心能力對外開放,其核心能力主要包含四個方面:
1,一鍵生成:將商品相關素材、文字輸入,選擇自己需要的海報尺寸、風格等,可自動生成符合要求的海報作品。
2,智能排版:將拍攝好的照片和需要的文字輸入,選擇尺寸,可自動生成帶有隨機風格的海報作品或產品展示。
3,設計拓展:將設計完成稿輸入,選擇需要拓展的尺寸,可自動生成相應拓展尺寸的結果。
4,智能創(chuàng)作:擁有自己獨特風格的設計師將自己創(chuàng)作好的系列作品輸入,可以訓練機器,并成為系統(tǒng)新的效果風格。
其中,前三點核心能力主要面向企業(yè)和商家,第四點能力則是面向設計師群體,讓他們用另一種方式賣出自己的作品,這樣既能夠讓設計靈感變現,同時也能為這套AI系統(tǒng)不斷升級。樂乘告訴我們,作為阿里巴巴的AI落地應用,開放后的“魯班”將會成為一個新的商業(yè)項目,而生產海報的費用相比人工來講會降低很多。
這里面令人好奇的事情在于,作為一項將新的商業(yè)項目,海報生成的結果能否讓付費用戶滿意?每個人對于好不好看有自己的評價標準,“魯班”要靠什么來達到這一標準?為了解決這個問題,“魯班”項目選擇和清華大學建立合作,清華大學計算機系“長江學者”特聘教授、人機交互研究所所長史元春教授,目前擔任“魯班”的視覺美學評估總負責,她表示:
“美學可以牽涉到很多問題,基本的是我看到一個東西,我總體的感官和它的主題,這對人的視覺感受來說,在心理學上已經有一些可以參考的依據,而這些依據可利用已有的大量數據驗證,并且成為構造算法的依據!
實際上這一套美學相關的判斷標準也經過阿里巴巴電商平臺大數據的不斷反饋來進行調整,清華大學在這方面的研究也會得到進一步驗證,因此從商業(yè)場景考慮,AI設計師“魯班”已經不再是試驗性質的產品。
目前,這套系統(tǒng)一端將對接商家和企業(yè),另一端則連接設計師和一些素材庫,在和樂乘的溝通中,他告訴我們,目前已經合作的包括視覺中國、花瓣等圖片庫以及方正字庫、漢儀字庫等正版字庫,因此從實用角度來看,生成的結果不會遜色于設計師,并且商家和企業(yè)也可以在使用時事先預覽結果,找到最滿意的結果再選擇付費。
不過,魯班并非要取代設計師的工作,即便目前功能如此好用,卻仍舊需要大量數據讓它成長起來,樂乘告訴我們,今天的人工智能都是基于大數據規(guī)模結構化標注數據,設計行業(yè)在不斷變化,如果沒有辦法提供新的數據,那么魯班就只能停留在過去的階段,畢竟只有人能夠主觀創(chuàng)造新的設計趨勢和風格,魯班的存在更多的是解決讓設計師感到繁重的體力工作。而訓練它還需要我們人類,這也是目前官方正在進行“馴鹿”計劃,讓設計師參與進來的重要原因。
在讓AI協助人類的這條路上,除了“魯班”系統(tǒng),阿里巴巴這次還對外展示了全新的短視頻AI工具 Aliwood,這套工具也將會成為淘寶店家日后的重要利器。
Aliwood是一個短視頻生成工具,它最重要的作用是通過自動分析淘寶商品詳情頁面,生成一段 20秒內,帶有音樂、文字和圖像信息的短視頻。它的出現,可以說最大程度解決了淘寶店主商品展示的需求。
阿里巴巴達摩院自然交互體驗實驗室負責人傅利民
“我們發(fā)現在線下,一些有音樂和視頻展示的店,銷量會有 2 到 5 倍的增加,在線上,商品有音樂和視頻展示,分享率會增加 40%左右,銷售量上的提升大概時 18%左右,但淘寶目前有數十億計的商品,90%都是圖片+文字,商家要想做視頻,找專業(yè)的人做需要 2 萬左右一個,費用很高!
阿里巴巴達摩院自然交互體驗實驗室負責人傅利民告訴我們,確立這樣的通過圖文轉短視頻的項目是基于真實需求場景來考慮的,而利用Aliwood這樣的工具,對于商家銷量將有很好的效果。
“純粹從時間看,如果把淘寶 20億的商品,在一年內都生成短視頻,大概需要 50萬的設計師,這樣是做不到的。我們萌生了這樣的想法,能夠真正幫助到商家做這樣的事情。從內容的提取,關鍵詞的抽取最后合成,包括里面的情感計算,怎么樣找到對的音樂能夠有正向情緒的延伸,最后合成在里面!
而說到視頻,不論是我們如今每天在刷的抖音或者快手,音樂和畫面的配合都在成為影響決定算法的重要因素,音樂的使用很容易抓住用戶情感,而好的音樂來自于更強大的情感計算能力。浙大-阿里 IDEA Lab 負責人孫凌云教授告訴我們,在Aliwood研發(fā)的過程當中,正因為音樂的添加,讓視頻信息量一下子增加了很多,而要做出這樣的知識圖譜,浙大的研究團隊還從電影中去學習了這方面的內容。
在Aliwood這個工具中,音樂是通過基本元素庫和畫面相互匹配來生成的,“比如我們要剪一個服裝相關的小片子,這個過程中我們呈現的是模特的數據,下一秒有平緩的轉換,呈現得是這件衣服穿上身轉一圈的角色,這個轉換是對于音樂庫中某一中節(jié)奏或者是某一個特效有一個匹配關系!睂O教授告訴我們,但這只是一種方式,另一種方式是通過先找到合適的音樂,然后反向去組織短視頻的素材,在目前Aliwood這一工具中,兩種方式都在運用。
短視頻展示商品自然要比圖片更加直觀好看,而隨著網絡帶寬的加強,流量成本降低無疑讓大家在購買商品時會更青睞于商品的視頻化展示,如果說魯班要做的是讓你第一眼就看到商品,那么Aliwood要做的是讓你第二眼就能了解商品,對于阿里這一以電商業(yè)務為主的平臺來說,這兩個AI工具的推出,正式把平臺的上的數據,用更加效率化的方式展現給每一個用戶。
當然,這兩個工具目前還都只利用于阿里平臺內(不過不局限于淘寶天貓),用樂乘的說法是“阿里的平臺數據,學到的都是阿里的設計,有什么樣的數據有什么樣的智能,要用到企業(yè)設計風格的閉環(huán),是一種數據挑戰(zhàn)!蔽覀冇欣碛上嘈,隨著AI技術的更快速發(fā)展,我們會見到更多這樣實際的應用出現在我們身邊,而利用好這些工具,需要每一個人重新去理解人和AI之間的關系,正如微軟CEO納德拉說的那樣:
“每個人的基本需求是能夠更有效利用自己的時間,而不是讓AI說讓我們來取代你!

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月8日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數會2025(第六屆)機器人及智能工廠展
-
7月31日免費預約>> OFweek 2025具身智能機器人產業(yè)技術創(chuàng)新應用論壇
-
免費參會立即報名>> 7月30日- 8月1日 2025全數會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題