最近高清中文在线字幕观看,国产亚洲??久一区二区三

Facebook工程師創(chuàng)建了比爾·蓋茨的AI語音克隆體

2019-06-12 09:10

近年來，人工智能技術的發(fā)展已經讓我們覺得有些可怕，而如何防止 AI 這把雙刃劍不被錯誤地使用，也引發(fā)了越來越激烈的探討。比如 2017 年底冒出的 DeepFakes 視頻換臉技術，就讓許多名人遭遇了虛假色情片的困擾。現(xiàn)在，F(xiàn)acebook 工程師們又創(chuàng)造出了一個能夠惟妙惟肖地模仿比爾·蓋茨的語音 AI 。

事實上，蓋茨只是 MelNet 可以模仿的多位人物中名氣最大的，其他“被克隆”的包括喬治·武井（George Takei）、珍·古德（Jane Goodall）、史蒂芬·霍金等人。

在下列剪輯中，你可以聽到一系列無害的句子，比如：

游泳時抽筋不是鬧著玩的（ A cramp is no small danger on a swim ）

同樣的話他說過三十遍（ He said the same phrase thirty times ）

摘下沒有葉子的鮮亮玫瑰（ Pluck the bright rose without leaves ）

2 加 7 小于 10（ Two plus seven is less than ten ）

上述每一段語音，都是由 Facebook 工程師設計創(chuàng)建的一個名為 MelNet 的機器學習系統(tǒng)生成的。那么，用來訓練這套 ML 系統(tǒng)的數(shù)據(jù)，又是哪里來的呢？

據(jù)悉，MelNet 分析了 452 小時的 STEM－y 類 TED 演講數(shù)據(jù)集，以及其它有聲讀物。

顯然，對機器學習系統(tǒng)來說，模仿這些人物慷慨激昂的演講方式，確實是一個不小的挑戰(zhàn)。

近年來，語音克隆的質量一直在穩(wěn)步提升。比如近期播放的 Joe Rogan 復制品，就是一個極好的證明。

不過這一進展的大部分工作，可以追溯到 2016 年的 SampleRNN 和WaveNet 。

后者是由位于倫敦的人工智能實驗室 DeepMind 創(chuàng)建的機器學習（ML）文本轉語音（TTS）轉換程序，該實驗室同時為 Google Assistant 智能助理提供支持。