亞洲資本網 > 資訊 > 科技頻道 > 正文
我國深度合成應用最新趨勢出爐 透視技術升級和元宇宙發(fā)展
2022-02-21 14:04:09來源: 南方都市報

奧運AI手語主播、虛擬偶像、換臉明星……這些應用背后的深度合成技術發(fā)展到了什么階段?大火的“元宇宙”和深度合成的關系是什么?深度合成監(jiān)管面臨怎樣的技術和倫理難題?

2月18日,在北京舉辦的第二次長城工程科技會議“人工智能的安全可控與倫理治理”分論壇上,《深度合成應用十大趨勢報告》(2022)發(fā)布。圍繞深度合成帶來的倫理問題,多位專家在會上進行了探討。

1

深度合成內容高速增長,相關研究不斷升級

深度合成技術,是指利用以深度學習、虛擬現實為代表的生成合成類算法制作文本、圖像、音頻、視頻、虛擬場景等信息的技術。2017年,一位名叫“Deepfakes”的用戶在美國Reddit網站上分享了篡改人臉的色情視頻,將深度合成技術帶到了大眾面前。

《報告》顯示,近幾年,深度合成內容制作和傳播數量高速增長。2021年新發(fā)布的深度合成視頻的數量,較2017年已增長10倍以上。此外,深度合成內容關注度也呈指數級增長,以視頻的點贊/喜歡數據為例進行統(tǒng)計,2021年新發(fā)布的深度合成視頻的點贊數已超過6億。

數據說明:在10家國內外平臺中(愛奇藝、騰訊視頻、優(yōu)酷、嗶哩嗶哩、抖音、快手、微博、YouTube、 Twitter、TikTok),以“Deepfakes”等10個中英文關鍵詞進行檢索,并通過URL去重后,統(tǒng)計出數據結果。圖自《深度合成應用十大趨勢報告》(2022)

研究成果是深度合成內容傳播的底層推動力。其中,蒙特利爾大學在2014年提出了生成對抗網絡(GAN),將數據的逼真度推到了一個新的高度,大大降低了深度合成的門檻?!秷蟾妗凤@示,每年深度合成領域的論文數量正持續(xù)增長。這些深度合成領域的論文,包含對圖像、語音、文本等不同模態(tài)的合成方面的技術研究,其中,對圖像生成的研究占比最高,為64%。音頻和文本分別占24%和12%。

論文研究之外,深度合成領域開源項目也呈持續(xù)攀升的趨勢。開源項目促進了深度合成方法在合成質量、制作效率等方面不斷升級和迭代。

在應用場景方面,《報告》顯示,深度合成的應用場景不斷豐富,如修復歷史照片、AI手語主播、虛擬偶像等應用。特別是在影視制作領域,近些年來,深度合成技術已成為受少數藝人劣跡行為拖累作品的救場工具。

此外,越來越多的企業(yè)機構開始利用深度合成技術提供面向公眾的產品和服務。不同領域的情況有所差異,《報告》顯示,圖像和視頻在深度合成應用的初期應用最為普遍,但是由于產品質量良莠不齊且容易侵犯用戶隱私,當監(jiān)管規(guī)范到位后其數量逐漸減少。音頻方面,語音合成已經成為人機交互的重要一環(huán),且被廣泛應用于智能硬件、智能客服、語音導航、有聲讀物、機器人、語音助手、自動新聞播報等場景。文本方面,深度合成在新聞報道、詩文創(chuàng)作、聊天問答等方面都得到越來越多的應用,并顯現出巨大的創(chuàng)作效率和未來潛力。

《報告》預測,伴隨著自動數據生成、全身合成、3D塑型等技術的逐漸成型,一個新的人類生存場景將以深度合成技術為基石展開。元宇宙就是基于深度合成技術打造的未來人類虛擬數字空間,它“完成了對現實空間和時間的多重復制和延伸,跳脫了傳統(tǒng)物理空間的局限,提供了一個虛擬人、自然人和機器人融生的逼近現實且超越現實的新世界”。

2

深度合成負面風險加劇,各國監(jiān)管成趨勢

《報告》認為,在深度合成技術向社會生活的各個領域滲透之時,深度合成內容負面風險持續(xù)加劇且產生實質危害。隨著深度合成技術的開放開源、深度合成產品和服務的增多,深度合成內容制作的技術門檻越來越低,實現了技術的“平民化”。通過深度合成技術制造虛假視頻、虛假音頻進行誣陷、誹謗、詐騙、勒索等違法行為已屢見不鮮。

深度合成技術還將對信息傳播產生更為深遠的影響。《報告》分析,人類的傳播活動,因深度合成技術逐漸步入“深度后真相”時代。首先, “深度偽造”深刻影響了新聞對真相的記錄,對虛假內容高難度的甄別影響了事實核查的有效性。其次,在社會重大突發(fā)事件或政治事件節(jié)點上,深度合成技術如若被惡意使用,將會借助社交媒體,使虛假信息在互聯網上產生病毒式的擴散和蔓延。第三,在日常事件的信息發(fā)布與追蹤中,深度偽造的信息還會造成輿論場中輿論意見的不斷翻轉,激化社會不同群體的矛盾。亟需警惕的是,深度合成技術的惡意偽造內容通常迎合大眾獵奇心理,具有極強的意識塑造能力。

《報告》還指出,深度合成內容的鑒別正面臨技術挑戰(zhàn)。新型偽造方法的層出不窮,加上基于深度神經網絡的檢測算法存在結構性缺陷等,反深偽檢測技術也面臨“強對抗性”,需要持續(xù)更新與迭代優(yōu)化。這類似于“貓鼠游戲”,深度合成和檢測在不斷學習攻防過程中會自我進化,規(guī)避上一代的對抗技術。目前,學術界和產業(yè)界均已對鑒別檢測技術的研發(fā)進行了大量投入,國內外多個科研機構和科技企業(yè)推出了檢測產品。

隨著深度合成的負面影響顯現,世界各國監(jiān)管機制的建立也成為一個趨勢。歐盟傾向于將深度合成納入既有法律框架進行規(guī)制;在美國,已有一些州通過了正式法律,對“深度偽造”進行規(guī)制,如加利福尼亞州、弗吉尼亞州和德克薩斯州;新加坡也出臺了專門法案明確主體、平臺責任;我國在2021年1月發(fā)布的《網絡音視頻服務管理規(guī)定》專門提到了不得利用深度學習技術制作并傳播虛假新聞信息,今年1月,國家網信辦發(fā)布了《互聯網信息服務深度合成管理規(guī)定(征求意見稿)》,是一份具有系統(tǒng)性、針對性和可操作性的專門管理規(guī)定。

3

專家:未來一切有價值的東西都可能被偽造

面對當前的挑戰(zhàn),如何規(guī)范深度合成技術應用、減輕技術帶來的負面影響?多位專家從倫理和治理的角度表達了自己的看法。

阿里巴巴安全感知與認知智能部負責人薛輝認為,難點主要有兩方面,一是因為深度合成技術有很大的商業(yè)價值,因此不能一刀切地禁止,而是要采取“包容審慎”的態(tài)度,但怎么確定監(jiān)管的邊界,這是一個問題。另一個問題在于,深度合成面臨持續(xù)的攻防和博弈,而攻防中往往攻擊方找到了一個點就能突破,但防御卻是相對落后的。

中國科學院自動化研究所研究員陶建華指出,目前,深度合成概念的內涵和外延并不清晰,造成監(jiān)管上的困難。“是不是用深度學習方法得到的就叫深度合成?我覺得這值得商榷。”

此外,他認為,應該更有效地管理深度合成的使用者,而不是過多地約束它的研發(fā)者。人工智能的大量技術是有兩面性的,他把技術比較刀,技術的影響取決于如何使用它。最早從事深度合成相關研究的人,很多人的動機是娛樂、改善人的生活,比如,有人想能不能讓機器自主學習媽媽的聲音,給嬰兒做朗讀,這是改善生活的方式。但也不排除一些惡意的攻擊工具。因此,對技術的監(jiān)管還是應當采用開放的方式。

浙江大學網絡空間安全學院院長任奎提出了數據集不足的問題。他介紹,當前的深度合成技術主要還是針對人,因此訓練深度合成檢測模型需要大量人臉數據,但是人臉數據和音頻數據都是高度敏感的個人信息,這部分數據很難獲取。他建議公信力比較高的非營利性機構能夠把數據梳理出來,讓合格的研究機構一起參與,這樣能夠把數據的價值最大化發(fā)揮出來,“用在正面的方向”。

不過,未來的深度合成場景可能會更加復雜。在他看來,深度合成在未來不僅僅停留在簡單的音頻、圖像和視頻,而是會用于各種各樣的偽造,而且不僅限于數字空間的偽造,在物理空間的偽造可能更加有欺騙性和致命性。“從關鍵場景來看,比如說自動駕駛,在這里我可能偽造一個場景,這個場景可能是數字的,也有可能是跟物理世界融合的方式。如果我們考慮更遠一點,比如元宇宙的概念,不見得是偽造關于人的信息,一切有價值的東西都可能被偽造,這里深度合成可能有非常多的想象空間和利用、攻擊的空間。”

北京瑞萊智慧科技有限公司首席執(zhí)行官田天認為,深度偽造的本質問題是透明度不足。在這項技術中,傳統(tǒng)的“眼見為實”受到了沖擊,因此,提高人們對深度合成技術的認知尤為重要。“對于普通觀眾來說,需要降低問題的門檻,認識到什么是深度合成,或者有簡單的工具判斷它是合成的。只有把門檻降低到所有的受眾能夠在共同的框架下認識、討論、理解這個問題的時候,它才有可能是比較健康、良性的發(fā)展,它的應用才可能更大范圍地拓展。”他說。

關鍵詞: 深度合成應用 元宇宙發(fā)展 最新趨勢方向 技術升級加速 豐富應用場景

相關新聞
專題新聞
  • 雖說萬物皆可盤 但盤得住時光的才是王牌
  • 霍爾果斯:馮小剛等明星資本大撤離
  • 開心麻花電影頻出
  • 男頻IP為何“武不動乾坤,斗不破蒼穹”
  • 《鐵血戰(zhàn)士》北美市場票房跳水 又玩壞一個大IP?

京ICP備2021034106號-51

Copyright © 2011-2020  資本網   All Rights Reserved. 聯系網站:55 16 53 8 @qq.com