亞洲資本網(wǎng) > 資訊 > 科技頻道 > 正文
互聯(lián)網(wǎng)科技公司加碼布局AI繪畫 專家分析未來AI繪畫的發(fā)展前景
2022-05-31 08:11:12來源: 南方都市報(bào)

——"一片向日葵花海在星空下閃爍。"

本來只是在有限的想象力之內(nèi)挑了梵高的兩幅名畫加以簡(jiǎn)單概括,結(jié)果AI吞掉這句描述后,居然就吐出了一張張極富沖擊力的圖像:

圖源:Simon_阿文 微博

沒有參考圖像,也并非簡(jiǎn)單的兩幅圖像的拼接融合,而是真正基于文字描述,在充分的想象力下,從無到有地進(jìn)行了繪畫創(chuàng)作。

而就在不到一年的時(shí)間內(nèi),這樣的AI畫手開始井噴式地出現(xiàn)——

近期在海內(nèi)外爆火的免費(fèi)AI作畫工具Disco Diffusion,輸入簡(jiǎn)單的文字描述就能在線生成圖像,其畫面之精細(xì),想象力之超絕讓不少人直呼“AI比我都浪漫”:

圖源:開發(fā)者推特

一度登上蘋果應(yīng)用商店的圖形與設(shè)計(jì)排行榜榜首的Wombo,只要下載App,上傳圖片或輸入關(guān)鍵詞,再選擇平臺(tái)給予的風(fēng)格,幾秒之后就能生成圖片,其超絕的想象力被無數(shù)用戶玩出了花:

圖源:網(wǎng)絡(luò)

還有通過聊天出畫的Midjourney,用戶進(jìn)入聊天軟件Discord,并被邀請(qǐng)到相應(yīng)的小組中后,就能像是真的與畫手隔著網(wǎng)線交流一樣,說出自己的需求,而AI也會(huì)在群中實(shí)時(shí)更新的繪畫進(jìn)度:

圖源:網(wǎng)絡(luò)

OpenAI上個(gè)月剛剛推出的Dall-E2,其生成結(jié)果的精準(zhǔn)度、對(duì)人物的識(shí)別能力震驚了整個(gè)技術(shù)圈,甚至都有讀者用這一AI出了一整本畫集,整整1000張圖片:

圖源:作者個(gè)人主頁(yè)

更不用說谷歌新鮮出爐的Imagen,不管多長(zhǎng),多具體,多不符合現(xiàn)實(shí)邏輯的離奇描述詞,都可以精準(zhǔn)地從文字生成真實(shí)準(zhǔn)確的圖像:

圖源:谷歌官網(wǎng)

驚人的技術(shù)迭代速度、破圈式的熱度、震驚了繪畫圈的色彩、構(gòu)圖、想象力和創(chuàng)作力,似乎都在表示,這些AI畫手們,正在逐漸在繪畫領(lǐng)域中掌握”畫語(yǔ)權(quán)“。

對(duì)此,有人歡欣鼓舞,認(rèn)為技術(shù)的革新將為藝術(shù)領(lǐng)域帶來全新的思考方式和改變,有人惶惶不安,擔(dān)憂來勢(shì)洶洶的AI畫手將摧毀一大批中低端繪畫崗位,甚至有人怒斥AI將藝術(shù)變?yōu)榱藛渭兊臄?shù)據(jù)游戲,使得繪畫失去了意義和靈魂......

議論連續(xù)不斷,熱度居高不下,AI繪畫這一名詞開始逐漸出圈,在谷歌的關(guān)鍵詞搜索趨勢(shì)中,AI painting的搜索熱度自去年下半旬就開始逐漸高漲,到現(xiàn)在已經(jīng)達(dá)到了一個(gè)新的高峰:

熱議之下,已經(jīng)有這樣的聲音出現(xiàn):

AI繪畫,元年已至。

···

且先不論這一發(fā)言是否正確,所謂的AI畫作,到底是嚴(yán)格按照代碼邏輯運(yùn)行,風(fēng)格單一的產(chǎn)物,是AI的隨機(jī)拼接游戲,抑或是真能如人類畫手一般依照主題構(gòu)想畫作?

AI們都畫了什么,它們又能畫多少?

AI畫手的第一批體驗(yàn)者們,當(dāng)時(shí)就抱有著這樣的疑惑。PPT設(shè)計(jì)師阿文就是其中之一。

今年4月份時(shí),他偶然看到一個(gè)畫手朋友在微博展示了一組AI作畫的作品,效果驚人,朋友作為專業(yè)畫手也給予了很高的評(píng)價(jià),他便也對(duì)這個(gè)叫做Disco Diffusion的工具起了興趣。

這是一款基于谷歌的技術(shù)框架開發(fā)的AI作畫工具,部署在谷歌Colab(一個(gè)可以通過瀏覽器編寫和執(zhí)行代碼的線上托管平臺(tái))上,訓(xùn)練畫作所需的算力也由谷歌免費(fèi)提供,而只需要修改代碼中的一個(gè)部分的文字描述,就能生成畫作:

文字描述擁有畫種描述、內(nèi)容描述、畫家描述、參考渲染方式、顏色描述五個(gè)維度,用戶不用修改代碼,而是只要從這幾個(gè)方面進(jìn)行調(diào)整和修改,就可以生成圖像。

不過,鑒于是初玩,阿文只謹(jǐn)慎地修改了默認(rèn)文本中的兩個(gè)關(guān)鍵詞:A beautiful painting of astarry night(原singular lighthouse), shining its light across asunflower sea(原tumultuous sea)by greg rutkowski and thomas kinkade, Trending on artstation.” "yellow color scheme“,也就是將默認(rèn)的”一座在驚濤駭浪中閃耀的奇異燈塔”改成了“一片在星空下閃耀的向日葵花海”。

而AI吐出的第一張圖片是這樣的:

圖源:Simon_阿文 微博

這是一張超乎了阿文想象的畫作,色彩、構(gòu)圖都擁有超絕的美感和想象力。

而Disco Diffusion本身可以根據(jù)一句描述產(chǎn)出多張不同的圖片,于是,阿文在無比期待中,迎來了掛機(jī)渲染之后的另外幾幅作品:

圖源:Simon_阿文 微博

簡(jiǎn)單的文字描述外加一點(diǎn)點(diǎn)天賜般的運(yùn)氣,誕生了數(shù)張色彩構(gòu)圖豐富大膽,如同夢(mèng)境般的畫作,最終一舉出圈,在微博超過兩萬(wàn)人轉(zhuǎn)發(fā),并紛紛表示震驚“給跪”。

也因此,大批用戶紛紛涌入,開啟了腦洞大開的AI花式作畫。

有將參考畫師改為吳冠中,直接得到一張水墨畫:

圖源:網(wǎng)絡(luò)

還有應(yīng)用了虛幻引擎風(fēng)格,生成的仿佛游戲頁(yè)面一樣的畫作:

圖源:網(wǎng)絡(luò)

當(dāng)然,偶爾也會(huì)有人喂出了一些有些詭異的圖片:

圖源:推特Mike Franchina

......

在那之后,阿文也試用了另一款叫做Midjourney的工具,同樣是“星空下的向日葵海“的描述,不過這次的生成結(jié)果則恰如其分地落在了他的想象力內(nèi):

圖源:Simon_阿文 微博

“就像是一個(gè)聽話版的Disco Diffusion。”阿文笑道。

在嘗試多次后,他覺得Midjourney的想象力是比不上Disco Diffusion的,但好處是速度夠快,五分鐘就能成圖,而且不至于像Disco Diffusion那樣,有搶奪創(chuàng)作主導(dǎo)權(quán)的“野心”,是更適合藝術(shù)創(chuàng)作者的輔助工具。

還有更多像阿文這樣的藝術(shù)創(chuàng)作者,走上了探索AI繪畫工具的道路,并開始逐步挖掘各自的潛力。

比如主陣地是移動(dòng)端的Dream,它的整體作畫風(fēng)格更偏向于夢(mèng)幻柔和:

圖源:網(wǎng)絡(luò)

而諸如DALL·E2、Imagen之類的畫手,則是在如何更準(zhǔn)確地理解文字描述、更好地組合繪畫風(fēng)格,最后生成更精確而言之有物的事物和人物的方向努力。

當(dāng)然,除了這些從無到有的“高端創(chuàng)作者”,近幾年也火過一批更加親民的AI畫手們。

比如在去年一度火爆外網(wǎng)AnimeGAN,可以實(shí)時(shí)地將人像轉(zhuǎn)為漫畫模樣,也是在線部署,火到要排隊(duì)幾個(gè)小時(shí)才能玩到:

圖源:網(wǎng)絡(luò)

去年在日推被瘋轉(zhuǎn)的AI,簡(jiǎn)陋的草圖一經(jīng)它手就會(huì)變成精致可愛的二次元萌妹:

圖源:高坂 推特視頻

還有可以任意推斷兩張人物圖像的子世代長(zhǎng)相的Artbreeder,不僅幾秒就能出圖,還可以通過超多參數(shù)微調(diào)產(chǎn)出人物的長(zhǎng)相:

圖源:網(wǎng)絡(luò)

再出圈一點(diǎn),抖音、微信或QQ中的將人物照片轉(zhuǎn)變?yōu)槠渌L(fēng)格的AI濾鏡,也能被算進(jìn)AI作畫的范疇里。

這樣看來,AI畫手們作畫內(nèi)容的范圍覆蓋之廣,比起一些人類畫手也是不遑多讓。

其屢屢出圈的熱度,更證明了在普通觀眾眼中,AI的畫作們有著足夠的沖擊力和觀賞價(jià)值。

···

接下來,讓我們換一個(gè)角度來看AI繪畫。一張成品畫作由什么組成?在現(xiàn)實(shí)中是紙張和各種材料制成的筆墨水彩,而儲(chǔ)存在電子設(shè)備中的一張圖像,本質(zhì)上則是一個(gè)像素點(diǎn)矩陣,每個(gè)都由 RGB(Red、Green、Blue)三個(gè)顏色通道組成。

圖源:網(wǎng)絡(luò)

因此,AI繪畫也就相當(dāng)于一個(gè)可以逐漸產(chǎn)生像素,進(jìn)行圖像生成的計(jì)算機(jī)模型。

模型是人工智能中的一個(gè)概念,我們可以將其通俗地理解為一種從輸入到輸出的函數(shù)。

要讓這個(gè)函數(shù)輸出我們期待的像素點(diǎn)矩陣,首先需要賦予它很多“參數(shù)”,相當(dāng)于函數(shù)中的變量,這些變量涉及繪畫中每一筆的位置、形狀、顏色,甚至是覆蓋關(guān)系、筆觸組合等多個(gè)屬性。

有了這樣一個(gè)擁有龐大“變量”的“函數(shù)”,還要再基于海量的已有圖像進(jìn)行訓(xùn)練,也就是找到效果最好,最合適的一組參數(shù)的過程。

而這樣一個(gè)繪畫模型所需的參數(shù)量和訓(xùn)練數(shù)據(jù)集非常龐大,不僅如此,也很難讓計(jì)算機(jī)去理解“創(chuàng)作”這種比較抽象的概念。

因此,誕生之初的AI作畫,說是依照邏輯執(zhí)行任務(wù)也并無不妥。

關(guān)鍵詞: 什么是AI繪畫 AI繪畫前景 梵高名畫臨摹 AI繪畫訓(xùn)練 最新繪畫應(yīng)用

相關(guān)新聞
專題新聞
  • 雖說萬(wàn)物皆可盤 但盤得住時(shí)光的才是王牌
  • 霍爾果斯:馮小剛等明星資本大撤離
  • 開心麻花電影頻出
  • 男頻IP為何“武不動(dòng)乾坤,斗不破蒼穹”
  • 《鐵血戰(zhàn)士》北美市場(chǎng)票房跳水 又玩壞一個(gè)大IP?

京ICP備2021034106號(hào)-51

Copyright © 2011-2020  資本網(wǎng)   All Rights Reserved. 聯(lián)系網(wǎng)站:55 16 53 8 @qq.com