啊?Sora火爆短片《氣球人》,也“造假”了???
背后藝術(shù)家團(tuán)隊(duì)的最新揭秘,可謂一石激起千層浪:
原來,視頻畫面并非完全由AI生成,其中有大量視覺效果需要人類后期實(shí)現(xiàn)。
be like:
這下網(wǎng)友不干了,合著大家伙兒跟OpenAI玩真心,OpenAI背后卻耍起心眼子來了:
他們含糊其辭,就是希望觀眾認(rèn)為短片完全是AI生成的,這是不是有點(diǎn)不誠實(shí)了啊。
這不是人工智能生成的視頻,而是使用了一些AI技術(shù)的視頻。
還有網(wǎng)友直接開噴:誤導(dǎo)性營銷!這是誤導(dǎo)性營銷!
究竟是怎么個(gè)事兒,咱們還是具體捋一捋。
揭秘Sora大片工作流
盡管OpenAI一開始就介紹了,《氣球人》這樣的短片出自藝術(shù)家團(tuán)隊(duì)之手,他們只是把Sora開放給了藝術(shù)家使用,但官方并未提及短片具體是如何制作而成的。
現(xiàn)在,《氣球人》背后的藝術(shù)家團(tuán)隊(duì)Shy Kids自己來了個(gè)大揭秘,內(nèi)容包括:
-視頻片段一致性如何實(shí)現(xiàn)
-他們?nèi)绾翁幚鞸ora生成的視頻素材
-Sora生成視頻的局限性及后期處理
視頻一致性
《氣球人》中主角形象的一致性可謂驚艷眾人。
但實(shí)際上吧,據(jù)Shy Kids團(tuán)隊(duì)中負(fù)責(zé)后期制作的老哥Patrick Cederberg(簡(jiǎn)稱老帕)透露,想要實(shí)現(xiàn)這種前后一致并不是寫寫提示詞就能成的。
Sora并沒有提供工具,來幫助實(shí)現(xiàn)不同鏡頭之間的主體一致性。也就是說,哪怕提示詞都是一樣的,兩次運(yùn)行的結(jié)果也會(huì)有所不同。
他們的做法是,盡可能詳細(xì)地去對(duì)主角形象進(jìn)行描述。
解釋角色的服裝以及氣球的類型是我們解決一致性問題的方法,目前Sora還沒有集成適當(dāng)?shù)墓δ軄韺?shí)現(xiàn)此類控制。
即便如此,團(tuán)隊(duì)在用Sora生成視頻素材時(shí)還是遇到了不少這樣那樣的問題。
比如,提示詞里明明寫了氣球是黃色的,但Sora生成的片段里氣球卻可能變紅。
視頻素材處理
一致性之外,老帕提到,在時(shí)間軸方面,Sora允許用戶修改關(guān)鍵幀。但這種時(shí)間控制并不精準(zhǔn),無法保證一定能實(shí)現(xiàn)預(yù)想的效果。
另外,想要實(shí)現(xiàn)這個(gè)鏡頭:
即把鏡頭焦點(diǎn)從牛仔褲一路上移到氣球頭,也得人類自己后期裁切平移畫面,因?yàn)镾ora本身不會(huì)渲染這樣的鏡頭:它總是傾向于把焦點(diǎn)集中在氣球頭上。
老帕還談到,他們?cè)趯懱崾驹~時(shí)也遇到了一些問題:
OpenAI在讓藝術(shù)家試用Sora前,并沒有考慮到真正的電影制作人是如何思考的。
簡(jiǎn)單來說,就是Sora對(duì)攝影術(shù)語(比如跟拍、平移等)的理解有限。老帕認(rèn)為,這一點(diǎn)上Sora不如Runway。
值得一提的是,盡管Sora原生支持生成1080p視頻,但老帕他們實(shí)際上生成的素材都是480p的。他們是在后期使用Topaz等工具對(duì)視頻素材進(jìn)行了超分處理。
生成速度方面,根據(jù)老帕的回憶,每次大概需要10-20分鐘的時(shí)間。
視頻后期
接下來,就到了網(wǎng)友們反應(yīng)最強(qiáng)烈的部分——后期。
前面已經(jīng)說到,Sora本身還解決不了不同視頻片段里一致性的問題。
除了氣球不一定符合設(shè)定,或許是因?yàn)橛?xùn)練數(shù)據(jù)的原因,Sora還喜歡自動(dòng)給氣球加上奇奇怪怪的人臉。
給主角生成其實(shí)并不需要的假人頭。
Sora還很堅(jiān)定地認(rèn)為氣球得帶根繩。
總而言之言而總之,這些都需要老帕上手丟到AE里,進(jìn)行后期處理。
另外,盡管Shy Kids發(fā)現(xiàn)“35mm膠卷”這樣的關(guān)鍵詞很好用,能讓Sora生成的視頻畫面風(fēng)格更一致,但藝術(shù)家們?nèi)孕枰獮樽詈蟮某善稣{(diào)色,為畫面添加顆粒和閃爍效果,以使整部影片畫面更加協(xié)調(diào)統(tǒng)一。
老帕還提到了一個(gè)有意思的細(xì)節(jié):
Sora很喜歡慢鏡頭。
我不知道為什么,但有很多鏡頭看上去都是0.5倍速和0.75倍速。
因此我們需要對(duì)大量畫面進(jìn)行調(diào)速,免得影片看上去像個(gè)大型慢動(dòng)作項(xiàng)目。
那么,Sora生成的視頻素材有多少最終被用在了影片里?
“數(shù)學(xué)很差”的老帕估計(jì)了一下,大概是300:1。
音頻方面,Sora目前還不能生成聲音,因此旁白和音樂都是團(tuán)隊(duì)自己加上去的。
版權(quán)
為了不侵犯版權(quán),OpenAI給Sora上了一些限制。
比如,你不能把提示詞寫成“35mm膠卷,未來宇宙飛船中,一名男子拿著光劍靠近”,那樣Sora會(huì)直接拒絕生成,因?yàn)檫@畫面太像《星球大戰(zhàn)》了。
哦對(duì),像什么“阿羅諾夫斯基式鏡頭”和“希區(qū)柯克變焦”也是不行的。
3人團(tuán)隊(duì)2周制作完成
該說不說,在外界卷起風(fēng)波之前,Shy Kids團(tuán)隊(duì)對(duì)于Sora的表現(xiàn)還是很滿意的。
畢竟,制作《氣球人》這樣一個(gè)高質(zhì)量短片,最后只用了他們仨1.5到2周的時(shí)間。
團(tuán)隊(duì)認(rèn)為,現(xiàn)在,對(duì)于專業(yè)的電影團(tuán)隊(duì)來說,Sora當(dāng)然還有很大進(jìn)步空間,但對(duì)于大部分人而言,Sora已經(jīng)足夠驚艷。
用老帕自己的話說:
我覺得人們應(yīng)該將Sora變成工作流里的一部分。
不過,如果他們不想跟AI沾邊,也沒關(guān)系。
對(duì)于這樣的觀點(diǎn),也有不少網(wǎng)友表示認(rèn)同,認(rèn)為Sora這樣的視頻生成AI,是對(duì)現(xiàn)有工作流很好的補(bǔ)充。
Adobe把它們集成進(jìn)軟件里,就是一個(gè)很不錯(cuò)的主意。
但,“我厭倦了OpenAI們的精美Demo營銷”。
還有網(wǎng)友不滿的點(diǎn)在于,爆火的“人工智能生成視頻”背后有大量的人類工作,他們投入數(shù)百個(gè)小時(shí)工作,卻被AI掩蓋了真實(shí)的價(jià)值。
那么,這事兒你怎么看?
參考鏈接:
[1]https://www.fxguide.com/fxfeatured/actually-using-sora/
[2]https://twitter.com/bilawalsidhu/status/1783544598259794046
本文鏈接:http://www.guofajx.com/news-222497.htmlSora大片真相:人工特效參與 被指誤導(dǎo)大眾