據(jù)媒體報(bào)道,微軟亞洲研究院近期推出了一款革命性的人工智能工具VASA-1,這一工具的推出引起了業(yè)界和公眾的廣泛關(guān)注。
VASA-1的獨(dú)特之處在于,它能夠?qū)㈧o態(tài)圖像或繪畫與音頻文件結(jié)合,生成具有動(dòng)態(tài)面部表情和頭部動(dòng)作的面孔。這意味著,僅憑一張圖片和一段聲音,就能創(chuàng)造出一個(gè)仿佛真實(shí)存在的人物的形象,其嘴唇動(dòng)作甚至能與語(yǔ)音或歌曲完美匹配。
VASA-1的能力令人驚嘆,它為我們打開了一個(gè)全新的視覺(jué)體驗(yàn)世界。想象一下,在教育領(lǐng)域中,通過(guò)這一技術(shù),我們可以為學(xué)生創(chuàng)建更加生動(dòng)、立體的學(xué)習(xí)材料,從而大大提高教學(xué)效果。
在溝通方面,對(duì)于那些因各種原因無(wú)法直接交流的人,VASA-1可能成為他們表達(dá)情感和思想的新方式;甚至,它還可以為需要陪伴或治療支持的人提供虛擬的伙伴,帶來(lái)心靈上的慰藉。
然而,正如一枚硬幣有兩面,VASA-1的強(qiáng)大能力也帶來(lái)了潛在的風(fēng)險(xiǎn)。最顯著的風(fēng)險(xiǎn)在于,這項(xiàng)技術(shù)可能被濫用于創(chuàng)建深度偽造視頻。這些視頻可以逼真地模仿真實(shí)人物,讓人難以分辨真?zhèn)巍?/span>
如果不良行為者利用VASA-1制作惡意內(nèi)容或進(jìn)行錯(cuò)誤信息活動(dòng),將對(duì)社會(huì)造成極大的危害。
微軟亞洲研究院顯然已經(jīng)意識(shí)到了這一風(fēng)險(xiǎn),因此在發(fā)布VASA-1之前,他們決定采取謹(jǐn)慎的態(tài)度。
目前,他們并未公開任何在線演示、API、產(chǎn)品或相關(guān)實(shí)施細(xì)節(jié),以確保技術(shù)不會(huì)被濫用。同時(shí),他們也在積極研究如何防止不良行為者利用VASA-1進(jìn)行不正當(dāng)活動(dòng)。
值得一提的是,VASA-1的訓(xùn)練數(shù)據(jù)集是VoxCeleb2,這是一個(gè)包含超過(guò)100萬(wàn)條名人話語(yǔ)的大型數(shù)據(jù)集。
這表明VASA-1在處理真實(shí)人物的面孔時(shí)具有相當(dāng)高的準(zhǔn)確性。但令人驚訝的是,這一工具不僅適用于真實(shí)面孔的訓(xùn)練,還可以應(yīng)用于藝術(shù)照片,如《蒙娜麗莎》等。
本文鏈接:http://www.guofajx.com/news-321476.html微軟推出新型AI工具VASA-1:可將照片轉(zhuǎn)化為視頻