12月5日消息,近日,騰訊混元大模型宣布文生視頻功能上線,一句話就能生成視頻。
此次開源的視頻生成大模型,參數(shù)量130億,是當(dāng)前大的視頻開源模型。
用戶只需要輸入一段描述,即可生成視頻,目前的生成視頻支持中英文雙語輸入、多種視頻尺寸以及多種視頻清晰度。
目前該模型已上線騰訊元寶APP,用戶可在AI應(yīng)用中的“AI視頻”板塊申請(qǐng)?jiān)囉谩?/strong>
企業(yè)客戶通過騰訊云提供服務(wù)接入,目前API同步開放內(nèi)測(cè)申請(qǐng)。
通過騰訊元寶APP-AI應(yīng)用-AI視頻即可使用該功能(前期需申請(qǐng))
在與國內(nèi)外多個(gè)頂尖模型的評(píng)測(cè)對(duì)比顯示,混元視頻生成模型在文本視頻一致性、運(yùn)動(dòng)質(zhì)量和畫面質(zhì)量多個(gè)維度效果領(lǐng)先,在人物、人造場(chǎng)所等場(chǎng)景下表現(xiàn)尤為出色。
騰訊混元生成視頻大模型可以實(shí)現(xiàn)超寫實(shí)畫質(zhì)、生成高度符合提示詞的視頻畫面,畫面流暢不易變形。
比如,在沖浪、跳舞等大幅度運(yùn)動(dòng)畫面的生成中,騰訊混元可以生成非常流暢、合理的運(yùn)動(dòng)鏡頭,物體不易出現(xiàn)變形;光影反射基本符合物理規(guī)律,在鏡面或者照鏡子場(chǎng)景中,可以做到鏡面內(nèi)外動(dòng)作一致。
同時(shí),模型還可以實(shí)現(xiàn)在畫面主角保持不變的情況下自動(dòng)切鏡頭,這是業(yè)界大部分模型所不具備的能力。
本文鏈接:http://www.guofajx.com/news-132875.html一句話生成視頻!騰訊混元視頻生成能力對(duì)外開放:使用教程來了