(資料圖)
財聯(lián)社8月26日電,阿里開源多模態(tài)視頻生成模型通義萬相Wan2.2-S2V,僅需一張靜態(tài)圖片和一段音頻,即可生成面部表情自然、口型一致的電影級數(shù)字人視頻。該模型單次生成的視頻時長可達(dá)分鐘級。
(資料圖)
財聯(lián)社8月26日電,阿里開源多模態(tài)視頻生成模型通義萬相Wan2.2-S2V,僅需一張靜態(tài)圖片和一段音頻,即可生成面部表情自然、口型一致的電影級數(shù)字人視頻。該模型單次生成的視頻時長可達(dá)分鐘級。