近日,米哈遊創始人蔡浩宇新公司Anuttacon團隊發佈公告,公開其新一代視頻角色表演生成模型 LPM 1.0。
視頻欣賞:
據論文介紹,LPM 1.0是一個基於170億參數擴散Transformer架構的視頻模型,主打角色表演生成能力。與傳統視頻生成模型相比,該模型不僅關注畫面生成,還嘗試實現角色在視頻中的連續表達,包括說話、傾聽和實時反應,更注重於“表演”。
該模型可以根據輸入圖像生成具有穩定身份特徵的視頻角色,在對話過程中保持外觀與行為一致,同時完成語音驅動、表情變化和動作反饋。

官網地址>>>

項目標註的領導人包括曾愛玲(Ailing Zeng)。其個人主頁顯示目前就職於Anuttacon。據悉,曾愛玲此前在騰訊混元團隊及AI Lab從事計算機視覺與生成模型相關研究工作。
負責人小紅書有自己的賬號:






本文由遊民星空製作發佈,未經允許禁止轉載。