OmniAvatar:静止画に生命を吹き込むAIデジタル・ヒューマン・テクノロジーの躍進

OmniAvatarは、浙江大学とアリババ・グループが共同開発した音声駆動型デジタル・ヒューマン・システムで、静止画、音声、テキスト・プロンプトに基づいて、自然で滑らかな全身動作動画を生成することができる。従来の "おしゃべりアバター "技術と比較すると、このシステムは体の動きの調整、高精度の音声と映像の同期、テキスト制御において画期的な進歩を遂げている。このシステムはテストされ、画質、映像の滑らかさ、口の同期においてトップクラスであることが判明しており、現在、顔と全身のアニメーションを同期して生成できる唯一のモデルである。このプロジェクトはオープンソース化されており、論文はarXivに掲載されている。