OmniAvatar:让静态照片活起来的AI数字人技术突破

OmniAvatar是浙江大学和阿里巴巴集团联合开发的音频驱动数字人系统,能够根据静态照片、音频及文本提示生成自然流畅的全身动态视频。相比传统“说话头像”技术,该系统在身体动作协调、高精度音视频同步和文本控制方面实现突破。经测试,其在图像质量、视频流畅度及嘴型同步等指标上均领先,是目前唯一能同步生成面部与全身动画的模型。项目已开源,论文发布于arXiv。
关注科技领域的前沿突破和革新成果,了解AI、数字人等技术如何推动行业发展和应用场景拓展。
OmniAvatar是浙江大学和阿里巴巴集团联合开发的音频驱动数字人系统,能够根据静态照片、音频及文本提示生成自然流畅的全身动态视频。相比传统“说话头像”技术,该系统在身体动作协调、高精度音视频同步和文本控制方面实现突破。经测试,其在图像质量、视频流畅度及嘴型同步等指标上均领先,是目前唯一能同步生成面部与全身动画的模型。项目已开源,论文发布于arXiv。