OmniAvatar:让静态照片活起来的AI数字人技术突破

OmniAvatar es un sistema humano digital acústico desarrollado conjuntamente por la Universidad de Zhejiang y Alibaba Group, capaz de generar vídeos naturales y fluidos de cuerpo entero a partir de fotos, audio y texto. En comparación con la tecnología tradicional de "avatar parlante", el sistema logra avances en la coordinación del movimiento corporal, la sincronización de audio/vídeo de alta precisión y el control de texto. El sistema ha sido probado y ha demostrado ser líder en calidad de imagen, fluidez de vídeo y sincronización de la boca, y es actualmente el único modelo que puede generar de forma sincrónica animaciones faciales y de todo el cuerpo. El proyecto es de código abierto y el artículo se ha publicado en arXiv.

Servicio de agente de tránsito basado en API oficiales

En esta era de apertura e intercambio, OpenAI lidera una revolución en la inteligencia artificial. Ahora, anunciamos al mundo que hemos soportado completamente todos los modelos de OpenAI, por ejemplo, soportando GPT-4-ALL, GPT-4-multimodal, GPT-4-gizmo-*, etc. así como una variedad de grandes modelos de cosecha propia. Y lo que es más emocionante, ¡hemos presentado al mundo el más potente e influyente GPT-4o!

Navegación del sitio

fig. principio
Atraque a terceros
consolas
Instrucciones de uso
Supervisión en línea

Póngase en contacto con nosotros

公众号二维码

número público

企业合作二维码

Cooperación Wechat

Copyright © 2021-2024 Todos los derechos reservados 2024 | GPTMeta API