OmniAvatar: a inovação tecnológica humana digital de IA que dá vida a fotografias estáticas

O OmniAvatar é um sistema humano digital com áudio desenvolvido conjuntamente pela Universidade de Zhejiang e pelo Grupo Alibaba, capaz de gerar vídeos de movimentos naturais e suaves de corpo inteiro com base em fotografias, áudio e instruções de texto. Em comparação com a tecnologia tradicional de "avatar falante", o sistema consegue avanços na coordenação do movimento corporal, na sincronização de alta precisão de áudio/vídeo e no controlo de texto. O sistema foi testado e considerado líder em termos de qualidade de imagem, suavidade de vídeo e sincronização da boca, sendo atualmente o único modelo que pode gerar sincronizadamente animações faciais e de corpo inteiro. O projeto é de fonte aberta e o artigo está publicado no arXiv.

Serviço de agente de trânsito baseado em APIs oficiais

Nesta era de abertura e partilha, o OpenAI lidera uma revolução na inteligência artificial. Agora, anunciamos ao mundo que suportámos totalmente todos os modelos da OpenAI, por exemplo, suportando GPT-4-ALL, GPT-4-multimodal, GPT-4-gizmo-*, etc., bem como uma variedade de grandes modelos desenvolvidos internamente. O mais interessante é que apresentámos ao mundo o mais poderoso e influente GPT-4o!

Navegação no sítio

fig. início
Atracagem de terceiros
consolas
Instruções de utilização
Monitorização em linha

Contactar-nos

公众号二维码

número público

企业合作二维码

Cooperação Wechat

Direitos de autor © 2021-2024 Todos os direitos reservados 2024 | GPTMeta API