OmniAvatar: Der Durchbruch in der KI-Technologie für digitale Menschen, die Fotos zum Leben erweckt

OmniAvatar ist ein von der Universität Zhejiang und der Alibaba Group gemeinsam entwickeltes audiogesteuertes digitales Menschensystem, das in der Lage ist, natürliche und flüssige Ganzkörperbewegungsvideos auf der Grundlage von Standbildern, Audio- und Textaufforderungen zu erzeugen. Im Vergleich zur herkömmlichen "sprechenden Avatar"-Technologie erzielt das System einen Durchbruch bei der Koordination von Körperbewegungen, der hochpräzisen Audio-/Videosynchronisation und der Textsteuerung. Das System wurde getestet und als führend in Bezug auf Bildqualität, Videogeschmeidigkeit und Mundsynchronisation befunden. Es ist derzeit das einzige Modell, das synchron Gesichts- und Ganzkörperanimationen erzeugen kann. Das Projekt wurde als Open-Source-Projekt veröffentlicht und die Arbeit ist in arXiv publiziert.

Transit Agent Service basierend auf offiziellen APIs

In dieser Ära der Offenheit und des Teilens führt OpenAI eine Revolution in der künstlichen Intelligenz an. Jetzt geben wir der Welt bekannt, dass wir alle Modelle von OpenAI vollständig unterstützt haben, z.B. GPT-4-ALL, GPT-4-multimodal, GPT-4-gizmo-*, etc. sowie eine Vielzahl von selbstentwickelten großen Modellen. Am aufregendsten ist, dass wir das leistungsfähigere und einflussreichere GPT-4o in die Welt eingeführt haben!

Website-Navigation

Abb. Anfang
Andocken von Dritten
Konsolen
Anweisungen für den Gebrauch
Online-Überwachung

Kontakt

公众号二维码

öffentliche Nummer

企业合作二维码

Zusammenarbeit Wechat

Copyright © 2021-2024 Alle Rechte vorbehalten 2024 | GPTMeta API