字节跳动XVerse:革命性多主体图像生成技术深度解析

El equipo de creación inteligente de Byte Jump lanzó el modelo XVerse, que se basa en la arquitectura DiT y realiza el control independiente y preciso de múltiples sujetos en escenas complejas, incluyendo las dimensiones de gesto, estilo, luz y sombra, e identidad. Su rendimiento en el control de múltiples sujetos, la calidad estética y la similitud de identidad es excelente, y el sistema de pruebas XVerseBench construido muestra que el rendimiento es significativamente mejor que el de los productos de la competencia.XVerse puede soportar la generación dinámica, la edición interactiva y la expansión de escenas complejas en el futuro, y se espera que promueva el desarrollo de aplicaciones de la industria AIGC.