Hunyuan3D-PolyGen:腾讯推出的美术级3D生成新突破

Un nuevo hito en la tecnología de generación 3D

Recientemente, el equipo Mixed Yuan de Tencent ha vuelto a realizar un gran avance en el campo de la generación 3D con el lanzamiento del nuevo modelo Hunyuan3D-PolyGen. Se trata del primer modelo de gran tamaño generado en 3D del sector que alcanza el nivel de las bellas artes y que no sólo presenta una serie de innovaciones a nivel técnico, sino que, lo que es más importante, muestra un gran valor comercial en su aplicación práctica. Se tiene entendido que el modelo se ha puesto en uso en el equipo interno de desarrollo de juegos de Tencent, mejorando significativamente la eficiencia de los artistas.

En comparación con los modelos generados en 3D tradicionales, la mayor característica de Hunyuan3D-PolyGen es su capacidad para generar modelos 3D que cumplen los estándares artísticos profesionales. Esto significa que los modelos generados no solo son visualmente agradables, sino que, lo que es más importante, las especificaciones técnicas pueden aplicarse directamente a escenarios profesionales como el desarrollo de juegos o la producción de cine y televisión.

Innovación tecnológica que supera las limitaciones tradicionales

Conceptos de diseño para aplicaciones prácticas

Hunyuan3D-PolyGen se diseñó con un objetivo claro: los modelos 3D generados deben poder utilizarse directamente en proyectos reales. Para ello, el equipo se centró en tres cuestiones clave:

Indicadores técnicosProblemas con los métodos tradicionalesSoluciones PolyGen
Número de superficies de controlDemasiadas caras, lo que afecta al renderizado en tiempo realControl inteligente del número de superficies para satisfacer las necesidades del juego
Calidad del cableadoEl cableado es confuso y difícil de editar en el postGenerar topologías regulares y eficientes
modelizaciónModelización integral, inconveniente para las modificaciones localesAdmite el diseño arquitectónico por componentes

Principales avances tecnológicos

Las innovaciones tecnológicas más destacables del modelo se encuentran en dos ámbitos. La primera es la mejora significativa de la capacidad para modelar geometrías complejas; el modelo es capaz de manejar objetos complejos con más de 20.000 caras, algo difícil de conseguir en los anteriores métodos autorregresivos de generación 3D. El segundo es la mejora de la estabilidad de la generación, que reduce significativamente la probabilidad de fallos de generación mediante la introducción de una estrategia de entrenamiento especializada.

Análisis de la arquitectura técnica

Marco autorregresivo de generación de redes

Hunyuan3D-PolyGen utiliza un proceso de generación autorregresivo completo, y todo el proceso puede dividirse en tres etapas clave:

  1. Fase de tokenización de la redConvierte la información de vértices y caras de una malla 3D en una secuencia de fichas comprensible para el modelo.
  2. Fase de generación inteligenteGeneración paso a paso de secuencias Token de celosía completa a partir de datos de entrada de nubes de puntos mediante modelos autorregresivos.
  3. Fase de reconstrucción estructural: vuelve a decodificar la secuencia Token generada en una estructura de malla 3D estándar

Innovaciones en la tecnología de compresión BPT

Para resolver el problema de la elevada redundancia de tokens en los métodos tradicionales, el equipo desarrolló una técnica de compresión denominada BPT (Blocked and Patchified Tokenization). Esta técnica consigue una compresión significativa mediante dos estrategias:

Optimización del índice de bloquesEl número de tokens se reduce directamente en unos 33%: al dividir el espacio 3D en una estructura de bloques regular y convertir la representación de coordenadas original (x,y,z) en la forma (ID de bloque, desplazamiento), el número de tokens se reduce directamente en unos 33%.

Compresión combinada de láminas de pastaEl sistema de representación de facetas: Al identificar los vértices compartidos de las facetas vecinas, se combinan múltiples facetas en una estructura de parches para su representación, lo que comprime aún más el Token de unos 41%.

Combinando estas dos técnicas, BPT consiguió reducir en 74% el número de Token necesarios para representar la misma malla, lo que permitió al modelo manejar geometrías más complejas.

Estrategias de optimización del aprendizaje mejorado

Para resolver el problema de la baja tolerancia a fallos y la escasa estabilidad en la generación de mallas 3D, el equipo introdujo un marco de postentrenamiento de aprendizaje por refuerzo especialmente diseñado. Este marco utiliza múltiples métricas de calidad artística como señales de recompensa, entre ellas:

  • Evaluación de la regularidad del cableado
  • Comprobación de la coherencia geométrica
  • Verificación de la integridad de la placa frontal
  • Racionalidad topológica

De este modo, el modelo aprende a generar no sólo estructuras en 3D, sino, lo que es más importante, estructuras de alta calidad que cumplen las normas profesionales.

Comparación de efectos

Introduzca el diagrama:

Efecto:

Introduzca el diagrama:

Efecto:

Introduzca el diagrama:

Efecto:

Verificación del efecto de la aplicación práctica

Comentarios auténticos de un equipo de profesionales

Según los comentarios del equipo interno de desarrollo de juegos de Tencent, Hunyuan3D-PolyGen funciona bien en proyectos reales. Los artistas informaron de que su eficiencia de modelado aumentó en más de 70% después de utilizar el modelo.Esta mejora de la eficiencia se refleja principalmente en dos aspectos: en primer lugar, un aumento significativo de la velocidad de generación del modelo inicial, y en segundo lugar, una reducción significativa de la carga de trabajo de edición y ajustes de postproducción.

Soporte de entrada versátil

El modelo muestra una excelente adaptabilidad y es capaz de manejar muchos tipos de insumos:

  • Foto únicaGenerar un modelo 3D completo directamente a partir de una imagen
  • Imágenes multivista: Admite hasta cuatro imágenes de referencia desde distintos ángulos
  • Entrada de líneagenerar estructuras 3D detalladas incluso a partir de simples dibujos lineales
  • descripción textualGeneración de los modelos 3D correspondientes directamente a partir de descripciones en lenguaje natural

Ventaja de la comparación de calidad

En comparación con los métodos existentes de retopología y topología de IA, Hunyuan3D-PolyGen muestra claras ventajas. En particular, en términos de control de facetas, el modelo es capaz de conservar más detalles del modelo utilizando menos facetas, lo que es especialmente importante para el desarrollo de juegos que requieren un equilibrio entre rendimiento y calidad.

Importancia técnica y perspectivas de futuro

Desde la perspectiva del desarrollo tecnológico, el éxito de este modelo aporta nuevas ideas para toda la industria. En particular, su innovación en algoritmos de compresión y aplicaciones de aprendizaje por refuerzo sienta las bases para posteriores trabajos de investigación. Al mismo tiempo, el éxito de este modelo en la aplicación práctica también constituye una prueba fehaciente de la profunda aplicación de la tecnología de IA en la industria creativa.

Actualmente, los usuarios pueden experimentar esta tecnología a través de la plataforma Hunyuan3D de Tencent, que ofrece 20 usos gratuitos al día. Con la mejora continua de la tecnología y la ampliación de los escenarios de aplicación, tenemos motivos para creer que herramientas de IA como Hunyuan3D-PolyGen desempeñarán un papel cada vez más importante en la futura creación de contenidos digitales, aportando cambios revolucionarios a toda la industria creativa.

Dirección de la experiencia:3d.hunyuan.tencent.com

Para más productos, visite

Más información en

ShirtAI - Inteligencia penetrante El Gran Modelo AIGC: el comienzo de una era de doble revolución en ingeniería y ciencia - Inteligencia Penetrante
Restauración 1:1 de Claude y GPT Sitio web oficial - AI Cloud Native Live Match App Global HD Sports Viewing Player (Recomendado) - Blueshirt Technology
Servicio de tránsito basado en la API oficial - GPTMeta API Ayuda, ¿alguien de ustedes puede proporcionar algunos consejos sobre cómo hacer preguntas en GPT? - Conocimientos
Tienda digital global de bienes virtuales - Global SmarTone (Feng Ling Ge) ¿Qué tan poderoso es Claude airtfacts característica que GPT al instante no huele bien? -BeepBeep

espacio publicitario

Servicio de agente de tránsito basado en API oficiales

En esta era de apertura e intercambio, OpenAI lidera una revolución en la inteligencia artificial. Ahora, anunciamos al mundo que hemos soportado completamente todos los modelos de OpenAI, por ejemplo, soportando GPT-4-ALL, GPT-4-multimodal, GPT-4-gizmo-*, etc. así como una variedad de grandes modelos de cosecha propia. Y lo que es más emocionante, ¡hemos presentado al mundo el más potente e influyente GPT-4o!

Navegación del sitio

fig. principio
Atraque a terceros
consolas
Instrucciones de uso
Supervisión en línea

Póngase en contacto con nosotros

公众号二维码

número público

企业合作二维码

Cooperación Wechat

Copyright © 2021-2024 Todos los derechos reservados 2024 | GPTMeta API