Un nuevo hito en la tecnología de generación 3D
Recientemente, el equipo Mixed Yuan de Tencent ha vuelto a realizar un gran avance en el campo de la generación 3D con el lanzamiento del nuevo modelo Hunyuan3D-PolyGen. Se trata del primer modelo de gran tamaño generado en 3D del sector que alcanza el nivel de las bellas artes y que no sólo presenta una serie de innovaciones a nivel técnico, sino que, lo que es más importante, muestra un gran valor comercial en su aplicación práctica. Se tiene entendido que el modelo se ha puesto en uso en el equipo interno de desarrollo de juegos de Tencent, mejorando significativamente la eficiencia de los artistas.
En comparación con los modelos generados en 3D tradicionales, la mayor característica de Hunyuan3D-PolyGen es su capacidad para generar modelos 3D que cumplen los estándares artísticos profesionales. Esto significa que los modelos generados no solo son visualmente agradables, sino que, lo que es más importante, las especificaciones técnicas pueden aplicarse directamente a escenarios profesionales como el desarrollo de juegos o la producción de cine y televisión.
Innovación tecnológica que supera las limitaciones tradicionales
Conceptos de diseño para aplicaciones prácticas
Hunyuan3D-PolyGen se diseñó con un objetivo claro: los modelos 3D generados deben poder utilizarse directamente en proyectos reales. Para ello, el equipo se centró en tres cuestiones clave:
Indicadores técnicos | Problemas con los métodos tradicionales | Soluciones PolyGen |
---|---|---|
Número de superficies de control | Demasiadas caras, lo que afecta al renderizado en tiempo real | Control inteligente del número de superficies para satisfacer las necesidades del juego |
Calidad del cableado | El cableado es confuso y difícil de editar en el post | Generar topologías regulares y eficientes |
modelización | Modelización integral, inconveniente para las modificaciones locales | Admite el diseño arquitectónico por componentes |

Principales avances tecnológicos
Las innovaciones tecnológicas más destacables del modelo se encuentran en dos ámbitos. La primera es la mejora significativa de la capacidad para modelar geometrías complejas; el modelo es capaz de manejar objetos complejos con más de 20.000 caras, algo difícil de conseguir en los anteriores métodos autorregresivos de generación 3D. El segundo es la mejora de la estabilidad de la generación, que reduce significativamente la probabilidad de fallos de generación mediante la introducción de una estrategia de entrenamiento especializada.

Análisis de la arquitectura técnica
Marco autorregresivo de generación de redes
Hunyuan3D-PolyGen utiliza un proceso de generación autorregresivo completo, y todo el proceso puede dividirse en tres etapas clave:
- Fase de tokenización de la redConvierte la información de vértices y caras de una malla 3D en una secuencia de fichas comprensible para el modelo.
- Fase de generación inteligenteGeneración paso a paso de secuencias Token de celosía completa a partir de datos de entrada de nubes de puntos mediante modelos autorregresivos.
- Fase de reconstrucción estructural: vuelve a decodificar la secuencia Token generada en una estructura de malla 3D estándar

Innovaciones en la tecnología de compresión BPT
Para resolver el problema de la elevada redundancia de tokens en los métodos tradicionales, el equipo desarrolló una técnica de compresión denominada BPT (Blocked and Patchified Tokenization). Esta técnica consigue una compresión significativa mediante dos estrategias:

Optimización del índice de bloquesEl número de tokens se reduce directamente en unos 33%: al dividir el espacio 3D en una estructura de bloques regular y convertir la representación de coordenadas original (x,y,z) en la forma (ID de bloque, desplazamiento), el número de tokens se reduce directamente en unos 33%.
Compresión combinada de láminas de pastaEl sistema de representación de facetas: Al identificar los vértices compartidos de las facetas vecinas, se combinan múltiples facetas en una estructura de parches para su representación, lo que comprime aún más el Token de unos 41%.
Combinando estas dos técnicas, BPT consiguió reducir en 74% el número de Token necesarios para representar la misma malla, lo que permitió al modelo manejar geometrías más complejas.

Estrategias de optimización del aprendizaje mejorado
Para resolver el problema de la baja tolerancia a fallos y la escasa estabilidad en la generación de mallas 3D, el equipo introdujo un marco de postentrenamiento de aprendizaje por refuerzo especialmente diseñado. Este marco utiliza múltiples métricas de calidad artística como señales de recompensa, entre ellas:
- Evaluación de la regularidad del cableado
- Comprobación de la coherencia geométrica
- Verificación de la integridad de la placa frontal
- Racionalidad topológica
De este modo, el modelo aprende a generar no sólo estructuras en 3D, sino, lo que es más importante, estructuras de alta calidad que cumplen las normas profesionales.

Comparación de efectos
Introduzca el diagrama:

Efecto:

Introduzca el diagrama:

Efecto:

Introduzca el diagrama:

Efecto:

Verificación del efecto de la aplicación práctica
Comentarios auténticos de un equipo de profesionales
Según los comentarios del equipo interno de desarrollo de juegos de Tencent, Hunyuan3D-PolyGen funciona bien en proyectos reales. Los artistas informaron de que su eficiencia de modelado aumentó en más de 70% después de utilizar el modelo.Esta mejora de la eficiencia se refleja principalmente en dos aspectos: en primer lugar, un aumento significativo de la velocidad de generación del modelo inicial, y en segundo lugar, una reducción significativa de la carga de trabajo de edición y ajustes de postproducción.

Soporte de entrada versátil
El modelo muestra una excelente adaptabilidad y es capaz de manejar muchos tipos de insumos:
- Foto únicaGenerar un modelo 3D completo directamente a partir de una imagen
- Imágenes multivista: Admite hasta cuatro imágenes de referencia desde distintos ángulos
- Entrada de líneagenerar estructuras 3D detalladas incluso a partir de simples dibujos lineales
- descripción textualGeneración de los modelos 3D correspondientes directamente a partir de descripciones en lenguaje natural
Ventaja de la comparación de calidad
En comparación con los métodos existentes de retopología y topología de IA, Hunyuan3D-PolyGen muestra claras ventajas. En particular, en términos de control de facetas, el modelo es capaz de conservar más detalles del modelo utilizando menos facetas, lo que es especialmente importante para el desarrollo de juegos que requieren un equilibrio entre rendimiento y calidad.

Importancia técnica y perspectivas de futuro
Desde la perspectiva del desarrollo tecnológico, el éxito de este modelo aporta nuevas ideas para toda la industria. En particular, su innovación en algoritmos de compresión y aplicaciones de aprendizaje por refuerzo sienta las bases para posteriores trabajos de investigación. Al mismo tiempo, el éxito de este modelo en la aplicación práctica también constituye una prueba fehaciente de la profunda aplicación de la tecnología de IA en la industria creativa.
Actualmente, los usuarios pueden experimentar esta tecnología a través de la plataforma Hunyuan3D de Tencent, que ofrece 20 usos gratuitos al día. Con la mejora continua de la tecnología y la ampliación de los escenarios de aplicación, tenemos motivos para creer que herramientas de IA como Hunyuan3D-PolyGen desempeñarán un papel cada vez más importante en la futura creación de contenidos digitales, aportando cambios revolucionarios a toda la industria creativa.
Dirección de la experiencia:3d.hunyuan.tencent.com
