Así funciona OmniXtend: la interconexión de memoria por Ethernet para acelerar el entrenamiento de inteligencia artificial
El sistema de ETRI une recursos distribuidos y permite a servidores y aceleradores acceder dinámicamente a un fondo común, lo que amplía la capacidad sin reemplazar equipos y reduce los costos de despliegue y operación en centros de datos
Escuchá el resumen
Exclusivo para suscriptores Premium

El sistema de ETRI une recursos distribuidos y permite a servidores y aceleradores acceder dinámicamente a un fondo común, lo que amplía la capacidad sin reemplazar equipos y reduce los costos de despliegue y operación en centros de datos
- La propuesta apunta a una consecuencia concreta para la infraestructura de IA: ampliar memoria sin reemplazar servidores y convertir recursos distribuidos en un único fondo compartido para cargas de trabajo cada vez más...
- PUBLICIDAD En las pruebas, el sistema mostró que, cuando la memoria disponible era insuficiente, el rendimiento de inferencia de un modelo de lenguaje grande se deterioraba
- Cómo OmniXtend unifica la memoria La arquitectura presentada por ETRI usa Ethernet estándar como tejido de interconexión de memoria...
- PUBLICIDAD La tecnología fue presentada en RISC-V Summit Europe 2025, realizado en París en mayo de 2025, y también en RISC-V Summit North America 2025, en Santa Clara, en Estados Unidos
El Instituto de Investigación en Electrónica y Telecomunicaciones (ETRI) de Corea del Sur desarrolló OmniXtend, una tecnología de memoria que busca superar el límite de capacidad de las GPU (unidades de procesamiento gráfico) y reducir la sobrecarga por movimiento de datos, dos de los principales obstáculos del entrenamiento de inteligencia artificial a gran escala, informó el portal especializado en tecnología TechXplore. La propuesta apunta a una consecuencia concreta para la infraestructura de IA: ampliar memoria sin reemplazar servidores y convertir recursos distribuidos en un único fondo compartido para cargas de trabajo cada vez más exigentes. PUBLICIDAD En las pruebas, el sistema mostró que, cuando la memoria disponible era insuficiente, el rendimiento de inferencia de un modelo de lenguaje grande se deterioraba.
Al ampliar la memoria mediante Ethernet —la tecnología de red cableada de bajo costo ya desplegada masivamente en centros de datos de todo el mundo—, ese rendimiento se recuperó en más del doble, hasta niveles similares a los de un entorno convencional con memoria suficiente. El avance llega en un momento en que la demanda de modelos de IA de gran escala y de computación de alto rendimiento crece con rapidez, mientras el volumen de datos a procesar aumenta de forma exponencial, señaló el portal especializado. PUBLICIDAD En ese escenario persiste el problema conocido como “muro de memoria”: aunque mejore la capacidad de cálculo de las GPU, la eficiencia disminuye notablemente cuando la memoria disponible no acompaña ese salto.
Cómo OmniXtend unifica la memoria La arquitectura presentada por ETRI usa Ethernet estándar como tejido de interconexión de memoria, lo que permite compartir memoria entre servidores y aceleradores y tratar recursos distribuidos como un gran “pool” unificado. En la práctica, eso desacopla recursos que antes estaban ligados de forma local al hardware y habilita una asignación dinámica y escalable para tareas de IA. PUBLICIDAD Según el portal, esta tendencia cobra cada vez más relevancia a medida que los modelos de inteligencia artificial crecen en tamaño y demandan mayores capacidades de memoria.
En ese escenario, la arquitectura de memoria compartida, concebida como un gran fondo común de recursos, empieza a perfilarse como una de las tecnologías clave para sostener la próxima generación de infraestructura destinada a la IA. PUBLICIDAD OmniXtend logró demostrar una arquitectura de memoria compartida escalable basada en ese protocolo, diseñada para combinar alto rendimiento, capacidad de expansión y eficiencia de costos en el entrenamiento de inteligencia artificial a escala hiperescalar. Al reducir la latencia en el movimiento de datos, esta tecnología permite acelerar los procesos de entrenamiento y ampliar la memoria disponible sin necesidad de reemplazar servidores, una ventaja que podría disminuir significativamente los costos de despliegue y operación en los centros de datos.
PUBLICIDAD El contraste con las arquitecturas convencionales es uno de los puntos centrales del desarrollo. Los sistemas basados en interfaces seriales de alta velocidad como PCIe enfrentan límites en distancia de conectividad entre dispositivos y en escalabilidad del sistema, mientras que la nueva tecnología aprovecha switches (equipos de red que interconectan dispositivos) convencionales para agrupar múltiples dispositivos físicamente distribuidos en un único fondo de memoria. Pruebas con modelos de lenguaje grande Para construir el sistema, los investigadores desarrollaron un nodo de expansión de memoria basado en FPGA (chips programables de hardware) y un motor de transferencia de memoria sobre Ethernet, y verificaron el funcionamiento estable del conjunto.
PUBLICIDAD En una demostración práctica, varios dispositivos conectados por ese protocolo formaron un fondo de memoria compartida y accedieron a la memoria de otros equipos en tiempo real. La validación también incluyó una carga computacional con un modelo de lenguaje grande, con el fin de comprobar si la arquitectura aportaba mejoras en un entorno real de entrenamiento de IA. El resultado fue la recuperación del rendimiento en escenarios con memoria insuficiente, una condición que suele convertirse en cuello de botella en sistemas de gran escala.
PUBLICIDAD La tecnología fue presentada en RISC-V Summit Europe 2025, realizado en París en mayo de 2025, y también en RISC-V Summit North America 2025, en Santa Clara, en Estados Unidos. De acuerdo con el portal, esa presentación atrajo atención sobre una propuesta orientada a infraestructura de IA y big data. Próximos pasos y aplicaciones previstas Además del desarrollo técnico, ETRI encabeza el Interconnect Working Group dentro de CHIPS Alliance de la Linux Foundation, donde trabaja en estándares abiertos para redes de IA y expansión de memoria.
Esa participación forma parte de la estrategia para favorecer la adopción internacional del sistema. PUBLICIDAD El instituto prevé impulsar la comercialización de la tecnología mediante su transferencia a compañías de hardware y software para centros de datos. Entre sus posibles aplicaciones figuran servidores para entrenamiento e inferencia de IA, dispositivos de expansión de memoria y switches de red, dentro del mercado de infraestructura de nueva generación.
El organismo proyecta ampliar la investigación hacia interconexiones de memoria de gran capacidad para sistemas embebidos de alta fiabilidad, como los de automóviles y barcos, y extender la arquitectura de memoria compartida a aceleradores heterogéneos como NPU (unidades de procesamiento neuronal), GPU y CPU. Kim Kang Ho, vicepresidente adjunto de la división de investigación en computación del futuro de ETRI, afirmó: “Planeamos ampliar de manera sustancial la investigación sobre tecnologías de interconexión de memoria centradas en unidades de procesamiento neuronal y aceleradores a través de nuevas iniciativas de proyectos”. “Seguiremos avanzando en la tecnología y reforzando la colaboración internacional para asegurar su adopción en sistemas de próxima generación de empresas globales de IA y semiconductores”, cerró Ho. PUBLICIDAD PUBLICIDAD
Preguntale a la nota
Hacé preguntas y la IA responde usando solo este artículo
2 preguntas restantes · Respuestas basadas en el contenido del artículo
Recibí las noticias en WhatsApp
Seguí nuestro canal para recibir lo más importante del día, directo a tu celular.
Noticias Relacionadas

La 'startup' de IA más valiosa del mundo, Anthropic roza el billón y supera a OpenAI
La compañía de inteligencia artificial Anthropic captó 65.000 millones en financiación privada, elevó su valoración a 965.000 millones y superó los 730.000 millones de OpenAI en su pugna por liderar el sector de la IA.

La sorpresa del nuevo Claude Opus 4.8 no es que sea (un poco) mejor. La sorpresa es el "solo sé que no sé nada"
No lo esperábamos tan pronto, pero aquí está Claude Opus 4.8 , la nueva versión del modelo frontera de Anthropic. Han pasado tan solo 41 días desde el lanzamiento de Claude Opus 4.7 , lo que parece dejar claro que la empresa no estaba del todo contenta con dicho modelo, que no acabó tampoco de conquistar muy buenas críticas. Con Claude Opus 4.8 lo realmente curioso no es que vuelva a establecer récords en la mayoría de benchmarks. La sorpresa es su honestidad. Es mejor, sí, pero es no es lo que

Un cohete de Blue Origin explota y se desintegra al instante. Así se ha vivido el momento
Aproximadamente a las 21:00 de la noche del día de ayer, una de las plataformas de lanzamiento de Cabo Cañaveral se vio envuelta en llamas. El culpable, el cohete New Glenn de Blue Origin: mientras realizaba una prueba de encendido estático sufrió algún fallo crítico y explotó por los aires. En estos momentos se desconoce […]

Gemini se actualiza a lo grande: nuevas voces y una mejora que vas a agradecer muchísimo
Pese al nuevo límite que está volviendo locos a los usuarios, Google continúa anunciando novedades para Gemini. La nueva actualización de la app para Android trae un par de cambios que si bien no suponen una revolución en la IA, puede mejorar mucho la experiencia de uso y ahorrarte mucho tiempo en acciones que haces […]
Comentarios
para dejar un comentario