OpenAI y Broadcom lanzan Jalapeño, su chip IA para inferencia de LLM
OpenAI y Broadcom revelaron "Jalapeño", su primer procesador de inteligencia diseñado para acelerar la inferencia de modelos de lenguaje grandes, prometiendo hacer la IA más rápida y accesible.

Nueve meses. Ese fue el tiempo récord en que OpenAI, en colaboración con Broadcom (NASDAQ: AVGO), llevó del diseño a la producción a "Jalapeño", su primer Procesador de Inteligencia. Este acelerador, presentado hoy, está diseñado para optimizar la inferencia de modelos de lenguaje grandes (LLM) y marca un paso crucial en la estrategia de OpenAI para expandir su plataforma de pila completa.
"Jalapeño" es el primer acelerador de IA en una plataforma de cómputo multigeneracional que ambas compañías están construyendo conjuntamente. Su objetivo principal es claro: hacer que la inteligencia artificial avanzada sea más rápida, más confiable y más accesible para más personas. Este chip representa una visión arquitectónica centrada en el futuro de la inferencia de LLM, según lo que OpenAI entiende de sus propios modelos y necesidades.
La entrega de "Jalapeño" al CEO de OpenAI, Sam Altman, y al presidente Greg Brockman por parte del presidente y CEO de Broadcom, Hock Tan, y el presidente Charlie Kawwas, subraya la ambición de OpenAI de construir la pila tecnológica completa detrás de sus modelos y productos. Esto implica ir más allá del software y adentrarse en el hardware, diseñando la infraestructura desde cero.
OpenAI diseñó el chip basándose en su profundo conocimiento de los fundamentos de los LLM, informada por su hoja de ruta de modelos, kernels, sistemas de servicio y necesidades de productos. Los socios Broadcom y Celestica ayudaron a industrializar la plataforma, encargándose de la implementación del chip, la integración de placas y sistemas de rack, la red de alto rendimiento y los sistemas de producción escalables.
Aunque OpenAI aún está midiendo el rendimiento final, las pruebas iniciales indican que "Jalapeño" ofrecerá un rendimiento por vatio sustancialmente mejor que las soluciones actuales de vanguardia. Las muestras de ingeniería del chip ya están ejecutando cargas de trabajo de ML en laboratorio a la frecuencia y potencia objetivo de producción, incluyendo el modelo GPT-5.3-Codex-Spark. Un informe técnico detallado sobre el rendimiento se presentará en los próximos meses.
"El mundo se está moviendo hacia una economía impulsada por el cómputo. Jalapeño es parte de nuestra estrategia de infraestructura de pila completa a largo plazo para hacer que el cómputo sea más abundante, lo que resultará en una IA más rápida, más confiable, más asequible para personas y empresas, y que podrá usarse para resolver problemas más importantes", afirmó Greg Brockman, presidente y cofundador de OpenAI.
La arquitectura de "Jalapeño" reduce el movimiento de datos y equilibra los recursos de cómputo, memoria y red para lograr una utilización real mucho más cercana al rendimiento teórico máximo. Las tecnologías de implementación de silicio y redes de Broadcom, incluido el silicio de red Tomahawk, son fundamentales para llevar esta plataforma a la producción a gran escala.
"Jalapeño" no es un acelerador de propósito general adaptado, sino un diseño desde cero para la inferencia moderna de LLM. Está pensado para combinarse con la potencia y el rendimiento de los aceleradores de IA líderes actuales, pero con una latencia más cercana a los sistemas de inferencia especializados más rápidos. Esto lo hace ideal para productos LLM interactivos a gran escala, como ChatGPT, Codex y la API.
La ventaja de la pila completa de OpenAI significa que cada capa, desde la arquitectura del chip hasta la experiencia del producto, se optimiza con el mismo objetivo: hacer que sus modelos sean más rápidos, confiables y asequibles para los usuarios. Esto crea un "efecto volante": una mejor infraestructura impulsa la eficiencia del cómputo, lo que permite un mejor entrenamiento y servicio, y en última instancia, modelos de IA más capaces.
El objetivo final de este trabajo es simple: la inferencia es el punto donde la IA llega a las personas. Cada mejora en el costo, la velocidad y la confiabilidad puede traducirse en una respuesta más rápida de ChatGPT, una tarea de Codex que requiere menos espera, un producto API más económico de construir o un acceso más confiable cuando la demanda es alta. "Jalapeño" ayuda a OpenAI a convertir su infraestructura en inteligencia útil para estudiantes, desarrolladores, pequeñas empresas e investigadores.
Este chip representa el primer paso en una plataforma de cómputo multigeneracional diseñada para un despliegue inicial a finales de 2026. Se implementará a escala de gigavatios con socios de centros de datos como Microsoft, según Hock Tan de Broadcom. Esta colaboración subraya un compromiso fundamental para escalar la infraestructura física necesaria para la próxima década de la IA.
Temas de la nota
Notas relacionadas

La IA descifra papiro del Vesubio: revelan nuevo libro de Filodemo
Investigadores lograron leer "Filodemo, Sobre los dioses, Libro 8" de un rollo calcinado, un hito del Vesuvius Challenge que amplía el conocimiento sobre el filósofo griego.

SAP predice el fin del teclado: la IA y la voz dominarán la interacción en dos años
El CEO de SAP, Christian Klein, anticipa una revolución en la entrada de datos empresariales, marcando el ocaso del teclado tradicional frente al avance de la inteligencia artificial y el reconocimiento de voz.

Robots humanoides llegan a escuelas de EE. UU. como asistentes docentes
Un programa piloto en el distrito escolar Salamanca City Central integrará los robots M-Series y el asistente Optio de Realbotix para mejorar la participación estudiantil.
Últimas noticias
Ver todas
Silo Temporada 3: La Crítica la Declara la Mejor Entrega Hasta Ahora
La aclamada serie distópica de ciencia ficción "Silo" regresa a Apple TV este viernes, 3 de julio, con una tercera temporada que ya es elogiada por la crítica como la más destacada de la serie.

Xgimi MemoMind One: Gafas inteligentes sin cámara con IA en Kickstarter
Las nuevas gafas de Xgimi, lanzadas en Kickstarter, buscan ofrecer información privada directamente en tu visión, aunque su funcionalidad actual tiene limitaciones.

La figura de Victor de la serie Fallout se lanza en 2027
Los fans de Fallout tienen una nueva pieza de colección para sumar a su estante: la figura de Victor, el icónico Securitron, inspirada en la exitosa serie de Amazon.
Comentarios (0)
Aún no hay comentarios. ¡Sé el primero!
Solo los lectores registrados pueden comentar.