Saltar al contenido
Inteligencia Artificial

OpenAI y Broadcom lanzan Jalapeño, su chip IA para inferencia de LLM

OpenAI y Broadcom revelaron "Jalapeño", su primer procesador de inteligencia diseñado para acelerar la inferencia de modelos de lenguaje grandes, prometiendo hacer la IA más rápida y accesible.

Tricuatro 24 junio, 2026 3 min de lectura Agreganos en
Tamaño de texto

Nueve meses. Ese fue el tiempo récord en que OpenAI, en colaboración con Broadcom (NASDAQ: AVGO), llevó del diseño a la producción a "Jalapeño", su primer Procesador de Inteligencia. Este acelerador, presentado hoy, está diseñado para optimizar la inferencia de modelos de lenguaje grandes (LLM) y marca un paso crucial en la estrategia de OpenAI para expandir su plataforma de pila completa.

"Jalapeño" es el primer acelerador de IA en una plataforma de cómputo multigeneracional que ambas compañías están construyendo conjuntamente. Su objetivo principal es claro: hacer que la inteligencia artificial avanzada sea más rápida, más confiable y más accesible para más personas. Este chip representa una visión arquitectónica centrada en el futuro de la inferencia de LLM, según lo que OpenAI entiende de sus propios modelos y necesidades.

La entrega de "Jalapeño" al CEO de OpenAI, Sam Altman, y al presidente Greg Brockman por parte del presidente y CEO de Broadcom, Hock Tan, y el presidente Charlie Kawwas, subraya la ambición de OpenAI de construir la pila tecnológica completa detrás de sus modelos y productos. Esto implica ir más allá del software y adentrarse en el hardware, diseñando la infraestructura desde cero.

OpenAI diseñó el chip basándose en su profundo conocimiento de los fundamentos de los LLM, informada por su hoja de ruta de modelos, kernels, sistemas de servicio y necesidades de productos. Los socios Broadcom y Celestica ayudaron a industrializar la plataforma, encargándose de la implementación del chip, la integración de placas y sistemas de rack, la red de alto rendimiento y los sistemas de producción escalables.

Aunque OpenAI aún está midiendo el rendimiento final, las pruebas iniciales indican que "Jalapeño" ofrecerá un rendimiento por vatio sustancialmente mejor que las soluciones actuales de vanguardia. Las muestras de ingeniería del chip ya están ejecutando cargas de trabajo de ML en laboratorio a la frecuencia y potencia objetivo de producción, incluyendo el modelo GPT-5.3-Codex-Spark. Un informe técnico detallado sobre el rendimiento se presentará en los próximos meses.

"El mundo se está moviendo hacia una economía impulsada por el cómputo. Jalapeño es parte de nuestra estrategia de infraestructura de pila completa a largo plazo para hacer que el cómputo sea más abundante, lo que resultará en una IA más rápida, más confiable, más asequible para personas y empresas, y que podrá usarse para resolver problemas más importantes", afirmó Greg Brockman, presidente y cofundador de OpenAI.

La arquitectura de "Jalapeño" reduce el movimiento de datos y equilibra los recursos de cómputo, memoria y red para lograr una utilización real mucho más cercana al rendimiento teórico máximo. Las tecnologías de implementación de silicio y redes de Broadcom, incluido el silicio de red Tomahawk, son fundamentales para llevar esta plataforma a la producción a gran escala.

"Jalapeño" no es un acelerador de propósito general adaptado, sino un diseño desde cero para la inferencia moderna de LLM. Está pensado para combinarse con la potencia y el rendimiento de los aceleradores de IA líderes actuales, pero con una latencia más cercana a los sistemas de inferencia especializados más rápidos. Esto lo hace ideal para productos LLM interactivos a gran escala, como ChatGPT, Codex y la API.

La ventaja de la pila completa de OpenAI significa que cada capa, desde la arquitectura del chip hasta la experiencia del producto, se optimiza con el mismo objetivo: hacer que sus modelos sean más rápidos, confiables y asequibles para los usuarios. Esto crea un "efecto volante": una mejor infraestructura impulsa la eficiencia del cómputo, lo que permite un mejor entrenamiento y servicio, y en última instancia, modelos de IA más capaces.

El objetivo final de este trabajo es simple: la inferencia es el punto donde la IA llega a las personas. Cada mejora en el costo, la velocidad y la confiabilidad puede traducirse en una respuesta más rápida de ChatGPT, una tarea de Codex que requiere menos espera, un producto API más económico de construir o un acceso más confiable cuando la demanda es alta. "Jalapeño" ayuda a OpenAI a convertir su infraestructura en inteligencia útil para estudiantes, desarrolladores, pequeñas empresas e investigadores.

Este chip representa el primer paso en una plataforma de cómputo multigeneracional diseñada para un despliegue inicial a finales de 2026. Se implementará a escala de gigavatios con socios de centros de datos como Microsoft, según Hock Tan de Broadcom. Esta colaboración subraya un compromiso fundamental para escalar la infraestructura física necesaria para la próxima década de la IA.

Compartir:
También disponible en: EN

Notas relacionadas

Últimas noticias

Ver todas

Comentarios (0)

Aún no hay comentarios. ¡Sé el primero!

Solo los lectores registrados pueden comentar.