Saltar al contenido
Inteligencia Artificial

Microsoft lanza 7 nuevos modelos de IA con enfoque humanista y eficiencia

Microsoft presenta una ambiciosa familia de siete modelos de inteligencia artificial, desde imagen y voz hasta código, diseñados para potenciar a desarrolladores y organizaciones con un fuerte compromiso ético.

person Redacción Tricuatro calendar_month 5 junio, 2026 schedule 5 min de lectura Agreganos en

Con una impresionante suite de siete nuevos modelos de inteligencia artificial, Microsoft está redefiniendo el panorama de la IA, enfocándose en una "Superinteligencia Humanista" que busca servir a las personas y organizaciones sin reemplazarlas. La compañía ha revelado una familia diversa de capacidades de IA de vanguardia, desde la generación de imágenes y voz hasta la transcripción y la codificación, todas ellas diseñadas para priorizar el bienestar y el progreso humano.

Esta filosofía central impulsa los esfuerzos de superinteligencia de Microsoft, moldeando cada paso de su desarrollo. Como plataforma, su compromiso es mantener a los desarrolladores en la frontera absoluta de la innovación. Los nuevos modelos se construyen con una atención meticulosa a los detalles, buscando ofrecer herramientas prácticas y eficientes, ajustadas a la forma en que trabajamos en el mundo real.

Entre los lanzamientos se encuentran MAI Image 2.5 y su variante Flash, dos modelos potentes que marcan un salto cualitativo. Actualmente, ocupan el segundo lugar en el leaderboard de edición de imágenes, superando a Nano Banana 2. MAI Image 2.5 ofrece máxima fidelidad y rendimiento de nivel profesional, mientras que Flash está optimizado para cargas de trabajo de producción super eficientes. Ya están disponibles en PowerPoint y se están implementando en OneDrive, además de ser accesibles en Foundry con una calidad por dólar líder en el mercado.

MAI Transcribe 1.5 es el mejor modelo de transcripción del mundo, ofreciendo precisión de vanguardia en 43 idiomas y superando a los modelos insignia de Gemini y OpenAI.

MAI Transcribe 1.5 es el mejor modelo de transcripción del mundo, ofreciendo precisión de vanguardia en 43 idiomas y superando a los modelos insignia de Gemini y OpenAI. Optimizado para usos reales, este modelo produce transcripciones altamente precisas para cualquier caso de uso específico, cinco veces más rápido que cualquier modelo rival. Su integración ya comenzó en GitHub, Teams, Copilot y Dynamics 365 Contact Center, y también está disponible en Foundry como el modelo de transcripción más rápido, eficiente y rentable entre los hiperescaladores.

Acompañando a Transcribe, llega MAI Voice 2, el modelo más reciente de generación de voz. Destaca por su prosodia hermosa, entrega de sonido natural y un control emocional de grano fino, disponible en 15 idiomas con muchos más en camino. También se anunció Voice 2 Flash, que proporciona el mejor valor y velocidad para agentes de voz sensibles a la ultralatencia, una característica clave para 2026.

En el ámbito del razonamiento, Microsoft presenta MAI Thinking 1, su primer modelo de razonamiento. Este modelo es excepcionalmente fuerte en tareas de razonamiento y desarrollo de software (SWE), con 35 mil millones de parámetros activos MOE y una ventana de contexto de 256k. Compite en la categoría de peso mediano y, según evaluadores humanos independientes en Surge, es preferido en calidad general frente a Sonnet 4.6. Alcanzó un 97% en AME 2025 y un 53% en SWE Bench Pro, posicionándose junto a Opus 46 en el benchmark de codificación más exigente.

Lo más notable de MAI Thinking 1 es que se desarrolló desde cero sin apuntar específicamente a benchmarks ni usar destilación, garantizando un linaje de datos limpio y con licencia comercial de grado empresarial. Esto significa que se puede implementar en producción con total confianza y fiabilidad.

Finalmente, MAI Code 1 Flash es el nuevo modelo de codificación eficiente en inferencia, ajustado especialmente para VS Code y GitHub Copilot CLI. A pesar de tener solo 5 mil millones de parámetros, logra un 51% en SWE Bench Pro, acercándose a Haiku en tamaño pero con un costo menor. Este modelo ya se está implementando en VS Code y se distribuye en Foundry, además de estar disponible en OpenRouter, Fireworks y Baseten, permitiendo a los desarrolladores ajustar los pesos directamente en el ecosistema de su elección.

La seguridad y la protección están integradas desde el inicio en toda esta familia de modelos. Los modelos de voz incluyen protecciones contra la clonación no autorizada, y todo el contenido se marca con marca de agua desde cero. Microsoft también ha trabajado en reducir las "sobre-negaciones" y mejorar la representación, incluyendo a personas con discapacidades, y publicó un informe técnico detallado para una comprensión transparente de su desarrollo.

Un aspecto crucial es la co-creación de estos modelos con el propio silicio de Microsoft. MAI Thinking 1, por ejemplo, está optimizado para el chip Maia 200, logrando una mejora de rendimiento de 1.4x por vatio en comparación con el GB-200. Esta ventaja del diseño conjunto de silicio y modelo es fundamental para la eficiencia y potencia. Además, estos modelos MAI más rápidos y eficientes llegarán a los N1X en los próximos meses, prometiendo el mejor rendimiento en Windows.

Este enfoque integral, que abarca desde el silicio hasta el software, es la base de Microsoft Frontier Tuning. Permite personalizar los modelos MAI mediante su máquina de hillclimbing de pila completa, ofreciendo a los usuarios el control sobre sus propios agentes personalizados. Los entornos de aprendizaje por refuerzo (RLEs) crean agentes específicos para empresas y tareas, adaptados solo al usuario. Un modelo MAI ajustado para Excel, por ejemplo, está a la par con GPT 5.4 en benchmarks públicos y privados, siendo diez veces más eficiente en costos.

En tareas de McKinsey, los modelos MAI superaron a GPT 5.5, también con una eficiencia diez veces mayor en costos. A diferencia de otras compañías, con MAI no se "alquila" inteligencia de un modelo compartido que aprende de todos. Aquí, el usuario conserva los beneficios de sus flujos de trabajo, conocimientos y datos institucionales, controlando el modelo resultante. Los RLEs y los modelos que se construyen dentro de ellos se convierten en una "ventaja competitiva" propia del usuario, marcando una nueva era en la IA.

Finalmente, Microsoft ha anunciado una emocionante asociación con Mayo Clinic para desarrollar conjuntamente un nuevo modelo de frontera para la salud. Este modelo se implementará globalmente en hospitales y más allá, buscando ofrecer soluciones confiables y escalables. El Dr. Gianrico Farrugia, CEO de Mayo Clinic, destacó que esta colaboración permitirá crear un modelo que brinde respuestas clínicas y logísticas a pacientes, y proporcione información valiosa a los proveedores de atención médica, actuando como un miembro del equipo en tiempo real para prevenir daños y mejorar la seguridad del paciente.

Esta iniciativa busca combinar el conocimiento de los modelos de IA con la experiencia clínica de décadas de Mayo Clinic, para ofrecer soluciones de atención médica seguras, confiables y efectivas para todos. La meta principal es poner al paciente primero, entregando la más alta calidad de manera confiable y compartiéndola con el mundo, un paso concreto hacia la visión de una "Superinteligencia Humanista" controlada por los usuarios.

Compartir:
También disponible en: EN

Notas relacionadas

Últimas noticias

Ver todas

Comentarios (0)

Aún no hay comentarios. ¡Sé el primero!

Deja un comentario