Olvídate de Claude Code: Microsoft ha presentado su primera IA para programar software
Microsoft ha lanzado su primer modelo de inteligencia artificial orientado al desarrollo de software. Conocido como MAI-Code-1-Flash, la nueva IA compite contra los modelos ligeros de Anthropic, Google y otras empresas. El modelo se integra a GitHub Copilot a partir de hoy y también está disponible para usuarios individuales a través de Visual Studio Code. […]
Escuchá el resumen
Exclusivo para suscriptores Premium

Microsoft ha lanzado su primer modelo de inteligencia artificial orientado al desarrollo de software. Conocido como MAI-Code-1-Flash, la nueva IA compite contra los modelos ligeros de Anthropic, Google y otras empresas. El modelo se integra a GitHub Copilot a partir de hoy y también está disponible para usuarios individuales a través de Visual Studio Code. […]
- Conocido como MAI-Code-1-Flash, la nueva IA compite contra los modelos ligeros de Anthropic, Google y otras empresas
- MAI-Code-1-Flash vence a Claude en varias pruebas de programación Microsoft dejó claro que MAI-Code-1-Flash se diseñó con enfoque en los desarrolladores y no con escenarios artificiales que mejoran resultados en...
- No obstante, la compañía comparó su modelo contra Claude Haiku 4.5 en SWE-Bench Verified, SWE-Bench Pro, SWE-Bench Multilingual y Terminal Bench 2
- Según los primeros resultados, MAI-Code-1-Flash supera a Claude Haiku 4.5 en los cuatro benchmarks, con la diferencia más amplia en SWE-Bench Pro, donde obtiene un 51,2% frente al 35,2% del modelo de Anthropic...
Microsoft ha lanzado su primer modelo de inteligencia artificial orientado al desarrollo de software. Conocido como MAI-Code-1-Flash, la nueva IA compite contra los modelos ligeros de Anthropic, Google y otras empresas. El modelo se integra a GitHub Copilot a partir de hoy y también está disponible para usuarios individuales a través de Visual Studio Code.
A diferencia de otros modelos de código que se entrenan de forma genérica y luego se adaptan, MAI-Code-1-Flash se construyó desde cero usando los flujos de trabajo de GitHub Copilot. Eso significa que el modelo aprendió a interactuar con las herramientas, los entornos y los sistemas que los desarrolladores usan en su día a día. Microsoft señaló en su anuncio oficial que utilizó datos limpios y con licencias adecuadas para su entrenamiento. "Durante el entrenamiento, evaluamos puntos de control en tareas básicas de ingeniería de software, respuesta a preguntas sobre el repositorio, refactorización y tareas basadas en telemetría, adaptadas del uso real de GitHub Copilot", mencionó la compañía.
Una característica distintiva de MAI-Code-1-Flash es algo conocido como control adaptativo de longitud de solución. En la práctica, esto quiere decir que la IA no genera la misma cantidad de texto para una tarea sencilla que para un problema complejo. Si le pides algo directo, el modelo responderá de forma concisa, pero si el problema requiere analizar código en varios archivos o planificar cambios más amplios, invertirá más recursos en razonar antes de responder.
Según los datos de Microsoft, esto se traduce en resolver problemas difíciles con hasta un 60% menos de tokens en comparación con otros modelos, lo que reduce la latencia y hace que la experiencia de programar con Copilot se sienta más fluida. MAI-Code-1-Flash vence a Claude en varias pruebas de programación Microsoft dejó claro que MAI-Code-1-Flash se diseñó con enfoque en los desarrolladores y no con escenarios artificiales que mejoran resultados en benchmarks. No obstante, la compañía comparó su modelo contra Claude Haiku 4.5 en SWE-Bench Verified, SWE-Bench Pro, SWE-Bench Multilingual y Terminal Bench 2.
Todas se ejecutaron bajo el mismo entorno de producción que usan los desarrolladores. Según los primeros resultados, MAI-Code-1-Flash supera a Claude Haiku 4.5 en los cuatro benchmarks, con la diferencia más amplia en SWE-Bench Pro, donde obtiene un 51,2% frente al 35,2% del modelo de Anthropic, una ventaja de 16 puntos en tareas que replican situaciones reales y variadas de ingeniería de software. Más allá del código puro, Microsoft evaluó el modelo en categorías como matemáticas, ciencias, generación de código visual y seguimiento de instrucciones.
En todas supera a Claude Haiku 4.5, con las diferencias más pronunciadas en el seguimiento preciso de instrucciones, donde la ventaja llega a casi 29 puntos en IF Bench. Para medir si el modelo realmente razona o simplemente reconoce patrones memorizados, Microsoft creó una prueba de 186 preguntas distribuidas en 34 categorías. La compañía usó ciertas trampas, como versiones invertidas de problemas clásicos, tareas imposibles y escenarios sin suficiente información para dar una respuesta.
MAI-Code-1-Flash alcanzó un 85,8% de precisión ajustada en esa prueba, con un rendimiento especialmente sólido en razonamiento, instrucciones y reconocimiento de problemas sin solución posible. MAI-Code-1-Flash estará disponible a partir de hoy. Si usas GitHub Copilot en Visual Studio Code con una suscripción individual, el modelo se integrará a tu entorno sin necesidad de configurar nada.
Puedes encontrarlo directamente en el selector de modelos o dejar que se active a través del selector automático de Copilot, el cual lo elegirá cuando lo considere la opción más adecuada para la tarea.
Preguntale a la nota
Hacé preguntas y la IA responde usando solo este artículo
2 preguntas restantes · Respuestas basadas en el contenido del artículo
Recibí las noticias en WhatsApp
Seguí nuestro canal para recibir lo más importante del día, directo a tu celular.
Noticias Relacionadas

La jugada de Dogecoin que podría abrirle la puerta a cientos de millones de usuarios
Con esta alianza, House of Doge apuesta a que la moneda deje atrás su perfil especulativo y avance en pagos, transferencias y comercio digital

Microsoft lanza MAI-Thinking-1, su primera IA de razonamiento avanzado de desarrollo propio
Tal y como se rumoreaba, Microsoft ha aprovechado la keynote inaugural de su conferencia Build para introducir su primer modelo de razonamiento de desarrollo propio. Se trata de MAI-Thinking-1, que destaca especialmente por sus capacidades vinculadas con la matemática y la programación. Los de Redmond definen a MAI-Thinking-1 como un modelo de tamaño mediano. El […]

Un dron casero acaba de superar los 700 km/h. Y con ello ha puesto contra las cuerdas el récord oficial
Cuando pensamos en un dron, lo normal es imaginar un aparato que despega en vertical, se queda suspendido en el aire y nos permite grabar planos imposibles con bastante facilidad. El Blackbird no va de eso. Su objetivo es mucho más extremo: volar lo más rápido posible . En esta carrera, la estabilidad en vuelo importa menos que la eficiencia a gran velocidad, y por eso un cambio en las hélices le ha dado un sorprendente impulso. El récord oficial sigue estando en manos de Luke Bell y Mike Bell.

¿Yo Robot? Sam Altman invierte discretamente en una nueva startup para llevar robots con IA a los hogares
El CEO de OpenAI inyecta capital privado en una firma emergente orientada al desarrollo de hardware robótico doméstico gobernado por modelos multimodales.
Comentarios
para dejar un comentario