Rendimiento de LLMs con SWE-Bench: Evaluación en programación
La rápida integración de los Modelos de Lenguaje Grandes (LLMs) en el ciclo de vida del desarrollo de software (SDLC) ha cambiado la conversación de "¿Puede la IA escribir código?" a "¿Puede la IA mantener arquitecturas complejas a escala de repositorio?". Para los Directores de Tecnología