Cursor ha introducido Composer, su primer modelo de codificación competitivo, junto con la versión 2.0 de su IDE que incluye una nueva interfaz multiagente. El modelo enfatiza la velocidad y está construido utilizando aprendizaje por refuerzo y una arquitectura de mezcla de expertos. Este lanzamiento busca desafiar a los modelos líderes de IA de las grandes empresas.
Cursor, conocido por su IDE que se asemeja a Visual Studio Code pero integra modelos de lenguaje grandes profundamente en los flujos de trabajo con un enfoque en el 'vibe coding', ha dependido durante mucho tiempo de modelos externos de proveedores como OpenAI, Google y Anthropic. Pruebas anteriores de sus propios modelos integrados quedaron por debajo de estas opciones de frontera. Ahora, con Composer, Cursor afirma ofrecer 'un modelo de frontera que es 4 veces más rápido que modelos de inteligencia similar'.
El modelo no se entrenó en conjuntos de datos estáticos, sino en desafíos de desarrollo interactivos que involucran tareas agenticas, con el objetivo de lograr precisión y adherencia a las mejores prácticas. En el Cursor-Bench interno de Cursor, Composer tiene un rendimiento inferior a los 'mejores modelos de frontera' en inteligencia, pero supera a los modelos abiertos de primer nivel y a las fronteras orientadas a la velocidad. Destaca significativamente en tokens por segundo, priorizando un rendimiento rápido.
Para fomentar la adopción, Cursor ha combinado Composer con una interfaz multiagente en la actualización de su IDE 2.0. Esta función permite a los usuarios 'ejecutar muchos agentes en paralelo sin que interfieran entre sí, impulsado por git worktrees o máquinas remotas'. Los desarrolladores pueden implementar múltiples modelos simultáneamente en la misma tarea, comparar salidas y seleccionar el mejor resultado.
Retroalimentación inicial de una muestra no representativa de desarrolladores indica que Composer no es ineficaz, pero se percibe como demasiado caro en relación con sus capacidades en comparación con modelos como Claude de Anthropic. Si Composer puede competir efectivamente con los modelos de frontera establecidos aún está por verse, ya que los desarrolladores podrían quedarse con opciones probadas. Características adicionales y correcciones aparecen en el registro de cambios 2.0 de Cursor.