Anthropic presenta el modelo de IA Sonnet Claude 3.5 mejorado con capacidad computacional

Anthropic presentó el martes dos nuevos tipos de inteligencia artificial (IA) y nuevas capacidades de IA. La mayor inclusión es la versión actualizada del Claude 3.5 Sonnet, que se dice que ofrece puntuaciones de referencia mejoradas en varias categorías. 3.5 El nuevo Sonnet también obtiene una nueva capacidad llamada Computación, que le permitirá comprender e interactuar con las computadoras, básicamente permitiéndole controlar y completar tareas en las PC. Además, la firma de IA también anunció Claude 3.5 Haiku, el sucesor de Claude 3 Haiku.

Se anuncia el desarrollo computarizado de Claude 3.5 Sonnet

en la sala de redacción la oficina de correosAnthropic ha anunciado el Claude 3.5 Sonnet actualizado, que ofrece un rendimiento mejorado en comparación con el modelo de IA lanzado en junio. La firma de inteligencia artificial dijo que la nueva versión supera a ChatGPT-4o y Gemini 1.5 Pro en puntos de referencia como Graduate-Level Google-Proof Q&A (GPQA), Massive Multitask Language Understanding (MMLU) Pro y HumanEval orientado a la codificación.

Sin embargo, las mejoras más significativas se observaron en dos puntos de referencia: Software Engineering Benchmark (SWE-bench), que aumentó del 33,4 por ciento al 49 por ciento, y Tool-Agent-User (TAU-bench), que pasó del 62,6 por ciento a más. 69,2 por ciento. Ambos factores están relacionados con el desempeño del comportamiento de la IA.

Esta capacidad de IA funciona desde que Anthropic introdujo una nueva capacidad de Computación que permite a los modelos de IA controlar y completar tareas en las computadoras. Actualmente, esta capacidad está disponible a través de una interfaz de programación de aplicaciones (API) que solo funciona en Claude 3.5 Sonnet.

En el uso de computadoras, Claude aprende habilidades informáticas generales. Con un software especial, puede simular pulsaciones de teclas, pulsaciones de teclas y movimientos del cursor. Sumándolo a las capacidades existentes de visión por computadora de IA, el Claude 3.5 Sonnet puede ver lo que sucede en la pantalla y procesar la información para realizar ciertas tareas. La función funcionará en función de las entradas proporcionadas a la IA.

Por ejemplo, los usuarios pueden solicitar un modelo de lenguaje grande (LLM) para reservar boletos en el sitio web, completar una solicitud o descargar e instalar una aplicación. Si bien ya existen herramientas especializadas que pueden automatizar ciertas tareas de la PC, una herramienta de propósito general que funcione con el reconocimiento del lenguaje natural es un paso importante para la tecnología impulsada por la IA.

Sin embargo, Anthropic reconoce que esta capacidad aún está en su infancia y tiene algunas limitaciones. La compañía enfatizó que: “Algunas cosas que la gente hace sin esfuerzo (desplazarse, arrastrar, hacer zoom) ahora presentan problemas para Claude. Actualmente, se recomienda que los desarrolladores utilicen esta capacidad sólo para trabajos de bajo riesgo”.

Con la capacidad de controlar la computadora, existe preocupación sobre si se puede diseñar un modelo de IA para realizar actividades peligrosas e ilegales. La compañía aún no ha revelado detalles sobre la seguridad del modelo de IA y la protección del usuario. En particular, el Claude 3.5 Sonnet actualizado está disponible para todos los usuarios y los desarrolladores pueden aprovechar esta capacidad con Anthropic API, Amazon Bedrock y Vertex AI de Google Cloud.

Claude 3.5 Haiku publicado

Otro gran anuncio fue la apertura de Claude 3.5 Haiku. Por contexto, Haiku es la serie de modelos de IA más barata y rápida que ofrece Anthropic. La firma de IA afirma ahora que las capacidades del sucesor del Claude 3 Haiku superan al Claude 3 Opus, el modelo insignia de la compañía. Esto significa que los usuarios ahora pueden obtener una versión potente de IA a un precio muy asequible.

Claude 3.5 Haiku se lanzará a finales de este mes en varias plataformas, incluida la API de la compañía, Amazon Bedrock y Vertex AI de Google Cloud. Inicialmente estará disponible solo como texto y luego se actualizará para aceptar imágenes incrustadas.

Fuente