Meta está lanzando un modelo de IA que puede probar el rendimiento de otros modelos de IA

El propietario de Facebook, Meta, dijo el viernes que estaba lanzando un montón de nuevos modelos de IA de su división de investigación, incluido un “Evaluador de autoaprendizaje” que podría proporcionar una forma de utilizar menos participación humana en el proceso de desarrollo de la IA.

El lanzamiento sigue a la introducción de Meta a la herramienta en un artículo de agosto, que detalla cómo se basa en la misma “cadena de razonamiento” utilizada por los modelos O1 recientemente lanzados por OpenAI para permitirle emitir juicios confiables y muestrear respuestas.

Ese enfoque implica dividir problemas complejos en pequeños pasos lógicos y parece mejorar la precisión de las respuestas a problemas difíciles en materias como ciencias, codificación y matemáticas.

Los metainvestigadores utilizaron datos generados por IA para entrenar completamente un modelo de analista, eliminando el sesgo humano en el proceso.

La capacidad de utilizar IA para probar de manera confiable la IA sugiere una posible forma de construir agentes de IA autónomos que puedan aprender de sus errores, dijeron a Reuters los dos investigadores de Meta detrás del proyecto.

Muchos en el campo de la IA ven agentes como asistentes digitales lo suficientemente inteligentes como para realizar muchas tareas sin intervención humana.

Los modelos de autorrefuerzo pueden reducir la necesidad del método, a menudo costoso e ineficiente, que se utiliza hoy en día llamado aprendizaje reforzado a partir de la retroalimentación humana, que requiere retroalimentación de comentaristas humanos que deben tener una experiencia única en ingresar datos correctamente y verificar respuestas a preguntas complejas de matemáticas y escritura. son correctos.

“Con suerte, a medida que la IA se vuelva más humana, mejorará en la evaluación de su propio trabajo, de modo que pueda ser mejor que el humano promedio”, dijo Jason Weston, uno de los investigadores.

“La idea de aprender y poder autoevaluarse es muy importante para la idea de llegar a este nivel de IA”, dijo.

Otras empresas, incluidas Google y Anthropic, también han publicado investigaciones sobre el concepto de RLAIF, o aprendizaje reforzado a partir de comentarios de IA. Sin embargo, a diferencia de Meta, esas empresas no lanzan sus modelos para uso público.

Otras herramientas de inteligencia artificial lanzadas por Meta el viernes incluyeron una actualización del modelo de identificación Segment Anything de la compañía, una herramienta que acelera los tiempos de generación de respuestas de LLM y bases de datos que pueden usarse para ayudar a descubrir nuevas herramientas de inteligencia artificial.

© Thomson Reuters 2024

Fuente