OpenAI dijo que está trabajando en una nueva tecnología de razonamiento con el nombre clave ‘Strawberry’.

OpenAI, desarrollador de ChatGPT, está trabajando en una nueva forma de inteligencia artificial bajo un proyecto con el nombre en código “Strawberry”, según una persona familiarizada con el asunto y documentos internos revisados ​​por Reuters.

El proyecto, cuyos detalles aún no se han informado, será una startup patrocinada por Microsoft para demostrar que los modelos que ofrece son capaces de proporcionar capacidades de razonamiento avanzadas.

Los equipos de OpenAI están trabajando en Strawberry, según una copia de un documento reciente de OpenAI visto por Reuters en mayo. Reuters no pudo determinar la fecha exacta del documento, que describe cómo OpenAI planea utilizar Strawberry para la investigación. Una fuente describió el proyecto a Reuters como un trabajo en progreso. La agencia de noticias no puede determinar qué tan cerca está Strawberry de estar disponible públicamente.

El funcionamiento de Strawberry es un secreto celosamente guardado dentro de OpenAI, dijo la persona.

El documento describe un proyecto que utiliza modelos de Strawberry con el objetivo de ayudar a la IA de la empresa no sólo a proporcionar respuestas a preguntas, sino también a planificar con antelación el uso de la red de forma independiente y fiable. OpenAI lo llama “investigación profunda”, según la fuente. .

Esto es algo que los modelos de IA han pasado por alto hasta ahora, según entrevistas con más de una docena de investigadores de IA.

Cuando se le preguntó sobre Strawberry y los datos reportados en esta historia, un portavoz de la compañía OpenAI dijo en un comunicado: “Queremos que nuestros modelos de IA vean y comprendan el mundo como lo hacemos nosotros. La investigación continua sobre la capacidad de las innovaciones de IA es la norma en la industria, con la creencia compartida de que estos sistemas mejorarán en razonamiento con el tiempo”.

Un portavoz no respondió directamente a las preguntas sobre Strawberry.

El proyecto Strawberry se conocía como Q* y, según informó Reuters el año pasado, ya era visto dentro de la empresa como un éxito.

Dos fuentes describieron visualizaciones a principios de este año que los empleados de OpenAI les dijeron que eran demostraciones de Q*, capaces de responder preguntas científicas y matemáticas complejas donde los modelos actuales están disponibles comercialmente.

El martes, en una conferencia general, OpenAI mostró una demostración de un proyecto de investigación que, según afirma, tiene nuevas habilidades de razonamiento similares a las de los humanos, según Bloomberg. Un portavoz de OpenAI confirmó la reunión pero se negó a proporcionar detalles. Reuters no ha podido identificar el proyecto mostrado por Strawberry.

OpenAI espera que la innovación mejore en gran medida sus capacidades de razonamiento de IA, dijo una persona familiarizada con el asunto, y agregó que Strawberry incluye una forma única de procesar un modelo de IA después de haber sido entrenado ante bases de datos muy grandes.

Los investigadores entrevistados por Reuters dicen que el razonamiento es la clave para que la IA alcance la inteligencia humana o humana.

Si bien la mayoría de los idiomas ahora pueden cubrir textos gruesos y componer una prosa hermosa más rápido que cualquier ser humano, la tecnología a menudo carece de problemas comunes cuyas soluciones parecen tener sentido para los humanos, como reconocer errores lógicos y jugar al tres en raya. Cuando un modelo encuentra este tipo de problemas, a menudo “representa” información falsa.

Los investigadores de IA entrevistados por Reuters generalmente coinciden en que el razonamiento, en el contexto de la IA, implica la creación de un modelo que le permita planificar con anticipación, reflejar cómo funciona el mundo físico y abordar una amplia gama de problemas con integridad.

Mejorar el razonamiento con modelos de IA se considera la clave para desbloquear la capacidad de los modelos para realizar de todo, desde importantes descubrimientos científicos hasta el diseño y creación de nuevos software.

El director ejecutivo de OpenAI, Sam Altman, dijo a principios de este año que en la IA “las áreas de progreso más importantes serán la capacidad de razonar”.

Otras empresas como Google, Meta y Microsoft también están experimentando con diferentes formas de mejorar el razonamiento en los modelos de IA, al igual que muchos laboratorios académicos que realizan investigaciones sobre IA. Sin embargo, los investigadores difieren sobre si los modelos lingüísticos a gran escala (LLM) son capaces de incorporar conceptos y planificación a largo plazo en el proceso de predicción. Por ejemplo, uno de los pioneros de la IA moderna, Yann LeCun, que trabaja en Meta, ha afirmado repetidamente que LLM no puede razonar como un humano.

Problemas de IA

Strawberry es una parte clave de la estrategia de OpenAI para superar esos desafíos, dijo una fuente familiarizada con el asunto. Un documento visto por Reuters explica lo que Strawberry pretende hacer, pero no cómo.

En los últimos meses, la compañía ha estado diciendo en secreto a los desarrolladores y otras partes que está a punto de lanzar tecnología con capacidades de razonamiento más avanzadas, según cuatro personas familiarizadas con los anuncios de la compañía. Declinaron ser identificados porque no están autorizados a discutir asuntos privados.

Strawberry incluye un método único de lo que se conoce como “post-entrenamiento” de los modelos de IA generativa de OpenAI, o modificación de los métodos subyacentes para mejorar su rendimiento de maneras específicas después de haber sido “entrenados” en una gran cantidad de datos agregados, una de las fuentes. . dicho.

La fase de modelado posterior al entrenamiento incluye técnicas como el “ajuste fino”, una técnica utilizada en casi todas las formas de habla actuales que son multimodales, como la retroalimentación, por ejemplo, seguir sus respuestas y dar sus ejemplos. de respuestas positivas y negativas.

Strawberry tiene similitudes con el método desarrollado en Stanford en 2022 llamado “Self-Taught Reasoner” o “STAR”, una de las fuentes con conocimiento de dicho tema. sus datos de entrenamiento y, en teoría, puede usarse para encontrar patrones de habla más allá de la inteligencia del nivel humano, dijo a Reuters uno de sus creadores, el profesor de Stanford Noah Goodman.

“Creo que es emocionante y aterrador… si las cosas salen como lo hacen, tenemos algunas cosas serias en las que pensar como seres humanos”, dijo Goodman. Goodman no está afiliado a OpenAI y no está familiarizado con Strawberry.

Una de las capacidades que OpenAI pretende implementar en Strawberry son las tareas a largo plazo (LHT), dice el documento, que se refieren a tareas complejas que requieren, por ejemplo, planificar con antelación y ejecutar una serie de acciones a lo largo del tiempo. explicó la primera fuente. .

Para ello, OpenAI crea, entrena y evalúa modelos en lo que la empresa llama “investigación profunda”, según la documentación interna de OpenAI. Reuters no pudo determinar qué había en los datos ni cuánto durarían.

OpenAI quiere específicamente que sus modelos utilicen esta capacidad para buscar en la web de forma autónoma con la ayuda de un “CUA”, o agente computarizado, que puede tomar acciones basadas en sus hallazgos, según el documento y una de las fuentes. OpenAI también planea probar sus capacidades de software con ingenieros de aprendizaje automático.

© Thomson Reuters 2024

Fuente