Liquid AI anuncia una base líquida de IA productiva con una huella de memoria más pequeña

Liquid AI, una inteligencia artificial (IA) con sede en Massachusetts, ha anunciado sus primeros modelos de producción de IA que no están construidos sobre la arquitectura de transformador existente. La nueva arquitectura, denominada Liquid Foundation Model (LFM), se basa en transformadores generativos preentrenados (GPT), que son la base de modelos de IA populares, como la serie GPT de OpenAI, Gemini, Copilot y otros. La puesta en marcha significa que los nuevos modelos de IA se construyen a partir de principios originales y superan a los modelos lingüísticos a gran escala (LLM) en un rango de tamaño comparable.

Nuevos modelos de base líquida de Liquid AI

La startup fue fundada por investigadores del Laboratorio de Inteligencia Artificial y Ciencias de la Computación (CSAIL) del Instituto de Tecnología de Massachusetts (MIT) en 2023 y tiene como objetivo construir nuevas arquitecturas de inteligencia artificial que puedan operar a niveles similares o superiores. .

Estos nuevos LFM son disponible con tres tamaños de parámetros de 1.3B, 3.1B y 40.3B. El último es el Modelo de Experiencia (MoE), lo que significa que está compuesto por una variedad de sublenguajes y está destinado a manejar tareas más complejas. Los LFM ya están disponibles en Liquid Stadium de la compañía, Lambda para Chat UI y API y Perplexity Labs y pronto se agregarán a Cerebras Inference. Además, se están desarrollando modelos de IA para dispositivos Nvidia, AMD, Qualcomm, Cerebras y Apple, dijo la compañía.

Los LFM también son muy diferentes de la tecnología GPT. La empresa destacó que estos modelos se construyen a partir de los principios originales. Los primeros principios son esencialmente un enfoque de resolución de problemas en el que la tecnología compleja se descompone hasta sus fundamentos y se construye a partir de ahí.

Según la startup, estos nuevos tipos de IA se basan en algo llamado unidades computacionales. En términos simples, se trata de una reorganización del sistema de indicadores y, en su lugar, la empresa utiliza el término sistema líquido. Consisten en notas breves que se centran en el desarrollo de habilidades cognitivas y de razonamiento. La startup dice que este nuevo diseño ayuda a reducir los costos de memoria durante el descubrimiento y aumenta el rendimiento de videos, audio, texto, series temporales y señales.

La compañía también dice que la ventaja de los modelos de IA basados ​​en Liquid es que sus diseños se pueden optimizar automáticamente para plataformas específicas en función de sus necesidades y tamaño de caché.

Aunque las almejas creadas por la startup son largas, su rendimiento y eficacia se pueden medir cuando los desarrolladores y las empresas comiencen a utilizarlas para los flujos de trabajo de IA. La startup no reveló la fuente de sus conjuntos de datos ni ninguna medida de seguridad agregada a los modelos de IA.

Fuente