Apple afirma que OpenELM no es la inteligencia sólida de Apple detrás del conflicto de datos de videos de YouTube: informe

Según se informa, Apple dijo que la IA de código abierto Efficient Language Models (OpenELM) que lanzó recientemente no se utilizó para Apple Intelligence ni para ninguna de las funciones de aprendizaje automático de la compañía. El gigante tecnológico con sede en Cupertino lanzó una versión de OpenELM en abril. La declaración se produce unos días después de que un estudio descubriera que se entrenó un modelo de inteligencia artificial en bases de datos que contienen subtítulos de cientos de miles de videos de YouTube. En particular, estos conjuntos de datos también se utilizaron para entrenar modelos de IA de Anthropic, Salesforce, Nvidia y otros.

Apple supuestamente se niega a utilizar OpenELM para Apple Intelligence

Discurso A través de 9to5Mac, el fabricante de iPhone dijo que OpenELM no utiliza ninguna de sus funciones de inteligencia artificial bajo la marca Apple Intelligence u otras funciones de aprendizaje automático. La compañía también agregó que OpenELM se creó como una contribución a la comunidad de investigación para ayudarlos a avanzar en el desarrollo de modelos de lenguaje a gran escala, como los informes.

Debido a que el modelo de IA fue diseñado con fines de investigación, no se utilizó para ninguno de los nuevos sistemas de IA internos de Apple, dijo la compañía a la publicación. En particular, OpenELM es de código abierto y los pesos de los modelos se pueden obtener en el catálogo Hugging Face de la empresa.

En el momento del lanzamiento, Apple puso a disposición la familia OpenELM de modelos de IA en dos versiones: preentrenada y disciplinada. Estos tipos también se dividen en diferentes categorías de 270 millones, 450 millones, 1,1 mil millones y 3 mil millones.

Modelos de IA entrenados con datos de YouTube

Una investigación reciente acusó a OpenELM de Apple y a varios otros modelos de IA de importantes empresas de IA de utilizar datos sin procesar de vídeos de YouTube para entrenamiento. El informe encontró que empresas como Anthropic, Salesforce, Nvidia y otras utilizaban una base de datos disponible públicamente llamada Pile, que contenía datos de vídeos de YouTube de creadores de contenido como Marques Brownlee, MrBeast, CarryMinati y más.

Si bien Apple niega el uso de IA en sus dispositivos y sistemas operativos, la portavoz de Anthropic, Jennifer Martinez, dijo a Proof News, una publicación de investigación, “The Pile incluye una porción muy pequeña de los subtítulos de YouTube… Los términos de YouTube cubren el uso específico de su plataforma, que es diferente del uso del conjunto de datos de Pile. En cuanto a la posible violación de los términos de servicio de YouTube, tendremos que remitirlo a Los autores de Pile”.

Fuente