Meta NotebookLlama AI Podcast Generator lanzado como ‘herramienta de código abierto’ para competir con Google NotebookLM

Meta lanzó el domingo una nueva herramienta de inteligencia artificial (IA) de código abierto que se enfrentará a Google NotebookLM. Llamada NotebookLlama, la aplicación es un generador de podcasts impulsado por IA donde los usuarios pueden cargar un archivo PDF y la aplicación lo convertirá en un podcast de audio con dos caracteres de IA. La aplicación utiliza tres versiones diferentes de Llama 3.1 AI para completar todo el proceso. Al igual que la aplicación de Google, el podcast NotebookLlama también rastrea la conversación consecutiva entre los dos anfitriones de IA en un formato gratuito.

La herramienta Meta NotebookLlama AI utiliza tres modelos de lenguaje principales para generar podcasts de audio a partir de bloques de texto. Actualmente, la aplicación sólo acepta archivos PDF como entrada, por lo que los usuarios deberán convertir cualquier texto que tengan a PDF.

Meta NotebookHaga clic para trabajar
Crédito Crédito: Meta

NotebookLlama comienza usando Llama 3.2 1B para ordenarle al modelo que preprocese un archivo PDF y lo guarde en un archivo ‘.txt’. Luego se utiliza el modelo Llama 3.1 70B para escribir un guión de podcast utilizando la recopilación de datos de origen. El guión se reproduce utilizando un nuevo scripter que utiliza el modelo Llama 3.1 8B. Finalmente, se utiliza una herramienta personalizada para convertir texto a voz. Para ello, Meta utiliza la herramienta Parler TTS. Los interesados ​​pueden acceder a todos los recursos necesarios para producir podcasts desde el repositorio de GitHub Aquí.

Sin embargo, los modelos de IA mencionados anteriormente son recomendaciones de los desarrolladores. Los usuarios pueden optar por utilizar versiones más pequeñas para cada paso; sin embargo, los resultados pueden variar. Meta señaló que para ejecutar el sistema de inteligencia artificial con la configuración recomendada, los usuarios necesitarán una GPU con una memoria combinada de alrededor de 140 GB.

Usuario X (anteriormente conocido como Twitter). metido ejemplo de un podcast producido. En base a esto, parece que la calidad del sonido no es tan buena como la de Google NotebookLM y suena aburrido y robótico. Además, hay situaciones en las que se transfieren componentes de audio y las fuerzas de la IA terminan comunicándose entre sí.

Meta reconoce algunos de los problemas y planea mejorarlos en la próxima versión del producto de IA. La empresa enfatizó: “El modelo TTS es el límite de lo natural que esto puede sonar. Quizás esto podría mejorarse con una mejor canalización y con la ayuda de una persona con más conocimientos”.

El gigante tecnológico también planea utilizar dos LLM diferentes para escribir el guión, donde cada modelo se opondrá al otro para hacer que el podcast suene más elocuente. Esto también es parte del futuro de los desarrolladores. Además, la empresa está probando la versión Llama 405B AI para escribir artículos y agregar soporte para otros formatos de entrada y salida.

Para conocer las últimas noticias y reseñas sobre tecnología, siga Gadgets 360 en adelante incógnita, Facebook, WhatsApp, Instrumentos de cuerda y noticias de google. Para ver los últimos vídeos sobre gadgets y tecnología, suscríbete a nosotros. canal de youtube. Si quieres saber todo sobre los principales influencers, sigue nuestra casa ¿Quién es ese 360? a Instagram y YouTube.

Se confirma que el iPhone SE 4 llegará con una pantalla OLED LTPS de 6,06 pulgadas, batería de 3279 mAh y módem interno de Apple.


Ventas de la serie iPhone 16 en Indonesia bloqueadas por requisitos de inversión no cumplidos



Fuente