Google lanza el nuevo modelo multimedia Gemini AI

El 6 de diciembre el alfabeto Lanzada la primera fase del modelo de IA de próxima generación, mellizo. Gemini está supervisada y dirigida por su CEO, Sundar Pichai y Google Mente profunda.

Géminis es el primer tipo que supera a los expertos humanos MMLU (Comprensión masiva del lenguaje multitarea), una de las formas más populares de probar el rendimiento de los modelos de lenguaje. Gemini puede generar código basado en diferentes entradas, crear texto e imágenes combinados y pensar visualmente en todos los idiomas.

Según Sundar Pichai, director ejecutivo de… GoogleGéminis sobresale Abierto AI‘s ChatGPT. Destacó la eficiencia de Gemini en una serie de pruebas que miden el rendimiento de la IA en una variedad de tareas que involucran texto e imágenes.

También es emocionante porque Gemini Ultra es lo último en 30 de 32 estándares líderes, especialmente en estándares multimedia. Este punto de referencia de MMMU muestra el progreso realizado allí. Personalmente, encuentro emocionante acerca de MMLU. [massive multi-task language understanding], que era uno de los estándares líderes, ha superado el umbral del 90%, lo que es un logro importante. La condición técnica hace dos años era del 30 o 40%. Así que piense en lo avanzado que está este campo. Casi el 89% son expertos humanos en estos 57 temas y es el primer modelo que cruza este umbral. – Sundar Pichai

Además de sus capacidades multimedia, Gemini está diseñado para brindar eficiencia y escalabilidad. Su arquitectura permite una rápida integración con herramientas y API existentes, lo que la convierte en un potente motor para impulsar futuras innovaciones en IA. Este enfoque de código abierto fomenta la colaboración y el desarrollo en toda la comunidad de IA, acelerando el ritmo del progreso y garantizando que se aproveche plenamente el potencial de Gemini.

READ WhatsApp publica reacciones emoji, archivos más grandes y grupos enormes

Hay tres versiones principales de Géminis: Súperel más grande; primer plano, talla mediana; Y nano, que es significativamente más pequeño y más eficiente. Bard de Google, un chatbot similar a ChatGPT, funcionará con Gemini Pro. El Nano se ejecutará en el Google Pixel 8 Pro.

Las reacciones en las redes sociales han sido mixtas: algunos informaron resultados impresionantes, mientras que otros citaron alucinaciones persistentes. Melanie Mitchell«Está claro que Gemini es un sistema de inteligencia artificial muy sofisticado, pero no me queda claro que Gemini sea en realidad mucho más capaz que GPT-4», dijo un investigador de inteligencia artificial del Instituto Santa Fe en Nuevo México.

Estoy muy decepcionado con el Gemini Pro de Bard. Todavía da muy malos resultados en preguntas que ya no deberían ser difíciles con RAG. Una pregunta tan sencilla con una respuesta tan sencilla, y aún así se equivoca. – Vitor De Luca

Gemini es una familia de grandes modelos de lenguaje multimodal desarrollados por Google DeepMind y sirve como sucesor de lambda Y palma 2. El modelo recibió su nombre en relación con un proyecto de la NASA. mellizo. El modelo consta únicamente del decodificador. transformadorescon modificaciones para permitir un entrenamiento e inferencia efectivos TPU. Las imágenes de entrada pueden tener diferentes resoluciones, mientras que el vídeo se introduce como una serie de imágenes. El audio se muestrea a 16 kHz y luego se convierte en una serie de tokens mediante un modelo de voz global.

Antes de lanzar Gemini, su equipo desarrolló evaluaciones de impacto de modelos para identificar, evaluar y documentar los beneficios sociales clave y los daños potenciales asociados con el desarrollo de modelos Gemini avanzados. Sobre la base de una comprensión de los impactos conocidos y esperados, se ha desarrollado un conjunto de “políticas modelo” para guiar el desarrollo y la evaluación de modelos. Para evaluar los modelos de Gemini en comparación con las áreas de políticas y otras áreas de riesgo clave identificadas dentro de las evaluaciones de impacto, se llevó a cabo un conjunto integral de evaluaciones.

READ Apple advierte a los usuarios de iPhone que no carguen el iPhone durante la noche

También se implementaron mitigaciones en la capa de datos del modelo y también se utilizó el ajuste de instrucciones para mitigar los problemas de integridad del modelo. Para reducir AlucinacionesSe utilizaron métodos de atribución, generación de respuestas a libro cerrado y cobertura. de acuerdo a Orden Ejecutiva N° 14110 Firmado por presidente joe biden En octubre, Google dijo que compartiría los resultados de las pruebas Gemini Ultra con el gobierno federal de Estados Unidos.

Los desarrolladores que quieran saber más sobre Gemini pueden seguir leyendo. Reporte técnico Disponible por Google.

Vinicio Terrazas

«Food ninja. Freelance pop culture fanatic. Wannabe zombie maven. Twitter aficionado.»

Google lanza el nuevo modelo multimedia Gemini AI

China, Rusia y Corea del Norte aceleran el uso de IA en ciberataques, alerta Google

El Galaxy Watch Ultra 2025 de Samsung baja a su precio más bajo hasta la fecha

Saros saca partido a una de las funciones más infrautilizadas de PS5

Corridas Generales de Bilbao 2026: ya tienen fechas oficiales para la próxima Aste Nagusia

La Vía Láctea sobrevivió a una violenta batalla galáctica contra todo pronóstico científico

Amazon pone a la venta una casa prefabricada expandible de dos plantas con hasta seis dormitorios por menos de 12.000 euros

La NASA prueba helicópteros supersónicos para futuras misiones en Marte

Entradas recientes

Deja una respuesta Cancelar la respuesta

More Stories