Un an après sa mise en ligne, ChatGPT tient peut-être son meilleur rival. Google a dévoilé ce mercredi 6 novembre sa réponse au chatbot révolutionnaire d'OpenAI et Microsoft : Gemini, un modèle d'intelligence artificielle multimodal, capable de combiner l'image, le texte, la vidéo, le son et le code et présenté comme "le plus doué et le plus général jamais conçu" à ce jour.
Développé par DeepMind, la filiale de Google spécialisée dans l'IA, Gemini n'entend pas seulement s'imposer comme le principal concurrent de GPT-4, la dernière version du modèle derrière ChatGPT : il prétend bien le dépasser. Pris de court par l'avènement de ChatGPT l'an passé, malgré de lourds investissements réalisés de longue date dans l'IA, Google affirme que son modèle fait désormais mieux que son rival dans quasiment tous les domaines.
Gemini aurait surpassé GPT-4 dans 30 des 32 référentiels académiques de la recherche en modèles de langage. Il serait plus intelligent qu'un être humain face au test MMLU qui sert à évaluer les capacités des IA dans différents domaines (mathématiques, histoire, droit, etc.) et ferait mieux que ChatGPT dans la reconnaissance d'images. La firme de Mountain View affirme même que Gemini est capable de "raisonnements sophistiqués".
Pour appuyer ses dires, Google a diffusé une vidéo où un utilisateur montre des objets, des dessins et des vidéos à Gemini. Le modèle d'IA commente ce qu'il "voit", identifie les objets, joue de la musique et répond à des questions requérant un certain degré d'analyse, en justifiant son "raisonnement".
Face à l'image d'un canard en plastique qui doit choisir entre deux chemins - à gauche vers un autre canard dessiné sur le papier, ou à droite vers un ours menaçant - Gemini suggère le chemin de gauche car "il vaut mieux se faire des amis plutôt que des ennemis". La vidéo démontre aussi que Gemini peut reconnaître des références avec très peu de contexte, comme une scène du film Matrix jouée par une personne qui fait semblant d'éviter des balles au ralenti.
Mise à jour du 9 décembre : 24 heures après la présentation de Gemini, Google a admis que la vidéo de présentation du modèle ne reflétait pas les capacités actuelles du système mais ce vers quoi il devrait tendre. Les questions étaient posées à l'écrit à l'IA à qui ont été aussi présentées des images alors que la vidéo suggérait qu'elle était en mesure de commenter en temps réel ce qu'elle voyait. Les prompts des questions étaient plus précis que les questions posées à l'oral et le temps de latence entre les réponses a aussi été raccourci au montage.
Gemini sera décliné en trois versions trois versions Nano, Pro et Ultra pour répondre à différents usages. Gemini Nano, la version allégée, est conçue pour tourner hors-ligne, pour permettre aux utilisateurs d'utiliser l'IA sans accéder aux serveurs de Google, sur mobile, notamment. Gemini Pro a vocation à intégrer tous les services en ligne de Google, de Gmail à Google Maps en passant par le moteur de recherche Bard. Enfin, Gemini Ultra doit servir aux tâches les plus complexes, comme celles présentées dans la vidéo de démonstration.
Le public français devra encore patienter pour essayer la nouvelle IA de Google. Progressivement intégré au moteur de recherche Google Bard (en anglais) ces prochaines heures, Gemini sera ensuite lancé le 13 décembre dans une version dédiée aux développeurs, puis dans diverses applications de Google pour les utilisateurs américains. Les utilisateurs du smartphone made in Google Pixel 8 Pro auront eux la primeur pour essayer les capacités de Gemini Nano pour générer des résumés de conversations et d'entretiens, filtrer des appels ou effectuer des retouches d'images, notamment.
En combinant Gemini avec les connaissances infinies de son moteur de recherche, Google espère regagner du terrain sur ChatGPT et Microsoft, principal investisseur d'OpenAI, dans la grande bataille de l'intelligence artificielle, dont les applications commencent à intégrer de plus en plus d'outils informatiques utilisés au travail et au quotidien.
Bienvenue sur RTL
Ne manquez rien de l'actualité en activant les notifications sur votre navigateur
Cliquez sur “Autoriser” pour poursuivre votre navigation en recevant des notifications. Vous recevrez ponctuellement sous forme de notifciation des actualités RTL. Pour vous désabonner, modifier vos préférences, rendez-vous à tout moment dans le centre de notification de votre équipement.
Bienvenue sur RTL
Rejoignez la communauté RTL, RTL2 et Fun Radio pour profiter du meilleur de la radio
Je crée mon compte