3 min de lecture

Google dévoile Gemini, sa nouvelle IA qui prétend dépasser ChatGPT dans tous les domaines

Google a présenté mercredi son modèle d'intelligence artificielle le plus performant à ce jour. L'entreprise californienne promet que ses capacités dépassent celles de ChatGPT.

Google prétend que son modèle d'IA Gemini est capable de raisonnements sophistiqués

Crédit : Google

495. ChatGPT fête ses un an : le monde économique a-t-il été bousculé ?

00:24:43

AUTO - Immersion à bord la voiture du futur, avec ChatGPT dans l'habitacle

00:03:48

RTL ÉVÉNEMENT - Comment ChatGPT s'applique dans notre vie de tous les jours

00:03:03

ChatGPT, la révolution en marche ?

00:21:59

Je m'abonne à la newsletter « Infos »

Un an après sa mise en ligne, ChatGPT tient peut-être son meilleur rival. Google a dévoilé ce mercredi 6 novembre sa réponse au chatbot révolutionnaire d'OpenAI et Microsoft : Gemini, un modèle d'intelligence artificielle multimodal, capable de combiner l'image, le texte, la vidéo, le son et le code et présenté comme "le plus doué et le plus général jamais conçu" à ce jour.

Développé par DeepMind, la filiale de Google spécialisée dans l'IA, Gemini n'entend pas seulement s'imposer comme le principal concurrent de GPT-4, la dernière version du modèle derrière ChatGPT : il prétend bien le dépasser. Pris de court par l'avènement de ChatGPT l'an passé, malgré de lourds investissements réalisés de longue date dans l'IA, Google affirme que son modèle fait désormais mieux que son rival dans quasiment tous les domaines.

Gemini aurait surpassé GPT-4 dans 30 des 32 référentiels académiques de la recherche en modèles de langage. Il serait plus intelligent qu'un être humain face au test MMLU qui sert à évaluer les capacités des IA dans différents domaines (mathématiques, histoire, droit, etc.) et ferait mieux que ChatGPT dans la reconnaissance d'images. La firme de Mountain View affirme même que Gemini est capable de "raisonnements sophistiqués".

Une IA capable de "raisonnements sophistiqués"

Pour appuyer ses dires, Google a diffusé une vidéo où un utilisateur montre des objets, des dessins et des vidéos à Gemini. Le modèle d'IA commente ce qu'il "voit", identifie les objets, joue de la musique et répond à des questions requérant un certain degré d'analyse, en justifiant son "raisonnement".

Face à l'image d'un canard en plastique qui doit choisir entre deux chemins - à gauche vers un autre canard dessiné sur le papier, ou à droite vers un ours menaçant - Gemini suggère le chemin de gauche car "il vaut mieux se faire des amis plutôt que des ennemis". La vidéo démontre aussi que Gemini peut reconnaître des références avec très peu de contexte, comme une scène du film Matrix jouée par une personne qui fait semblant d'éviter des balles au ralenti.

Mise à jour du 9 décembre : 24 heures après la présentation de Gemini, Google a admis que la vidéo de présentation du modèle ne reflétait pas les capacités actuelles du système mais ce vers quoi il devrait tendre. Les questions étaient posées à l'écrit à l'IA à qui ont été aussi présentées des images alors que la vidéo suggérait qu'elle était en mesure de commenter en temps réel ce qu'elle voyait. Les prompts des questions étaient plus précis que les questions posées à l'oral et le temps de latence entre les réponses a aussi été raccourci au montage.

Pas disponible tout de suite pour les internautes français

Gemini sera décliné en trois versions trois versions Nano, Pro et Ultra pour répondre à différents usages. Gemini Nano, la version allégée, est conçue pour tourner hors-ligne, pour permettre aux utilisateurs d'utiliser l'IA sans accéder aux serveurs de Google, sur mobile, notamment. Gemini Pro a vocation à intégrer tous les services en ligne de Google, de Gmail à Google Maps en passant par le moteur de recherche Bard. Enfin, Gemini Ultra doit servir aux tâches les plus complexes, comme celles présentées dans la vidéo de démonstration.

Le public français devra encore patienter pour essayer la nouvelle IA de Google. Progressivement intégré au moteur de recherche Google Bard (en anglais) ces prochaines heures, Gemini sera ensuite lancé le 13 décembre dans une version dédiée aux développeurs, puis dans diverses applications de Google pour les utilisateurs américains. Les utilisateurs du smartphone made in Google Pixel 8 Pro auront eux la primeur pour essayer les capacités de Gemini Nano pour générer des résumés de conversations et d'entretiens, filtrer des appels ou effectuer des retouches d'images, notamment.

En combinant Gemini avec les connaissances infinies de son moteur de recherche, Google espère regagner du terrain sur ChatGPT et Microsoft, principal investisseur d'OpenAI, dans la grande bataille de l'intelligence artificielle, dont les applications commencent à intégrer de plus en plus d'outils informatiques utilisés au travail et au quotidien.

La rédaction vous recommande