4 min de lecture

Le successeur de ChatGPT est officiel : que change la mise à jour GPT-4 ?

Le laboratoire de recherche en intelligence artificielle OpenAI a présenté les avancées de son nouveau modèle de langage, désormais multimodal et capable de manipuler des images.

ChatGPT (illustration)

Crédit : AFP

L'INTÉGRALE - Intelligence artificielle : avons-nous raison d'avoir peur de ChatGPT ?

00:38:00

LENGLET-CO - Comment ChatGPT pourrait révolutionner Internet

00:03:42

L'ÉCO & YOU - ChatGPT va-t-il bientôt remplacer les journalistes ?

00:03:40

292. ChatGPT : comment l'intelligence artificielle bouscule-t-elle nos vies ?

00:21:59

L'ÉCO & YOU - Faut-il avoir peur de ChatGPT ?

00:03:43

Je m'abonne à la newsletter « Infos »

C'est, en quelque sorte, le successeur de ChatGPT. Après plusieurs mois d'attente, le centre privé de recherche en intelligence artificielle OpenAI a officialisé son nouveau modèle de langage, GPT-4, qui vient succéder à GPT 3,5, la technologie à la base du fonctionnement de ChatGPT, le robot conversationnel phénomène qui a fait de l'IA une tendance technologique fondamentale en 2023.

Initialement espérée pour le 16 mars, et une conférence organisée par Microsoft et OpenAI sur la révolution de l'intelligence artificielle au travail, l'intronisation de GPT-4 s'est jouée, plus simplement, ce mardi 14 mars à la faveur de la mise en ligne d'une longue page décrivant les avancées de cette nouvelle version du programme informatique.

"Nous avons créé GPT-4, la dernière étape des efforts d'OpenAI pour développer l'apprentissage profond", résume l'entreprise. Selon elle, cette nouvelle mouture est "un grand modèle multimédia, moins doué que les humains dans de nombreux scénarios de la vie réelle, mais aussi performant que les humains dans de nombreux contextes professionnels et académiques". "Par exemple, il réussit l'examen pour devenir avocat avec un score aussi bon que les meilleurs 10%. La version précédente, GPT 3.5, était au niveau des 10% les moins bons", assure OpenAI.

GPT-4 peut désormais prendre en charge les images

Comme GPT-3.5, ce modèle de langage utilise l’apprentissage profond et la technique des réseaux neuronaux pour générer des contenus en réponse aux requêtes des utilisateurs. Mais contrairement à son prédécesseur, qui ne pouvait prendre en charge que le texte, GPT-4 se veut multimodal : il est désormais capable de manipuler des images. En clair, il peut décrire des photos et des visuels avec un haut niveau de détails ou répondre à des questions sur la base d'une image. "Si on lui donne une photo de l'intérieur d'un frigo, il peut suggérer des repas à préparer à partir de ce qu'il y a sous la main", explique le New York Times.

Le modèle linguistique à la base du fonctionnement de ChatGPT peut désormais manipuler les images

Crédit : OpenAI

Le nouveau modèle promet aussi un traitement plus fin des requêtes textuelles. "Dans une conversation informelle, la distinction entre GPT-3.5 et GPT-4 peut être subtile", indique encore OpenAI dans l'article de blog annonçant GPT-4. "La différence apparaît lorsque la complexité de la tâche atteint un certain seuil. GPT-4 est plus fiable, plus créatif et capable de gérer des instructions beaucoup plus nuancées que GPT-3.5.", promet l'entreprise. Selon les experts qui ont pu l'essayer en avant-première, GPT-4 est globalement plus précis et plus pertinent que GPT-3, même s'il lui arrive encore de faire des erreurs. Le modèle aurait aussi affiné son sens de l'humour, en démontrant une capacité à écrire "autre chose que des blagues à papa stéréotypées", d'après le New York Times.

Réservé aux clients premium d'OpenAI

Ce nouveau modèle linguistique ne va toutefois pas alimenter une nouvelle version de ChatGPT accessible au grand public dans l'immédiat. Il est seulement disponible dès à présent dans une version payante du chatbot réservée aux clients de l'entreprise OpenAI. Principal investisseur et partenaire privilégie du laboratoire de recherche, Microsoft a confirmé que le nouveau chatbot de son moteur de recherche Bing reposait déjà sur GPT-4. D'après le site spécialisé TechCrunch, le modèle est aussi utilisé par l'entreprise de paiement en ligne Stripe, pour analyser les sites de ses clients, et l'application DuoLingo, qui l'a intégré à une nouvelle formule d'apprentissage des langues par abonnement.

Rendu accessible au plus grand nombre fin novembre, ChatGPT avait fait une irruption fracassante dans le débat public en offrant une illustration concrète des dernières avancées de l’intelligence artificielle générative, qui se retrouve aujourd'hui au coeur d'une bataille entre les géants des nouvelles technologies.

Google, pionnier des recherches en IA, teste actuellement son propre chatbot conversationnel Bard, à travers lequel il promet de faire rentrer son moteur de recherche dans une nouvelle ère en combinant la puissance de ses modèles de langage et celle de ses algorithmes de recherche. Le géant américain a également annoncé mardi que sa suite bureautique Google Workspace sera prochainement enrichie de fonctions basées sur l'IA pour générer, par exemple, dans Gmail et Google Docs des résumés de réunions ou de courriels et convertir des prises de notes en présentation assorties de visuels. Ces nouveaux outils seront, eux aussi, seulement accessibles à un échantillon de testeurs avant d'être ouverts à un public plus large. De son côté, Microsoft doit annoncer de nouvelles intégrations de ChatGPT dans ses outils de bureautique lors d'une conférence jeudi.