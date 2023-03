C'est, en quelque sorte, le successeur de ChatGPT. Après plusieurs mois d'attente, le centre privé de recherche en intelligence artificielle OpenAI a officialisé son nouveau modèle de langage, GPT-4, qui vient succéder à GPT 3,5, la technologie à la base du fonctionnement de ChatGPT, le robot conversationnel phénomène qui a fait de l'IA une tendance technologique fondamentale en 2023.

Initialement espérée pour le 16 mars, et une conférence organisée par Microsoft et OpenAI sur la révolution de l'intelligence artificielle au travail, l'intronisation de GPT-4 s'est jouée, plus simplement, ce mardi 14 mars à la faveur de la mise en ligne d'une longue page décrivant les avancées de cette nouvelle version du programme informatique.

"Nous avons créé GPT-4, la dernière étape des efforts d'OpenAI pour développer l'apprentissage profond", résume l'entreprise. Selon elle, cette nouvelle mouture est "un grand modèle multimédia, moins doué que les humains dans de nombreux scénarios de la vie réelle, mais aussi performant que les humains dans de nombreux contextes professionnels et académiques". "Par exemple, il réussit l'examen pour devenir avocat avec un score aussi bon que les meilleurs 10%. La version précédente, GPT 3.5, était au niveau des 10% les moins bons", assure OpenAI.

GPT-4 peut désormais prendre en charge les images

Comme GPT-3.5, ce modèle de langage utilise l’apprentissage profond et la technique des réseaux neuronaux pour générer des contenus en réponse aux requêtes des utilisateurs. Mais contrairement à son prédécesseur, qui ne pouvait prendre en charge que le texte, GPT-4 se veut multimodal : il est désormais capable de manipuler des images. En clair, il peut décrire des photos et des visuels avec un haut niveau de détails ou répondre à des questions sur la base d'une image. "Si on lui donne une photo de l'intérieur d'un frigo, il peut suggérer des repas à préparer à partir de ce qu'il y a sous la main", explique le New York Times.



Le modèle linguistique à la base du fonctionnement de ChatGPT peut désormais manipuler les images Crédit : OpenAI

Le nouveau modèle promet aussi un traitement plus fin des requêtes textuelles. "Dans une conversation informelle, la distinction entre GPT-3.5 et GPT-4 peut être subtile", indique encore OpenAI dans l'article de blog annonçant GPT-4. "La différence apparaît lorsque la complexité de la tâche atteint un certain seuil. GPT-4 est plus fiable, plus créatif et capable de gérer des instructions beaucoup plus nuancées que GPT-3.5.", promet l'entreprise. Selon les experts qui ont pu l'essayer en avant-première, GPT-4 est globalement plus précis et plus pertinent que GPT-3, même s'il lui arrive encore de faire des erreurs. Le modèle aurait aussi affiné son sens de l'humour, en démontrant une capacité à écrire "autre chose que des blagues à papa stéréotypées", d'après le New York Times.

Réservé aux clients premium d'OpenAI

Ce nouveau modèle linguistique ne va toutefois pas alimenter une nouvelle version de ChatGPT accessible au grand public dans l'immédiat. Il est seulement disponible dès à présent dans une version payante du chatbot réservée aux clients de l'entreprise OpenAI. Principal investisseur et partenaire privilégie du laboratoire de recherche, Microsoft a confirmé que le nouveau chatbot de son moteur de recherche Bing reposait déjà sur GPT-4. D'après le site spécialisé TechCrunch, le modèle est aussi utilisé par l'entreprise de paiement en ligne Stripe, pour analyser les sites de ses clients, et l'application DuoLingo, qui l'a intégré à une nouvelle formule d'apprentissage des langues par abonnement.

Rendu accessible au plus grand nombre fin novembre, ChatGPT avait fait une irruption fracassante dans le débat publi