Impossible de ne pas parler de ChatGPT à l’heure actuelle tant le buzz médiatique est fort autour de l’outil conversationnel d’OpenAI. Mais comment cet outil fonctionne-t-il ? Quels sont les mécanismes qui œuvrent dans le « ventre de la bête » ? Quelles sont ses limites potentielles ? Et surtout, question qui domine aujourd’hui dans le landerneau des moteurs de recherche : cet outil peut-il concurrencer Google à terme ? Sylvain Peyronnet, spécialiste éminemment reconnu du domaine, donne ici son analyse et ses prévisions à ce sujet.

Je travaille dans le domaine des algorithmes depuis plus de 20 ans maintenant. Mon sujet de toujours est la prise de décision face à l’incertitude et dans un contexte de grandes quantités de données. Certains des algorithmes sur lesquels j’ai travaillé font maintenant partie de ce qu’on appelle communément l’intelligence artificielle.

Pourtant, je n’aurais jamais pu imaginer ce que ces dernières années ont vu dans l’apprentissage automatique, le traitement du langage naturel, l’analyse d’images, etc. Nous vivons à une époque où des résultats exceptionnels sont présentés presque chaque semaine. Pour être honnête, j’ai l’impression de revivre les premières bonnes années du web…

Le sujet du moment est bien sûr le bien connu chatGPT. Le dernier ajout à openAI est bruyant et populaire pour sa capacité à interagir avec les humains. Personne ne peut nier que l’outil est vraiment incroyable, même si bien sûr on voit aussi ses limites dès la première utilisation.

Pour les professionnels du SEO, la révolution de l’IA est à la fois une opportunité et un risque. C’est un risque pour les éditeurs web, mais c’est une opportunité pour ceux qui ont fait appel à eux et qui pourraient y voir un moyen d’obtenir moins cher que ce qu’ils ont payé ailleurs. Pour un moteur de recherche comme Google, c’est évidemment un risque puisque Sundar Pichai, patron de Google, a même mis en place une nouvelle organisation interne pour essayer de ne pas se faire dépasser par openAI en matière d’IA.

À Lire  Mirakl, Carrefour Voyages et Ôvoyages choisissent la même agence SEO

Dans cet article, je vais vous parler de chatGPT. Qu’est-ce que c’est vraiment ? Quelles sont les limites techniques ? Combien ça coûte ? Je vais également essayer d’apporter quelques réponses à la question qui nous taraude tous : chatGPT est-il une menace potentielle pour Google ?

ChatGPT, qu’est-ce que c’est ?

ChatGPT (référence [1]) est un modèle de langage conçu – comme son nom l’indique – pour être conversationnel. Cela signifie qu’il est capable de suivre les instructions données par un humain à travers une invite (une question). Pour suivre ces instructions, le modèle a la capacité de dialoguer et d’utiliser une forme de bon sens que peut avoir un humain et qui ne se retrouve pas dans d’autres modèles (comme GPT3, par exemple).

Une autre force du modèle, pour imiter le comportement humain, est sa capacité de continuité de mémoire : chatGPT peut se souvenir de ce que vous avez dit dans les questions précédentes et élaborer des réponses basées sur cet historique de chat. Cet aspect est le plus anthropomorphique : on a parfois l’illusion de discuter avec une personne réelle, qui d’ailleurs se trompera de temps en temps dans ses réponses.

ChatGPT est le dernier d’une longue lignée de modèles de langage. Tout a commencé avec word2vec de Tomas Mikolov (alors chez Google), puis fastText du même chercheur (alors chez Facebook) et bien d’autres comme Ernie en 2019 (chez Baidu), BERT en 2018 (Google), Grover et Elmo en 2018 et 2019 (Institut Allen). Il existe aussi des modèles en France (chez Lighton).

Au fil du temps, ces modèles sont devenus de plus en plus grands et expressifs. Mais la véritable percée a été l’émergence de modèles basés sur des transformateurs dans openAI. Il est aujourd’hui le premier opérateur dans ce domaine, devant tous les autres, que ce soit pour les applications image ou texte. Leur premier modèle date de 2018, c’est GPT. Mais le grand public a commencé à s’y intéresser avec GPT2, le premier très gros modèle avec « seulement » 1,5 milliard de paramètres et un jeu de données d’apprentissage de 8 millions de pages web. Nous réalisons maintenant que GPT2 n’était finalement qu’une preuve de concept, et la véritable percée est GPT3 (voir référence [3]), un modèle avec 175 milliards de paramètres, formé sur un ensemble de données de plusieurs milliards de pages de contenu.

[Cet article est disponible dans son intégralité aux abonnés sur le site Réacteur. Pour plus d’informations : https://www.reacteur.com/2023/01/chatgpt-peut-il-detroner-google.html]

Un article écrit par Sylvain Peyronnet, concepteur de l’outil d’analyse de backlink Babbar.