[Signet] « Apocalypse Google »

Pourquoi et comment Google est en train de détruire son meilleur outil

Par

SpaceFox

Licence CC BY

Dans Programmation et algorithmique et Autres (informatique)

Temps de lecture estimé à moins d’une minute.

Publié vendredi 24 mai 2024 à 18h13

Dites adieu au moteur de recherche que vous utilisez quotidiennement : en 2024, les IA de Google vont vous résumer le Web, que vous le vouliez ou non. Une automutilation technique qui reflète le pouvoir absolu du monopole Google.

Chapeau de l’excellent article Apocalypse Google, une chronique de Thibault Prévost sur « Arrêt sur images ».

On pourrait rétorquer qu’en tant qu’entité productrice de contenus, « Arrêt sur images » n’a aucun intérêt à voir des résultats générés par IA (et qui ne renverraient pas vers son site) apparaitre sur un moteur de recherche. Mais l’article va beaucoup plus loin que ce simple aspect, et qui plus est est sourcé (suivez les liens).
Donc, si vous avez des remarques sur le fond, suivez les sources ; et si vous en avez encore, contactez l’auteur de l’article directement – parce que de mon côté, je ne pourrai rien pour vous.

J’aime bien cet article car il est à la fois assez exhaustif sur les problèmes, et assez clair pour être rediffusé au grand public, à tous ces gens qui ne sont pas spécialement intéressés par le fonctionnement de leur moteur de recherche et de son impact sur leur vie.

9 commentaires

romantik, samedi 25 mai 2024 à 09h47

Oh wow, utilisant des moteurs de recherche alternatifs depuis longtemps déjà, j’étais passé à côté de l’info, je suis abassourdi !

Ça veut dire que toute l’activité professionnelle, les buisiness, qui s’était monté autour du SEO (avec, je trouve, des prix exhorbitants) sont à jeter ?

Par ailleurs, Microsoft va peut-être suivre pour pas perdre la course, d’autant qu’il a le meilleur modèle actuel sous la main. Je suspecte que c’est l’origine des expérimentations causant des pannes chez tous les services utilisant son index (duckduckgo, ecosia, lilo …).

25/05/24 à 09h47

jadis @leroivi - site perso - all in all we’re just another brick in the wall

+1 -0

entwanne, samedi 25 mai 2024 à 10h11

Merci pour cet article, c’était bien intéressant à lire, même si pas très réjouissant.

Faut que je pense à noter la recette de cuisson des œufs !

25/05/24 à 10h11

entwanne — @entwanne — Un zeste de Python — La POO en Python — Notions de Python avancées — Les secrets d’un code pythonique

+0 -0

anonyme, dimanche 26 mai 2024 à 09h53

Ça veut dire que toute l’activité professionnelle, les buisiness, qui s’était monté autour du SEO (avec, je trouve, des prix exhorbitants) sont à jeter ?

À mon très humble avis, la plupart de ces services présentaient déjà une valeur assez discutable. Parce que : personne ne sait comment marche Google à part Google ; l’expérience empirique tend à montrer que sur le long terme le contenu de qualité intemporel finit par remonter (ZdS est un exemple de contenus de ce type) face aux pages sans substance mais pleines de « hacks » SEO qui marchotent pendant un petit moment seulement (et qui finissent par agacer les internautes).

26/05/24 à 09h53

+4 -0

SpaceFox, dimanche 26 mai 2024 à 10h48
Modifié

Quand je travaillais en société de service, c’était fréquent que les sociétés de SEO mandatés par deux clients différents nous donnent des indications contradictoires pour « améliorer le SEO ».

Par contre je dois mettre un bémol sur ce que dit sgble : depuis 2019 (date à laquelle Google a commencé à pourrir sa recherche), le long terme fonctionne sensiblement moins bien, et beaucoup de contenu parasite remonte (en particulier des choses qui se seraient faites invisibiliser pour cause de duplication de contenu avant 2019).

26/05/24 à 10h48
Modifié

Les textes de SpaceFox & Lisa Refur – Un Renard en Corée – Un renard au Japon – @spacefox@mastodon.spacefox.fr

+1 -0

Renault, dimanche 26 mai 2024 à 11h46

J’aime bien cet article car il est à la fois assez exhaustif sur les problèmes, et assez clair pour être rediffusé au grand public, à tous ces gens qui ne sont pas spécialement intéressés par le fonctionnement de leur moteur de recherche et de son impact sur leur vie.

Cela explique aussi les soucis autours des IA génératifs ces derniers temps. Malheureusement je peux le constater la quantité de personne qui s’en servent comme si c’était un moteur de recherche classique mais sans prendre de recul sur les réponses, ou encore qui perdent sans doute plus de temps à formuler correctement le prompt avec les infos nécessaires pour générer la tâche que de le faire à la main éventuellement complétée d’une recherche classique. Je suis tombé sur cet article à ce sujet : https://www.citationneeded.news/ai-isnt-useless/ qui est un point de vue similaire au mien sur cette techno : utile mais limité dans les cas d’usage réels, si du moins on cherche de la fiabilité dans les réponses ou processus (ce qui est en général le cas).

Ça veut dire que toute l’activité professionnelle, les buisiness, qui s’était monté autour du SEO (avec, je trouve, des prix exhorbitants) sont à jeter ?

Ils sauront se réinventer pour que par exemple lors d’une recette de cuisine ils fournissent une réponse du type :

1 kg de farine Carrefour® premier prix disponible près de chez vous (lien ici)
6 oeufs bio certifiés label rouge vendu par Carrefour® (lien ici)
Du ketchup Heinz® (disponible chez Carrefour®) Etc.

Ce que faisaient déjà les magasins pour pré remplir des paniers de produits à partir d’une recette qu’on trouve sur leur site.

Je ne vois pas de raisons pour laquelle se serait impossible à faire. Soit avec des contrats ou API fournis directement par les entités gérant ces IA pour avoir une source de revenus (tout comme les publicités pour les moteurs de recherches) ou alors en exploitant justement la recherche sur laquelle ils se baseront pour écrire le résultat.

Ce qui est étonnant ici c’est que les précédentes hypes (pensons à la blockchain, etc.) avaient plutôt épargnés les grandes entreprises du numérique. Pour l’IA (à base de LLM) ils plongent à plein dedans alors qu’ils sont bien conscients des limites (qu’ils essayent de cacher) et que manifestement c’est trop tôt pour mettre tout cela en avant. Les LLM sont sans doute une mauvaise architecture pour fournir les services qu’ils veulent vraiment fournir. Car les défauts des LLM ne semblent pas avoir de solutions identifiées pour y remédier et on ignore si cela est réellement possible.

26/05/24 à 11h46

Amateur de Logiciel Libre et de la distribution GNU/Linux Fedora. #JeSuisArius

+0 -0

SpaceFox, dimanche 26 mai 2024 à 17h20

Car les défauts des LLM ne semblent pas avoir de solutions identifiées pour y remédier et on ignore si cela est réellement possible.

C’est même pire que ça : les dernières recherches ont tendance à montrer que c’est un comportement inhérent au fonctionnement des LLM, et qu’il n’y a aucun moyen de corriger ça ; et donc qu’obtenir des IA dépourvues « d’hallucinations » demanderait une toute nouvelle technologie.

Là où ça devient lunaire, c’est quand le directeur général de Google, Sundar Pichai, commence par admettre que c’est bien un problème irrésolu, puis explique que c’est comportement inhérent au fonctionnement des LLM, et finit par explique qu’en réalité c’est une bonne chose parce que ça rends les systèmes créatifs (oui, lien TikTok, désolé). Or, si l’argument peut s’entendre pour des IA génératives (de textes, d’images, de musique…), il y a bien un endroit ou on ne veut pas de cette créativité, c’est dans les résultats d’une recherche !

Concernant le discours et la fuite en avant des grosses entreprises sur le sujet, pour moi il y a deux explications principales, qui ne sont pas mutuellement exclusives :

Un certain nombre d’acteurs sont sincèrement persuadés du bienfondé de ces technologies et du « progrès » qu’elles peuvent apporter. Ces gens sont incapables de voir les problèmes, ou de les reconnaitre comme tels (cf l’interview de Sundar Pichai ci-dessus).
Toute l’industrie a tellement investi (à cause du (1), pour éviter de se faire rouler dessus par la concurrence si par miracle sa fonctionne, tout simplement pour ne pas perdre en bourse en étant vu comme un perdant parce qu’on a pas investi) qu’elle est coincé dans un problème de couts irrécupérables d’échelle cosmique. On parle de 330 milliards de dollars investis dans ces technologies par l’industrie en entier, quel dirigeant prendra le risque de dire « OK, on arrête tout, on ne récupèrera jamais cet argent et on ne fera qu’en cramer plus » ?

26/05/24 à 17h20

Les textes de SpaceFox & Lisa Refur – Un Renard en Corée – Un renard au Japon – @spacefox@mastodon.spacefox.fr

+0 -0

germinolegrand, lundi 27 mai 2024 à 11h26

Arg… je me demandais pas plus tard que ce week-end "mais pourquoi est-ce que le titre et le résumé ne correspondent absolument pas au contenu de la page que j’ai cliquée ?"

Eh bien j’ai ma réponse, merci pour ce billet, et pas merci google

C’est le retour à un web extraordinairement fragmenté. Des sites comme Zeste de Savoir qui centralisent la connaissance humaine vont devenir encore plus précieux qu’avant.

27/05/24 à 11h26

Nouveauté C++17 : les décompositions | Nouveautés du C++14 | FYS : une bibliothèque C++ dans le domaine public

+1 -0

tacticalstrike, mercredi 12 juin 2024 à 03h10

Oh wow, utilisant des moteurs de recherche alternatifs depuis longtemps déjà, j’étais passé à côté de l’info, je suis abassourdi !

Source: romantik

Pourriez-vous me citer quelques uns de ces moteurs "alternatifs", car il existe plusieurs moteurs de recherche, mais en général, ils se basent malheureusement sur les géants du web.

12/06/24 à 03h10

+0 -0

romantik, mercredi 12 juin 2024 à 09h24

Pourriez-vous me citer quelques uns de ces moteurs "alternatifs", car il existe plusieurs moteurs de recherche, mais en général, ils se basent malheureusement sur les géants du web.

tacticalstrike

Oui, la plupart des moteurs sont des meta-moteurs de recherche. Le seul moteur de recherche réellement indépendant que j’utilise est Mojeek, attention cependant, les résultats sont souvent moins pertinent, car les géants ont quand même pondu quelque chose de solide.

12/06/24 à 09h24

jadis @leroivi - site perso - all in all we’re just another brick in the wall

+1 -0

Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte