Publicité, votre contenu continue ci-dessous
Le code source d’une partie des services du géant technologique russe Yandex a fuité sur la Toile. Une mine d’or pour de nombreux experts, qui commencent déjà à analyser la conception des algorithmes.
Une fuite révèle les critères SEO de Yandex.© Getty Images / Eugene Mymrin
Une fuite révèle les critères SEO de Yandex.
44,71 Go. C’est la taille des fichiers de code source prétendument volés à Yandex, le moteur de recherche le plus utilisé en Russie. L’archive contenant les données a été publiée sur un forum populaire auprès des cybercriminels le 25 janvier. Borderline2023, l’utilisateur à l’origine de la publication, affirme que les documents ont été téléchargés par lui en juillet 2022.
Du code « récent »
Tout le code source développé par l’entreprise serait présent dans ces fichiers. L’archive contiendrait « du code source certainement récent », destiné aux « services de l’entreprise », selon une analyse de l’ingénieur logiciel Arseni Chestakov. Carte interactive, messagerie, stockage en ligne, service de taxi (type Uber)… Le code source d’au moins 13 services appartenant à Yandex aurait fuité, selon l’analyste, qui a pu confirmer l’information auprès des employés de l’entreprise.
Le code source de Yandex dévoilé sur le forum des pirates. © Capture d’écran
Fuite du code source de Yandex sur le forum des hackers.
Plus intéressant encore, les fichiers révéleraient en grande partie l’algorithme de recherche et les critères de classement des sites Web de Yandex. Une véritable mine d’or pour les spécialistes du référencement, qui tentent depuis de nombreuses années de décrypter les micro-signaux pour optimiser au mieux le classement des sites au sein des pages de recherche.
Des critères parfois originaux
Alex Buraks, spécialiste du SEO (optimisation pour les moteurs de recherche, ou optimisation pour les moteurs de recherche en français), a commencé à analyser une partie du code source de l’algorithme Yandex. Il a publié ses premières découvertes dans un fil détaillé sur Twitter. Bien que l’approche du moteur de recherche russe soit différente de celle utilisée par ses principaux concurrents, le classement des sites pourrait s’avérer proche de celui pratiqué par les algorithmes de Google, selon les experts du domaine.
Plus précisément, Yandex privilégierait les pages récentes (URL fraîches) dans ses résultats, et celles avec beaucoup de trafic organique (visiteurs uniques). Dans le même temps, les URL contenant des chiffres ou de nombreuses barres obliques « / » (barre oblique) seraient désavantagées. Les sites basés sur des pages fiables, avec peu d’erreurs (comme une page supprimée ou perdue, en code 404) seraient également à privilégier. L’ancienneté de la page web et sa dernière mise à jour pourraient également influencer les classements, tout comme, dans une moindre mesure, la vitesse à laquelle les utilisateurs cliquent sur un lien ou le temps passé sur un site. Plus surprenant, les pages Wikipédia seraient mieux référencées par l’algorithme.
Pour les plus curieux, la liste complète des 1922 critères de pertinence du moteur de recherche a été publiée intégralement sur le site de la Webmarketing School. Une fuite d’informations très préjudiciable pour Yandex, qui confirme les principaux facteurs pressentis ces dernières années par les experts SEO.
Publicité, votre contenu continue ci-dessous