Publicité, votre contenu continue ci-dessous

Le code source d’une partie des services du géant technologique russe Yandex a été divulgué en ligne. Une mine d’or pour de nombreux experts qui commencent tout juste à étudier la conception d’algorithmes.

Une fuite révèle les critères SEO de Yandex © Getty Images / Eugene Mymrin

Une fuite révèle les critères SEO de Yandex.

44,71 Go. C’est la taille des fichiers de code source prétendument volés à Yandex, le moteur de recherche le plus utilisé en Russie. L’archive contenant les données a été publiée sur un forum populaire auprès des cybercriminels le 25 janvier. Borderline2023, l’utilisateur à l’origine de la publication, affirme avoir téléchargé les documents lui-même en juillet 2022.

Du code « récent »

Ces fichiers contiendraient tout le code source développé par l’entreprise. Selon l’analyse de l’ingénieur logiciel Arseni Chestakov, l’archive contiendrait « certainement du code source » destiné aux « services aux entreprises ». Carte interactive, messagerie, stockage en ligne, service de taxi (type Uber)… Le code source d’au moins 13 services Yandex serait divulgué, selon l’analyste, qui a pu confirmer l’information auprès des employés de l’entreprise.

Le code source de Yandex a été publié sur le forum des pirates. © Capture d’écran

Fuite du code source de Yandex sur le forum des hackers.

Plus intéressant encore, les fichiers révéleraient en grande partie l’algorithme de recherche et les critères de classement des sites Web de Yandex. Véritable mine d’or pour les spécialistes du référencement, ils tentent depuis de nombreuses années de décrypter les microsignaux pour optimiser au mieux le classement de leur site dans les résultats de recherche.

À Lire  ▷ 7 tendances SEO en 2023 à ne pas manquer !

Des critères parfois originaux

Alex Buraks, spécialiste du SEO (optimisation pour les moteurs de recherche, ou optimisation des moteurs de recherche en français), a commencé à analyser une partie du code source de l’algorithme Yandex. Il a posté ses premières découvertes dans un fil spécifique sur Twitter. Bien que l’approche du moteur de recherche russe soit différente de celle utilisée par ses principaux concurrents, le classement des sites peut être proche de ce que pratiquent les algorithmes de Google, selon les experts du domaine.

Plus précisément, Yandex privilégierait les pages récentes (nouvelles URL) et celles à fort trafic organique (visiteurs uniques) dans ses résultats. En même temps, les URL avec des nombres « / » (barre oblique) ou beaucoup de barres obliques seraient nuisibles. Les sites basés sur des pages fiables avec peu d’erreurs (comme une page supprimée ou perdue, code 404) seraient également à privilégier. L’ancienneté de la page Web et sa date de mise à jour peuvent également affecter le classement et, dans une moindre mesure, la vitesse à laquelle les utilisateurs cliquent sur un lien ou le temps passé sur un site. Plus surprenant, les pages Wikipédia seraient mieux référencées par l’algorithme.

Pour les curieux, la liste complète des 1922 critères de pertinence des moteurs de recherche a été publiée dans son intégralité sur le site de la Webmarketing School. Une fuite d’informations très dommageable pour Yandex, qui confirme les principaux facteurs identifiés par les experts SEO ces dernières années.

Publicité, votre contenu continue ci-dessous