Yahoo aurait pu trouver la solution du Not Provided de Google Analytics

Rappel du (not provided) / https / ssl / referer

Plutôt que de faire un long discours sur le (not provided) de Google Analytics et les solutions alternatives, je vous invite à lire un article complet d’Avinash Kaushik, le M. Analytics de chez Google. De mémoire c’est le 1er à avoir défini et explicité le taux de rebond en 2007 : sur son blog et une vidéo.

Yahoo Q/R : la solution ?

Mais revenons à nos moutons avec une récente découverte : Yahoo saurait récupérer les requêtes cryptées issues de la navigation sécurisée en SSL, du moins depuis le moteur de recherche Google. En l’occurrence c’est Yahoo Questions/Réponses qui bénéficie de cette technologie permettant de collecter en clair les mots-clés tapés par les internautes utilisant Google Search.

Je vous propose donc la manipulation suivant pour vous rendre compte que Yahoo récupère les mots-clés provenant de Google lorsque l’utilisateur est connecté à son compte Google (Gmail, Google+, etc.).

Test avec la requête « Quelle a été la plus grande invention de tous les temps ? »

  1. Recherche de « Quelle a été la plus grande invention de tous les temps ?« sur Google.fr en mode connecté : http://goo.gl/8zyx19
  2. Clic sur Yahoo Answers
  3. Recherche de « Google.fr » dans le code source (« Ctrl+U »)
  4. Découverte de « dmros.ysm.yahoo.com/ros » : un sous domaine de Yahoo utilisé dans une iframe
  5. et la requête apparaît en clair avec la mention de Google.fr

<noscript>
<iframe id= »dmRosAd-1-north » width= »560″ height= »315″ frameborder= »0″
marginheight= »0″ marginwidth= »0″ scrolling= »no »
src= »http://dmros.ysm.yahoo.com/ros/?c=8126ffa7&w=678&h=315&ty=noscript&tt=Quelle+a+%C3%A9t%C3%A9+la+plus+grande+invention+de+tous+les+temps+%3F&r=https%3a%2f%2fwww.google.fr%2f« >
</iframe>
</noscript>

Qu’est-ce qui se cache derrière dmros.ysm.yahoo.com ?

  1. Ouverture de la console (Ctrl+Shift+I)
  2. Recherche (Ctrl+F) de « Google.fr » ou « dmros »
  3. Request URL
    a) https://dmros.ysm.yahoo.com/ros/?ct=1&c=8126ffa7&w=1&h=1&si=north%3A560x315&ty=KS_TB_TRENDING&sp=2114716679&sr=ckut7wH78X&sa=KS_TB_TRENDING&u=https%3A%2F%2Ffr.answers.yahoo.com%2Fquestion%2Findex%3Fqid%3D20140602000613AARvzqT&r=https%3A%2F%2Fwww.google.fr%2F&tt=Quelle%20a%20%C3%A9t%C3%A9%20la%20plus%20grande%20invention%20de%20tous%20les%20temps%20%3Fb) https://y.analytics.yahoo.com/fpc.pl?_cb=SixjVMnC3F3Cykd8&.ys=2114716679&a=1000198838279&b=Quelle%20a%20%C3%A9t%C3%A9%20la%20plus%20grande%20invention%20de%20tous%20les%20temps%20%3F&d=Fri%20Jun%2006%202014%2023%3A58%3A28%20GMT%2B0200%20(Paris%2C%20Madrid%20(heure%20d%E2%80%99%C3%A9t%C3%A9))&f=https%3A%2F%2Ffr.answers.yahoo.com%2Fquestion%2Findex%3Fqid%3D20140602000613AARvzqT&j=1600×900&k=24&t=1402091908&l=true&dpid=3767379852&fpc=ZYMjPz0i%7CPrfqgCYNaa%7Cfses1000198838279%3D%7CCx1YCaCNaa%7CZYMjPz0i%7Cfvis1000198838279%3D%7C8TYsYoHs10%7C8TYsYoHs10%7C8TYsYoHs10%7C8%7C8TYsYoHs10%7C8TYsYoHs10&e=https%3A%2F%2Fwww.google.fr%2F&cf07=2114716679&cf11=question&cf12=fr-FR&cf14=KS_TB_TRENDING&cf39=20140602000613AARvzqT&cf41=fr
  4. Décodage de l’URL Google.fr avec : http://meyerweb.com/eric/tools/dencoder/

a) r=https://www.google.fr/&tt=Quelle a été la plus grande invention de tous les temps ?

b) https://y.analytics.yahoo.com/fpc.pl?_cb=SixjVMnC3F3Cykd8&.ys=2114716679&a=1000198838279&b=Quelle a été la plus grande invention de tous les temps ?&d=Fri Jun 06 2014 23:58:28 GMT+0200 (Paris, Madrid (heure d’été))&f=https://fr.answers.yahoo.com/question/index?qid=20140602000613AARvzqT&j=1600×900&k=24&t=1402091908&l=true&dpid=3767379852&fpc=ZYMjPz0i|PrfqgCYNaa|fses1000198838279=|Cx1YCaCNaa|ZYMjPz0i|fvis1000198838279=|8TYsYoHs10|8TYsYoHs10|8TYsYoHs10|8|8TYsYoHs10|8TYsYoHs10&e=https://www.google.fr/&cf07=2114716679&cf11=question&cf12=fr-FR&cf14=KS_TB_TRENDING&cf39=20140602000613AARvzqT&cf41=fr

PS : le « eric » de l’URL ce n’est pas moi mais Eric A. Meyer (rendons à César ce qui appartient à César, et à Dieu ce qui est à Dieu)

 

Quelques questions subsistent

  • Suis-je sur la bonne piste ou cette info avait déjà été découverte auparavant ?
  • S’agit-il d’un hack de Google ou du chiffrement SSL/TLS à la NSA ?
  • Ou au contraire serait-ce le passage au tout SSL chez Yahoo ?
  • Que sont les initiales de « DMROS » ou « ROS » ? En tout cas, pas de doute sur « YSM » : Yahoo Search Marketing

 

Anecdote

J’ai découvert cela en constatant qu’il était impossible de plusser la page : « impossible d’attribuer un +1 à cette page ». Je n’ai pas trouvé pourquoi à part :

  • « X-Content-Type-Options:nosniff »
  • « Cache-Control:max-age=0, no-store, private, no-store, private »

 

Edit du 07/06 – 11h32

Après échanges avec Antoine Brossault, il ne s’agit juste que de la récupération du Title de la page qui est récupéré et non le mot-clé ! Pourquoi récupérer le titre, je ne sais pas, mais en tout cas cela fait que le reste de cet article devient caduque :-(

Une remarque, une question ? Laissez votre commentaire !

%d blogueurs aiment cette page :