motrech
Trois regards sur l'univers des moteurs de recherche

Jérôme, créateur de motrech et directeur technique chez Webpulse (Staragora, Shopreflex)

Emilie, consultante en médias sociaux et gestion de l'identité numérique, blogueuse (emilieogez.com) et responsable marketing et communication chez XWiki
Frédéric, consultant indépendant intelligence économique et veille stratégique : Actulligence Consulting et blogueur depuis 2001, geek, technophile

Search

Loading mentions Retweet

Posted 3 hours ago by Emilie Ogez

0 Comments

July 29th, 3:27pm 0 comments

Histoire et évolution du SEO en 2 images

History of SEO 1994-2001

History of SEO 2002-2009

Greenlight nous propose deux illustrations retraçant l'histoire des moteurs de recherche et du SEO. Intéressante mise en perspective. Qu'en pensez-vous ?

Filed under seo
Loading mentions Retweet

Posted 18 hours ago by Jérôme Charron

0 Comments

July 26th, 9:43am 0 comments

Google "pourrisseur" du web ?!

Comme bien souvent, Sébastien Billard (Joyeux Anniversaire en retard Sébastien!) nous propose un billet fort intéressant, au titre un brin provocateur : Google "dégueulasse"-t-il le web ?

Ce billet de Sébastien vient en réaction d'un autre billet qui n'est malheureusement plus en ligne sur le blog Froggylink qui avançait la thèse selon laquelle Google "pourrirait" le web en bridant la créativité des webmasters.

Sébastien n'est pas vraiment d'accord avec cette affirmation et explique pourquoi dans son billet.

Je le rejoindrais bien volontier sur le fait que les guidelines de Google ne sont pas plus restrictives que celles de Bing ou de Yahoo! mais encore qu'elles sont très proches des recommandations du W3C.
En ce sens, Google, ainsi que les autres moteurs, en poussant à une utilisation correcte des recommandations du W3C aurait plutôt tendance à améliorer le web plutôt qu'à le "dégueulasser".

Mais...

Lorsque tant et tant de webmasters sur de nombreux forums spécialisés se posent des questions sur leur perte de visibilité inexpliquée sur Google.

Lorsque les webmasters tremblent à chaque modification (même mineur) de leur site de peur de perdre leurs positions si difficilement acquises dans Google.

Lorsque les webmasters doivent tracker les moindres modifications CSS de leur designer afin de vérifier que ce dernier n'a pas artificiellement caché du texte.

Lorsque Google annonce que la rapidité de réponse des sites sera maintenant prise en compte dans le positionnement des réponses.

Lorsque Google annonce également que les sites à forte autorité, c'est à dire les sites ayant un fort traffic seront favorisés dans leur classement.

Alors, oui, je pense que de manière indirecte et perverse, Google pourrit le web. De par sa position dominante (et parfois écrasante), Google oblige les webmasters à se plier à ses règles, règles qui elle mêmes restent suffisamment floues pour être libres d'interprétation.
Alors, oui, je pense que Google oblige à un niveau de plus en plus haut de compétences et que l'amateurisme sur le web va malheureusement continuer à disparaître.
Enfin je pense que Google pourrie le web en devenant LA référence des contraintes techniques, et LA référence des contraintes éditoriales.

Alors, quid du web ouvert lorsqu'une société privée impose les règles du web ? Quid du web ouvert lorsque ces mêmes règles ne sont pas connues des webmasters ? Quid du web ouvert lorsque les règles ne sont pas les mêmes pour tout le monde ?

Frédéric : Jérôme pose des questions que beaucoup de personnes se posent.

Je n'irai pas non plus en ce qui me concerne par quatre chemins.


Non, je ne pense pas que Google pourrisse le Web.

Oui, je pense qu'en plus d'une décennie d'existence, Google a permis au web de progresser en offrant ce qu'il manquait au Web : un point d'accès, une porte d'entrée.

Alors certes Google est restrictif sur ses critères d'indexation, mais après tout sur une première page de résultats de Google il n'y a que 10 places, et tous ceux qui ne sont pas sur cette première page sont frustrés, doivent trouver un coupable.

Le respect des normes W3C est important, les temps de chargement d'une page restent importants pour l'expérience utilisateur mais arrêtons quand même de focaliser dessus : ce n'est qu'un des nombreux critères qui permet à Google de classer les résultats d'une requête.

Avant Google, avant le Web 2, la première page de n'importe quelle requête ou presque ne comportait que des résultats commerciaux ou que des résultats de black hat SEO. A l'époque on débattait sur les forums de référencement de la meilleure façon de mettre du blanc sur fond blanc, d'utiliser des calques en index z -1 et de tout un tas d'autres techniques de spamdexing.

Google avec son pagerank a proposé quelque chose d'inédit : limiter le spamdexing en reposant sur la notoriété de ce site auprès d'autres sites le tout couplé à une indexation de plus en plus complète des pages et documents
webs.

Google n'impose ses règles à personne. Libre à chacun de les suivre. Libre à chacun aussi d'essayer de les contourner ou de les enfreindre.

Si les questions d'ailleurs essentielles à poser sur le danger des dérives d'une telle hégémonie restent entière, s'il y a bien une chose certaine c'est que Google fait partie des sociétés qui ont fait progresser le Web.
Pas pour nous blogueurs, pas pour les entreprises, pas pour les référenceurs, mais pour les utilisateurs !

PS : pour mémoire on rappellera quand même que Google est loin d'être aussi hégémonique à travers le monde qu'en France ou qu'en Bulgarie. PS 2 : je suis par ailleurs beaucoup plus inquiets des censures du Web, beaucoup plus inquiétantes, mises en place en Chine ou bien dans des pays ou nous autres français aimons parfois nous dorer au soleil tels que la Tunisie."

Filed under google seo w3c
Loading mentions Retweet

Posted 3 days ago by Jérôme Charron

0 Comments

July 23rd, 3:10pm 0 comments

SEO : Le guide du Web Spam

Le blog SEO Blackout nous propose une traduction (très approximative) de l'article Web Spam : The Definitive Guide.

Tout l'intérêt de cet article est de mieux comprendre ce que les moteurs de recherche peuvent considérer comme des signaux de spams, et ainsi, vous éviter de malencontreusement vous retrouver pénalisé par Google, Yahoo! ou Bing sans trop savoir pourquoi.

Filed under seo spam
Loading mentions Retweet

Posted 6 days ago by Jérôme Charron

0 Comments

July 22nd, 7:49am 0 comments

Bing s'invite sur Yahoo!


Suite à l'accord de partenariat signé entre Bing et Yahoo! en Juillet 2009
concernant l'utilisation de Bing dans les résultats de recherche de
Yahoo!, nous n'avions encore rien vu venir.

Mais Yahoo! vient d'annoncer que des tests étaient en cours pour
l'inclusion des résultats de Bing dans Yahoo!.


Comme nous le constatons sur la capture d'écran, pour le moment, les résultats de recherche impactés sont les annonces contextuelles, et
les résultats organiques. Yahoo! conserve ainsi la main sur ses résultats à valeur ajoutée : Les suggestions de recherche, les recherches locales, etc...

Dans ce contexte, nous sommes en droit de nous interroger sur l'avenir de Yahoo! BOSS dont nous avons souvent parlé sur ce blog. Que va devenir Yahoo! BOSS ? Ses résultats proviendront-ils aussi de Bing ? Et les éléments sémantiques de Yahoo! BOSS ?
Hadoop qui a été soutenu par Yahoo! pendant longtemps, ce qui a permis son important développement sera-t'il également toujours utilisé dans
l'infrastructure de Yahoo ?

Quoi qu'il en soit, cette intégration partielle des résultats de Bing dans Yahoo! ne doit pas être simple d'un point de vue technique pour
parvenir à conserver une cohérence entre les 2 systèmes. Bon courage donc aux ingénieurs de Bing et de Yahoo!

Filed under bing microsoft yahoo
Loading mentions Retweet

Posted 8 days ago by Jérôme Charron

0 Comments

July 21st, 10:24am 2 comments

Lancement imminent de Blekko

Après les échecs de Cuil ou
encore de Wikia pour s'imposer sur le marché
de la recherche d'information sur Internet face à Google, Yahoo! et
Bing, de nouveaux projets se lancent chaque jour. Pour la plupart, ils
n'ont ni l'infrastructure, ni les compétences pour espérer s'imposer
sur le marché très concurrentiel du search.

Mais certains projets sérieux, réalistes et originaux parviennent
encore à trouver des financements. C'est le cas de Blekko.

Blekko est pour le moment en beta privée, mais Techcrunch l'a déjà essayé. Réalistes, les
créateurs de Blekko ne cherchent pas à rentrer en conflit
frontal avec Google. Ils ont conscience qu'ils n'ont ni
l'infrastructure, ni la puissance de calcul, ni les algorithmes.

Mais Blekko n'en reste pas moins un moteur de recherche à part
entière qui crawle le web, récupère les documents et les indexe. Mais
alors, où est sa différenciation, son originalité, sa valeur ajoutée?

Ce sont ses Slashtagssimple et intuitive d'affiner sa recherche. il suffit en effet par
exemple de rajouter "/ date" dans le champ de recherche pour trier les
résultats par date, ou encore "/ twitter" pour rechercher sur twitter,
etc...

Les Slashtags ne sont-ils qu'une façon un peu geek de faire une
recherche avancée? Oui et non, car vos Slashtags favoris peuvent être
enregistrés et ensuite partagés entre utilisateurs. Pas idiot! Mais si
l'utilisateur averti ou encore les responsable de veille y trouvera
certainement son compte, Blekko parviendra-t'il à trouver son
public auprès de monsieur et madame tout le monde ?

L'autre aspect intéressant de Blekko est sa transparence : il
vous expose les données de son index et explique le score de
pertinence des résultats : Intéressant, didactique, mais encore une
fois, réservé aux spécialistes, non ?

Frédéric: J'aime bien l'idée des Slashtags pour faire de la recherche. Je trouve ça intéressant et plutôt convivial. Justement ça peut mettre à portée du grand public les opérateurs de ciblage. Pour tout le reste je n'en dis pas plus. Je ne parle pas des produits que je n'ai pas vu tourner. Tout ce que je sais c'est que les secrets de la réussite d'un moteur de recherche sont : taille de l'index, vitesse de réponse, lisibilité des résultats, classement de "pertinence" efficace. Après si je creuse un peu, un ancien de Topix et de Netscape Directory, 20 millions de dollars levés depuis juin 2007 et rien de sorti... Je veux pas être foncièrement défaitiste mais bon va falloir plus qu'un Slashtag s'ils veulent faire 0,5 % des parts de marchés du search. Vous trouvez pas ça juste un peu léger d'appueyr sa communication autour de ça quasi exclusivement après 3 ans de dev? A suivre donc prochainement sur vos écrans
Emilie: J'aime bien l'idée de ces slashtags. Je pense qu'ils peuvent séduire monsieur et madame tout le monde car ils sont utilisables depuis l'interface de recherche (pas besoin d'aller sur une page spécifique). Par contre, il faut se donner la peine d'apprendre le "vocabulaire" et là c'est une autre affaire. Les internautes lambda ont déjà du mal à utiliser les guillemets pour faire des recherches sur une expression précise ou à utiliser les connecteurs, alors les slashtags.... C'est quoi ce truc ?????
Filed under blekko slashtag
Loading mentions Retweet

Posted 8 days ago by Jérôme Charron

2 Comments

July 20th, 10:56am 0 comments

Le nouveau Google image arrive

Lancement aujourd'hui du nouveau Google image présenté par Marissa Mayer lors d'une conférence de presse dans les locaux de Google.

Alors quoi de neuf pour la recherche d'images chez Google ?

Une interface profondémment retravaillée qui devient beaucoup plus
visuelle : des vignettes plus grandes, le texte (nom du fichier,
taille, etc) qui s'affiche au survol de la souris. Autre détail, la
frame permettant de voir l'image sur le site disparaît au profit d'une
visualisation en taille réelle de l'image.

Toutes les nouvelles fonctionnalités seront disponibles d'ici la fin
de la semaine à tous les utilisateurs utilisant un "navigateur
moderne"
.

Des images de la conférence de presse sont disponibles sur Mashable.

Filed under google image
Loading mentions Retweet

Posted 9 days ago by Jérôme Charron

0 Comments

July 19th, 7:45pm 0 comments

Foursquare en discussion avec les principaux moteurs

Foursquare serait en effet en cours de discussions avec Google, Yahoo! et Bing. Cela permettrait aux principaux moteurs d'inclure dans leurs résultats de recherche les localisations à la mode ainsi que les recommandations des utilisateurs de Foursquare.
Il est certain que Yelp et Gowalla ne seront pas en reste et tenteront également de se placer auprès des grands de la recherche.
Le web du contenu cède doucement de la place au web des données. Il est certain que cette tendance (le fameux web sémantique) permettra aux moteurs d'améliorer leurs résultats.

Frédéric: Certains se demandent si Foursquare n'est pas déjà mort né... Beaucoup de questions subsistent sur son modèle économique sa viabilité. Maintenant que les maires sont bien installés, le jeu perd de son piment. De plus Foursquare n'intègre pas de messagerie interne, et manque cruellement de fonctions sociales, son design est vraiment moyen si on le compare à un Gowalla par exemple... Alors oui, selon moi si Foursquare, roi de la communication lors de ses premières semaines, veut survivre ils ont tout intérêt à essayer de commencer à valoriser les données qu'ils ont capitalisées... Mais des données qu'ils ont capitalisées malheureusement en très petit nombre. Foursquare c'est pour la plupart de ses utilisateurs "je check-in, je ferme l'appli". Comment vont ils arriver à valoriser cela auprès des grands du search ? A lire absolument donc pour redescendre un peu sur Terre : Foursquare est il déjà mort ? par Frédéric de Villamil
Emilie: Non, Foursquare n'est pas mort. Et si il perd un peu de son intérêt ces derniers mois pour les raisons que tu donnes, Frédéric, il devrait se relancer (ils ont annoncé des nouveautés, mais je ne retrouve plus l'article). Foursquare doit se renouveler bien sûr pour continuer à vivre. Sur la question des moteurs de recherche : il fallait s'y attendre. Tout site social qui se respecte, et qui a du succès, pense forcément à être indexé par les moteurs de recherche. Twitter est passé par là. C'est au tour de Foursquare.
Loading mentions Retweet

Posted 10 days ago by Jérôme Charron

0 Comments

July 19th, 1:15am 0 comments

Google se paie Metaweb

Le 16 juillet, l'ogre de Mountain View s'est payé un gros déjeuner pour un montant que la petite histoire ne précise pas. C'est Metaweb qui a fait les frais de son appêtit grandissant.

En dehors de l'objectif annoncé de perfectionner ses algorithmes, c'est aussi le beau bébé de Metaweb, Freebase, qui intéresse Google.

Freebase, c'est une base de données collaborative de 12 millions d'entités : livres, films, personnes...

Une référence en la matière !

En dehors de la masse de données colossale et surtout structurée de Freebase, Metaweb propose aussi des projets open source tels que GridWorks, un outil permettant d'injecter des données, de les nettoyer et de les rapprocher de la base de données Freebase pour les enrichir avec les données qui en sont issues (projet hébergé chez Google Code :) ).

Google s'engage donc de plus en plus sur la voie qu'il avait annoncé, c'est à dire la structuration du Web. Freebase devrait faciliter la mise en place des micro-formats et des rich snippets en facilitant la structuration et l'enrichissement des données. Il devrait pour cela s'appuyer également fortement sur la technologie d'extraction d'entités nommées de Metaweb.

PS : pour la petite anecdote, on sourira en pensant que Microsfot a racheté Powerset, et que Powerset, à l'époque, appuyait en partie son démonstrateur sur  Freebase.

Emilie : Ce qu'on peut noter c'est que :

1) Google ne s'endort pas sur ses lauriers et continue à vouloir améliorer les performances de son moteur de recherche (pour rester le moteur de recherche le plus utilisé dans le monde  ?) et

2) que la firme américaine maintient le cap et est cohérente dans son évolution (méta-données...).

Loading mentions Retweet

Posted 11 days ago by Frederic Martinet

0 Comments

July 16th, 5:40am 0 comments

Facebook + Twitter + Google = Tweetaboogle

Tweetaboogle est un mashup combinant la puissance de Google et Twitter dans une interface de type Facebook. On y retrouve le bouton "Like", les couleurs de Facebook, les catégories de Google (news, images, videos...) et on peut tweeter des commentaires depuis l'interface.

Pas sûre que j'utilise ce moteur de recherche chaque jour, mais j'aime bien l'idée. Et vous ?

Frédéric : Personnellement je suis très sceptique concernant les mashups et les métamoteurs de recherche. Soyons réalistes hormis quelques uns très spécifiques que nous utilisons ponctuellement Google répond à un grand nombre de nos besoins et cela directement.

J’ai testé donc Tweetaboogle. Bof bof bof. Tout d’abord j’apprécie modérément les copieurs en tout genre et là, certes le bleu n’appartient à personne, mais le « pompage » du design Facebook est assez flagrant. Les résultats sont peu lisibles. La seule bonne idée de ce mashup c’est l’intégration des tweets rattachés à chaque contenu. Une très bonne idée mais qui malheureusement complique un peu la lisibilité. Il aurait fallu à minima la possibilité de les masquer.  Aller, j’ai testé, je vais dormir, et demain j’aurai oublié…

 

Jérôme :  Je trouve intéressante l'idée de mettre les derniers tweets du mur twitter d'un résultat de recherche. Cela permet également d'avoir une (brève) vision de l'activité temps réel d'un domaine. Par exemple, les derniers tweets du mur de staragora en dessous du nom pour tous les résultats sur le nom de domaine staragora, les derniers tweets du mur d'Emilie en dessous de tous les résultats provenant d'emilieogez.com, ... personnellement ça me donne une autre vision des résultats.


Mais finalement, l'utilisation est assez limitée, Tweetaboogle n'est pas une réalisation très belle graphiquement, et puis retrouver les résultats de Google dans une autre interface très légèrement enrichie, quel intérêt ?

Loading mentions Retweet

Posted 14 days ago by Emilie Ogez

0 Comments