Créer un moteur de recherche personnalisé présente un avantage principal, à savoir permettre de lancer des recherches uniquement sur certaines sources d’informations ou sites. Imaginez que vous êtes intéressé par l’e-réputation. En passant par un moteur de recherche comme Google, très généraliste, vos requêtes porteront sur l’ensemble du Web (ou presque). Par contre, avec un moteur de recherche personnalisé, vos requêtes ne sont lancées que dans un ensemble de sites que vous aurez au préalable choisis. Un exemple sur le blog CaddeRéputation.
Pratique, n’est-ce pas ? C’est assez simple de créer un tel moteur. Mais si vous aimez être guidé, je vous suggère de vous rendre sur ce site. Vous y trouverez un tutoriel vidéo pour créer un moteur de recherche personnalisé avec Google.
Jérôme : Je ne peux aller que dans ton sens, puisqu’il y a à peine deux jours, je conseillais à un de mes contacts désirant mettre en place des moteurs verticaux, d’utiliser Google (ou encore Yahoo!). D’autant plus que Google Custom Search propose une API qui permet d’intégrer facilement les résultats de manière quasi transparente sur un site dédié.
Andrzej Bialecki, mentor de la première heure de Nutch, a fait une présentation très détaillée et très intéressante lors de la Conférence Apache 2009 (ApacheCon09 pour les intimes) qui se tenait la semaine dernière. Au delà du fait que cette présentation détaille le fonctionnement interne de Nutch, elle explique étape par étape et de façon très détaillée le fonctionnement d’un moteur de recherche : les problèmes à surmonter, les modules nécessaires…
Emilie : à défaut de vous intéresser à Nutch, vous en saurez plus sur le fonctionnement d’un moteur de recherche. :)
Dans un billet récent (traduction de Goopilation) sur le blog Webmaster Central de Google, Greg Grothaus, de l’équipe « Search Quality » nous propose une présentation expliquant ce qu’est le contenu dupliqué du point de vue de Google. En bref : Google et le duplicate content, mythes et réalités.
Les slides de cette présentation sont ci-dessous, ainsi que la vidéo (en anglais) un peu plus bas :
Qu’apprend t’on vraiment dans cette présentation ?
Avez-vous déjà testé ce « nouvel » attribut ? Avez-vous remarqué des modifications / améliorations dans votre référencement sur Google suite à sa mise en place ?
La vidéo :
Emilie : personnellement, je n’ai pas testé. Et je suis loin d’être la mieux placée pour le faire. Mais cela m’intéresse de savoir si il y a une influence de cet « attribut ». Ceci dit, il me paraît aussi intéressant de se demander la démarche de Google visant à démystifier la pénalisation par son moteur de recherche des contenus dupliqués fonctionnera… Il y a des choses qui sont dures à faire changer.
Voici une présentation vu chez Aref de Demain La Veille, qui s’articule autour de deux grandes parties :
Jérôme : Une présentation très intéressante qui synthétise bien le monde de le recherche d’information sur Internet, les problématiques de recherche et de veille, les usages et travers actuels, et qui nous fournit enfin quelques pistes pour une meilleure efficacité (en terme de réduction de l’effort cognitif à fournir) de nos recherches d’information.
En une seule journée, le moteur de recherche de Microsoft, Bing s’est retrouvé en seconde position des moteurs de recherche les plus utilisés. Il a fait frémir Yahoo et Google :
Mais cet enthousiasme, généré par la curiosité et l’intérêt, est vite retombé :
« Aujourd’hui, la part de marché de Bing aux Etats-Unis est retombée à 4,7%, derrière Yahoo (10,7%) et Google (82,3%). Le constat est plus sévère encore au niveau mondial : alors que Google culmine à 88% de parts de marché et que Yahoo dépasse à peine les 7,1%, Microsoft doit se contenter de 2,8% »
Jérôme : Un peu le même effet que lors de la sortie de Wolfram Alpha. Mais la campagne marketing de microsoft ne fait que commencer, et à n’en pas douter, entre la redirection des utilisateurs de live vers Bing + Bing comme moteur de recherche par défaut dans IE8 + la campagne publicitaire, il y a de fortes chances pour que Bing dépasse à nouveau Yahoo! dans quelques semaines.
J’ai participé la semaine dernière au SEO Campus. J’y parlais de e-réputation mais ce n’était pas le seul sujet, ni le sujet principal de cet événement. On y a bien sûr parlé de référencement, mais aussi de linguistique statistique, de droit de l’Internet… et de moteurs de recherche.
Vous trouverez ici une présentation de Philippe Yonnet, Directeur du Pôle Métier Agence Aposition Isobar, dans laquelle il décortique un moteur de recherche.
Vous pouvez aussi tout simplement cliquer sur l’image ci-dessous :
Jérôme : Back to basics. Une présentation, simple et claire qui permettra au néophyte de mieux comprendre ce qu’est un moteur de recherche et comment il fonctionne dans ses grandes lignes.
En mai 2008 (pfou presque un an déjà), j’avais remarqué que malgré des mesures de Jean indiquant un taux de satisfaction plus grand chez les utilisateurs de Google, ces derniers rebondissaient plus qu’avec les autres moteurs : Etrange ! Suite à vos commentaires, nous avons alors tenté de trouver quelques explications à ce phénomène.
Aujourd’hui, Arkantos Consulting nous fournit quelques indices permettant de mieux définir le taux de rebond :
Voici donc quelques informations provenant de Google qui éclairent le taux de rebond d’un nouveau jour et permettent de mieux comprendre ce qui se cache vraiment derrière cette notion à priori simple.
Emilie : Merci à Arkantos pour ces éclaircissements. Merci Jérôme pour avoir déniché ce lien. Ce type d’article est toujours le bienvenu quand il permet d’y voir plus clair. :)
Jérôme : Nous avons plusieurs fois échangé nos points de vue sur la nécessité d’éduquer et de former l’internaute à l’utilisation de smoteurs de recherche (ici ou encore ici) . Cette vidéo, très simple (simpliste pour les experts) est vraiment très bien fait et très claire. Elle permet en quelques minutes de montrer de manière drôle et pertinente l’utilisation de quelques opérateurs de base des moteurs de recherche. Bravo à l’auteur de la vidéo. Merci à Emilie de l’avoir dénichée. Ne reste plus qu’à faire un doublage français de la vidéo (un volontaire? Jean-Marie, au hasard ?) et à la diffuser le plus largement possible.
Il n’y a pas que Google pour faire des recherches. Il y a beaucoup d’autres moteurs dits alternatifs (vu chez Aref), comme le montre la présentation ci-dessous. Mais elle a aussi l’avantage d’expliquer simplement comment fonctionne un moteur de recherche et de proposer une typologie des moteurs de recherche :
Jérôme : Une présentation effectivement, très claire, précise et complète. Quelques points toutefois sur lesquels je ne suis pas tout à fait d’accord : Slide 4, « Rapidité des innovations ». Vraiment ? Slide 5, l’analyse linguistique et l’analyse statistique ne sont pas antinomiques : la première utilise souvent la seconde. Slides 12 et 13 : ils laisseraient croire que les moteurs utilisent soit un « indice de pertinence », soit un « indice de popularité ». Google par exemple, utilise au moins les deux. Slide 13 : « réduction du spamdexing ». Oui et non, il prend juste une nouvelle forme : au lieu de spammer par des mots clés, on spam par de faux liens. Je suis « tatillon », car cette présentation est tout simplement excellente et synthétise de manière remarquable notre petit monde des moteurs de recherche.
Jérôme : Une présentation effectivement, très claire, précise et complète. Quelques points toutefois sur lesquels je ne suis pas tout à fait d’accord :
Je suis « tatillon », car cette présentation est tout simplement excellente et synthétise de manière remarquable notre petit monde des moteurs de recherche.
On nous dit souvent qu’une image, une vidéo valent mieux qu’un long discours. Voici un exemple type avec l’animation sur la recherche sociale en entreprise proposée par l’équipe Whatever sur leur site et cette présentation :
Avec cette présentation, on comprend tout, on comprend mieux ? C’est à la fois simple et clair.
PS : je n’ai aucune action chez eux.
Jérôme : Ce slideshow fait effectivement clairement comprendre les enjeux de la recherche en entreprise. Pardon ! De la recherche sociale en entreprise. Mais toute recherche d’information en entreprise n’est-elle pas par essence sociale ? A partir du moment où les documents sont partagés ? Quoi de réellement neuf dans cette solution ? Très peu d’informations sur le site, mais comme tu voulais nous le montrer Emilie, la problématique est bien posée par ce petit slideshow fort sympatique.