motrech
Trois regards sur l'univers des moteurs de recherche

Jérôme, créateur de motrech et directeur technique chez Webpulse (Staragora, Shopreflex)

Emilie, consultante en médias sociaux et gestion de l'identité numérique, blogueuse (emilieogez.com) et responsable marketing et communication chez XWiki
Frédéric, consultant indépendant intelligence économique et veille stratégique : Actulligence Consulting et blogueur depuis 2001, geek, technophile

                 

Search

July 22nd, 7:49am 0 comments

Bing s'invite sur Yahoo!


Suite à l'accord de partenariat signé entre Bing et Yahoo! en Juillet 2009
concernant l'utilisation de Bing dans les résultats de recherche de
Yahoo!, nous n'avions encore rien vu venir.

Mais Yahoo! vient d'annoncer que des tests étaient en cours pour
l'inclusion des résultats de Bing dans Yahoo!.


Comme nous le constatons sur la capture d'écran, pour le moment, les résultats de recherche impactés sont les annonces contextuelles, et
les résultats organiques. Yahoo! conserve ainsi la main sur ses résultats à valeur ajoutée : Les suggestions de recherche, les recherches locales, etc...

Dans ce contexte, nous sommes en droit de nous interroger sur l'avenir de Yahoo! BOSS dont nous avons souvent parlé sur ce blog. Que va devenir Yahoo! BOSS ? Ses résultats proviendront-ils aussi de Bing ? Et les éléments sémantiques de Yahoo! BOSS ?
Hadoop qui a été soutenu par Yahoo! pendant longtemps, ce qui a permis son important développement sera-t'il également toujours utilisé dans
l'infrastructure de Yahoo ?

Quoi qu'il en soit, cette intégration partielle des résultats de Bing dans Yahoo! ne doit pas être simple d'un point de vue technique pour
parvenir à conserver une cohérence entre les 2 systèmes. Bon courage donc aux ingénieurs de Bing et de Yahoo!

Filed under bing microsoft yahoo
July 19th, 7:45pm 0 comments

Foursquare en discussion avec les principaux moteurs

Foursquare serait en effet en cours de discussions avec Google, Yahoo! et Bing. Cela permettrait aux principaux moteurs d'inclure dans leurs résultats de recherche les localisations à la mode ainsi que les recommandations des utilisateurs de Foursquare.
Il est certain que Yelp et Gowalla ne seront pas en reste et tenteront également de se placer auprès des grands de la recherche.
Le web du contenu cède doucement de la place au web des données. Il est certain que cette tendance (le fameux web sémantique) permettra aux moteurs d'améliorer leurs résultats.

Frédéric: Certains se demandent si Foursquare n'est pas déjà mort né... Beaucoup de questions subsistent sur son modèle économique sa viabilité. Maintenant que les maires sont bien installés, le jeu perd de son piment. De plus Foursquare n'intègre pas de messagerie interne, et manque cruellement de fonctions sociales, son design est vraiment moyen si on le compare à un Gowalla par exemple... Alors oui, selon moi si Foursquare, roi de la communication lors de ses premières semaines, veut survivre ils ont tout intérêt à essayer de commencer à valoriser les données qu'ils ont capitalisées... Mais des données qu'ils ont capitalisées malheureusement en très petit nombre. Foursquare c'est pour la plupart de ses utilisateurs "je check-in, je ferme l'appli". Comment vont ils arriver à valoriser cela auprès des grands du search ? A lire absolument donc pour redescendre un peu sur Terre : Foursquare est il déjà mort ? par Frédéric de Villamil
Emilie: Non, Foursquare n'est pas mort. Et si il perd un peu de son intérêt ces derniers mois pour les raisons que tu donnes, Frédéric, il devrait se relancer (ils ont annoncé des nouveautés, mais je ne retrouve plus l'article). Foursquare doit se renouveler bien sûr pour continuer à vivre. Sur la question des moteurs de recherche : il fallait s'y attendre. Tout site social qui se respecte, et qui a du succès, pense forcément à être indexé par les moteurs de recherche. Twitter est passé par là. C'est au tour de Foursquare.
April 3rd, 9:00am 0 comments

Du bruit dans l'moteur : Wikia Search, Kumo, Google Suggest...

Que nous a réservé cette première semaine d'avril ?

Emilie :

Jérôme :
Et comme le vendredi c'est poisson, voici la sélection du poissonnier :
March 20th, 7:00pm 5 comments

Google est-il est le meilleur moteur de recherche en langue naturelle ?

a fait une sélection de 10 questions qu'il est possible de poser à un moteur de recherche en langage naturel, et les a testées sur plusieurs moteurs : Google donc, mais aussi Powerset, Live Search, Hakia, Yahoo, Ask et TrueKnowledge.

Les questions :

  • Show me a map of France
  • List some large cities in France
  • When was einstein born?
  • What movies has Alain Delon been in?
  • Give me the GDP of China
  • How many languages are spoken in Pakistan?
  • Who was the eighth president of the United States?
  • How many ethnic groups exist in cameroon?
  • What is TCP/IP?
  • How hot will it be in Paris tomorrow?
  • Résultat des courses : Google et Ask obtiennent la note de 10/10 et Powerset arrive en dernier avec juste la moyenne (5/10). Les autres moteurs se débrouillent plutôt bien : 8/10 ou 9/10.

    Pour une description des moteurs de recherche et l'analyse, c'est ici.

    Quelques questions :

    • Est-ce que la méthodologie est pertinente ?
    • Est-ce que le choix des moteurs l'est aussi ?
    Jérôme : Le billet est intéressant : étudier et comparer les réponses de différents moteurs à un ensemble de recherches exprimées en langage naturel (tout de même assez factuelles), pourquoi pas. La méthodologie un peu légère à mon goût : ne prendre que le premier résultat, reformuler les requêtes selon les moteurs, ne décider de la pertinence (facteur très subjectif) des réponses sans prendre ne serait-ce qu'un mini panel ne donne pas des résultats significatifs et exploitables. Il ne faut donc pas comme nous serions tenté de la faire prendre ce billet comme une étude détaillée, mais comme une expérimentation.

    Il y a déjà un petit moment, suite à ce billet de ReadWriteWeb que je voulais aborder le sujet des "recherches sémantiques" de Google. Ce sera donc aujourd'hui l'occasion d'en parler.
    ça semble magique. Vous recherchez "Quelle est la devise de la France" et Google vous retourne "France - Monnaie : Euro (EUR)". Pas mal, non ? Amusez-vous donc avec des recherches du style "qui est le président de la france" ou encore "quelle est la superficie de la france". Pour ceux qui ne connaissaient pas, vous êtes bluffés, non ?
    De là à parler de recherche en langage naturel, il ne faut tout de même pas aller trop vite. Essayez par exemple "quelle est la taille de la france", "qui est le chef d'état de la france" ou "j'aimerais connaitre la superficie de la france" et vous verrez que Google ne sait plus nous répondre (directement).

    D'autres vous dirons que Google devient un moteur de recherche sémantique. Soit, mais qu'est-ce que la sémantique et plus particulièrement l'analyse sémantique ? D'après la définition de Wikipedia, c'est une analyse qui établit la signification d'un message en utilisant le sens des éléments du texte. Pensez-vous sérieusement que Google face une telle analyse ? Non du tout.
    Voici comment se déroule très probablement ce processus à l'heure actuelle. Le moteur utilise une base de données structurée (comme dbpedia) ou pseudo-structurée (comme Wikipedia). Prenons l'exemple de Wikipedia. Allez sur la page France. Que remarquez-vous sur la droite ? Un tableau structuré de données factuelles sur la France (superficie, devise, etc). Google récupère donc ces données en conservant le triplet France/devise/euro. Ensuite lors d'une recherche, si Google retrouve le terme France associé au terme devise (ou superficie, etc) et que le reste des termes sont des termes vides ou peu discriminant alors il propose une réponse exacte issue de la base de données structurée.

    Nous pouvons au premier abord nous laisser tromper, mais non, Google n'est pas un moteur de recherche en langage naturel et ce n'est pas non plus un moteur de recherche sémantique. En revanche, ce genre de fonctionnalité est très intéressante et préfigure ce que seront les moteurs de demain : un accès encore plus précis et plus rapide à l'information recherchée.

    March 15th, 9:00am 0 comments

    Du bruit dans l'moteur : DocJax, MyTorrent, Google...

    Emilie :
    Jérôme :
    March 2nd, 9:00am 0 comments

    Top search engines in December 2008

    Le classement des moteurs de recherche les plus utilisés (en nombre de requêtes reçues) fin décembre vient d'arriver (Nielsen). Pas de surprise (en aurons-nous une un jour ?) : Google est toujours largement en tête fin 2008, devant Yahoo et Live Search.

    Comparativement à octobre 2008 :
    • Yahoo reprend du poil de la bête
    • Live Search continue à perdre des utilisateurs
    • AOL progresse encore
    Jérôme : Comme dans tous les domaines, plus il y aura de concurrence, plus l'utilisateur en aura les bénéfices. La progression de Yahoo! et d'AOL sont donc de très bonnes nouvelles, d'autant plus que Yahoo! le mérite, il prend des risques, il innove et explore de nouveaux horizons.
    January 23rd, 4:00pm 0 comments

    Du bruit dans l'moteur : Jinni, Live Search, Moodstream, etc.

    L'actu de la semaine des moteurs à laquelle vous avez échapé (bonne lecture et bon week-end) :

    Emilie :

    Jérôme :
    January 16th, 6:00pm 0 comments

    Du bruit dans l'moteur : Yandex, Yahoo, soldes, etc.

    L'actu de la semaine des moteurs à laquelle vous avez échapé (bonne lecture et bon week-end) :

    Jérôme :


    Emilie :
    December 5th, 9:00am 0 comments

    Du bruit dans l'moteur : Yahoo!, AOL, Alexa, Microsoft

    Les tribulations de la semaine du monde fascinant des moteurs de recherche que nous n'avons pas eu le temps de couvrir en détail :

    Emilie (c'est un peu people cette semaine) :


    Jérôme :