»
S
I
D
E
B
A
R
«
Du bruit dans l’moteur : Google, Facebook, Koogle, Hunch, Bing…
juin 22nd, 2009 by emilie

Les infos que nous n’avons pas abordées ni commentées :

Emilie :


Jérôme :

Du bruit dans l’moteur : Google, Click2bet, Bing…
juin 12th, 2009 by emilie

Les infos de la semaine que nous n’avons pas traitées et qui peuvent vous intéresser. Mais bon, il était essentiellement question de Bing cette semaine. Tout le monde en a parlé, y compris nous.

Emilie

Jérôme

La recherche sémantique sur Twitter au service la recherche d’emploi
mai 7th, 2009 by emilie

Un titre un peu long, je vous l’accorde. Mais au moins, tout y est. On sait tout avant même de lire l’article et l’addition donne ça :

moteur de recherche + sémantique + Twitter + emploi = TwitterJobSearch


Une fois la requête saisie, le moteur vous renvoie les résultats. Vous pouvez :

  • Savoir quand le tweet a été publié
  • Accéder directement à la page décrivant le poste
  • Re-tweeter le tweet
  • Connaître le salaire proposé
  • Suivre l’auteur de tweet (au cas où il reposte l’info)
  • Savoir quel est le type de poste : temps plein, temps partiel…

On apprend que :

We use semantic tools to look at what was said. We then look at what they’ve said before. We then look at who was saying it.

L’avis d’un expert est le bienvenu. Jérôme ? Est-il vraiment sémantique ou pas selon toi au bien est-ce encore un pseudo moteur de recherche sémantique ?

Jérôme :

Là il y a challenge ! Et pas facile de répondre à cette question ! Mais au premier abord, je dirais que non. Et je dirais même que si le service est plutôt bien fait et très pertinent d’un point de vue positionnement, il l’est beaucoup moins d’un point de vue pertinence des réponses. En effectuant par exemple la recherche « Chief Technical Officer » (qui est une recherche relativement commune dans le contexte de ce moteur), j’obtiens en 4ème résultat un poste intitulé « Organic Chemist – Clean Technology » (pas grand chose à voir avec ma recherche, non ?). Après étude de la page de l’annonce, nous retrouvons la phrase suivante : « Work in collaboration with the Chief Technical Officer » !!! Et dans la première page de résultats il y a plusieurs exemples du même type!

Alors si les créateurs de twitterjobsearch ont développé des algorithmes hyper complexes et soit disant « sémantiques » pour obtenir de tels résultats, je pense qu’ils ont définitivement perdu leur temps. En filtrant de manière efficace leurs sources et en développant une méthode générique d’extraction des intitulés de postes, ils auraient obtenus de bien meilleurs résultats.

Bref, à mes yeux, un produit intéressant, mais qui a encore du chemin à faire sur la pertinence pour fournir un vrai service à l’utilisateur.

Du bruit dans l’moteur : Jinni, Live Search, Moodstream, etc.
jan 23rd, 2009 by emilie
L’actu de la semaine des moteurs à laquelle vous avez échapé (bonne lecture et bon week-end) :

Emilie :

Jérôme :

Evri : la recherche se fait en fonction de nos centres d’intérêt
juin 12th, 2008 by emilie

Evri est un moteur de recherche lancé en version bêta le 29 mai par la société du même nom. Mais que fait-il au fait ce Evri ? D’après L’Atelier :

Il « va interconnecter les résultats de recherche des utilisateurs en fonction de leurs centres d’intérêt. »

Et L’Atelier poursuit en disant qu’il s’agit de :

« Une application qui correspond à la tendance vers plus de web sémantique où la machine comprend les informations qu’elle délivre« .

On assiste en ce moment à un boom du Web sémantique (ou Web 3.0) ! C’est pour la bonne cause bien sûr, le Web sémantique étant censé apporter de nombreux bénéfices aux utilisateurs, en l’occurrence pour la recherche. Reste qu’ils n’en sont pas véritablement conscients et donc qu’il est difficile de les faire passer d’un Google à un moteur de recherche alternatif, même si ce dernier est plus performant. On peut terminer en notant que :

  • Le Web sémantique n’en est qu’à ses balbutiements
  • Les applications recourant à ce type de technologie ne sont pour l’instant que des prototypes
  • Aujourd’hui, ce qui fera la différence entre deux moteurs de recherche identiques d’un point de vue technologique, ce sera l’interface ! (Jérôme : ce que nous soulignons déjà dans un précédent billet)

Jérôme : Le web sémantique et les moteurs sémantiques sont vraiment les termes à la mode en ce moment. C’est ainsi qu’un nouveau futur moteur nommé evri, se propose d’aider les internautes à trouver des contenus en relation avec leurs centres d’intérêt.
Parfait. Belle ambition. J’ai hâte de disposer d’un tel outil. Mais en habituel monsieur septique, j’ai quelques doutes, car encore une fois on nous fait miroiter que la machine va avoir accès au sens de l’information, alors que le web sémantique ce n’est pas tout à fait ça.

Mythes et réalités de la recherche sémantique
juin 4th, 2008 by jerome

Un très bon billet de Alex Iskold fait le point sur les mythes et les réalités de la recherche sémantique. Ce billet est en anglais, mais je vous conseille vivement de le lire.

Alex Iskold insiste sur le fait que contrairement à la croyance générale :

  • la recherche sémantique n’est pas meilleure que la recherche basique de type Google sur des questions basiques
  • elle ne peut pas résoudre tous les problèmes: « Il existe des limites fondamentales au delà desquelles l’ordinateur ne peut aller. Certains problèmes ont un nombre exponentiel de solutions et ce n’est pas parce que nous les représentons en RDF que nous allons magiquement les résoudre ».

Alex Iskold recadre donc le web sémantique et le définit comme une transposition à l’échelle du web des bases de données relationnelles. Et comment interrogeons-nous de telles bases de données ? Avec un langage structuré. Le challenge des moteurs de recherche sémantiques se situerait donc non pas dans l’étiquetage du Web, mais bel et bien dans son interface de recherche :

Comment interroger une base structurée ?

  • un unique champs de recherche permettant de formuler des requêtes en langage structuré ? Accessible uniquement aux spécialistes.
  • un formulaire de recherche présentant les nombreux champs de la base ? Encore trop compliqué (qui utilise les recherches avancées des moteurs ?)
  • une interface graphique de type wizard permettant d’affiner sa recherche à chaque étape ? C’est une piste, mais qui demande à fortement réfléchir sur l’interface utilisateur, et puis en général, lorsque l’utilisateur effectue une recherche, il veut une réponse immédiate.
  • un unique champs de recherche à la Google. Simple pour l’utilisateur, complexe pour le moteur. Ce dernier doit en effet analyser la recherche de l’utilisateur et la traduire en une requête structurée.

Ainsi, contrairement à Alex Iskold, je ne pense pas que les moteurs de recherche sémantiques prendront le pas sur Google en offrant une interface exhibant toute leur puissance, mais au contraire, lorsqu’ils trouveront une solution pour effectuer des recherches complexes tout en gardant une interface de recherche la plus simple possible.

Tout le challenge des Google Killers à venir est là (je pense entre autres à Yahoo! avec Search Monkey) : Comment offrir une interface de recherche simple pour interroger un contenu complexe et structuré ?

Emilie : la qualité des résultats d’une recherche est importante mais elle ne doit être possible à tous les prix, notamment via la complexification des modalités de recherche offertes aux utilisateurs. Plusieurs enquêtes ont montré que l’interface épurée de Google avait beaucoup contribué à son succès. En outre, tout doit être transparent : l’algorithme de recherche est difficile à concevoir, à mettre en oeuvre ? L’utilisateur final n’a pas à le savoir. D’ailleurs, peu importe que la recherche soit sémantique ou d’un autre type pour un utilisateur à partir du moment où il trouve ce qu’il recherche. C’est ce qui lui importe le plus selon moi.

La recherche par mots-clefs a t’elle de l’avenir ?
mai 16th, 2008 by emilie

La recherche par mots-clefs atteint-elle ses limites ? Je viens de tomber dessus sur cet un article qui date du 26 avril !!! J’ai pris un peu de retard dans la lecture de mes flux RSS. Désolée si vous l’avez déjà lu :(


L’article de TechCrunch revient sur le tableau réalisé par Novak Spicak dans lequel est représentée l’évolution de la recherche par mots-clefs depuis les prémices du Web jusqu’à ajourd’hui. Il met en parallèle l’efficacité des recherches avec l’augmentation phénoménale des données numériques. Et la conclusion c’est que quand nous aurons des milliards et des milliards de pages, la recherche par mot-clef ne suffira plus. Une façon pour lui de mettre en avant la nécessité de passer à des techniques de recherche différentes, comme la recherche basée sur le sens ! Et pour cause, il est le CEO et le fondateur de la startup sémantique Radarnetwoks.

Jérôme : Encore la sémantique ? Les machines capables d’accéder au sens ? Désolé mais c’est encore de la science-fiction. En revanche la structuration des informations comme les micro-formats me semble être la solution à moyen terme pour améliorer la recherche… Mais comment structurer toute cette informations ? Yahoo! A son idée…

Du coup, de moteurs de recherche comme Powerset, évoqué ici, ont de fortes chances d’empreinter la route du succès… en récupérant des internautes déçus par les recherches classiques ?

Powerset est lancé
mai 15th, 2008 by emilie

Le moteur de recherche sémantique/en langage naturel Powerset vient d’être lancé.

Emilie : Tiens, au fait, pourquoi n’utilise t’on pas le qualificatif « linguistique » ? On parle de moteur de recherche sémantique, mais dire qu’il y a de la sémantique sous-entend qu’il y a aussi de la syntaxe, non ? Et je trouve que « langage naturel » est une bien grande expression !

Jérôme : Effectivement, on s’empresse souvent de parler de sémantique et donc de sens, alors que les moteurs sont encore très loin d’accéder au niveau linguistique : Syntaxe, morphologie, grammaire propres à la langue.

Présenté comme un potentiel « Google killer », on ne peut se faire pour l’instant qu’une petite idée de ses capacités vu qu’il ne permet de rechercher que dans les articles de Wikipédia. Les réactions sont plutôt positives…

Voici quelques articles où les auteurs parlent de Powerset, des tests qu’ils ont faits et disent ce qu’ils pensent de ce moteur de recherche : TechCrunch France, Accessoweb, Abondance, NetEco, Clubic… Les autres articles sont sur Wikio.


Alors, la linguistique peut-elle rivaliser avec Google ? En termes de qualité, de rapidité… ?

Jérôme : J’ai toujours été convaincu que oui. Maintenant reste à le prouver! Beaucoup de bonnes choses dans powerset. L’outil me semble un peu compliqué et l’interface un peu lourde. Mais j’ai été assez surpris par exemple lors de la recherche sur French Paradox de constater que Powerset me surlignait le passage : « the French tend to eat higher levels of animal fat ». PowerSet mériterait de longs tests et un long billet, mais pour le moment, la base est un peu trop restreinte. A suivre de très prêt en tout cas !

Emilie : « PowerSet mériterait de longs tests et un long billet ». Oui, tout à fait !

»  Substance: WordPress   »  Style: Ahren Ahimsa