Les infos que nous n’avons pas abordées ni commentées :
Emilie :
Jérôme :
Les infos de la semaine que nous n’avons pas traitées et qui peuvent vous intéresser. Mais bon, il était essentiellement question de Bing cette semaine. Tout le monde en a parlé, y compris nous.
Emilie
Jérôme
Un titre un peu long, je vous l’accorde. Mais au moins, tout y est. On sait tout avant même de lire l’article et l’addition donne ça :
Une fois la requête saisie, le moteur vous renvoie les résultats. Vous pouvez :
On apprend que :
We use semantic tools to look at what was said. We then look at what they’ve said before. We then look at who was saying it.
L’avis d’un expert est le bienvenu. Jérôme ? Est-il vraiment sémantique ou pas selon toi au bien est-ce encore un pseudo moteur de recherche sémantique ?
Là il y a challenge ! Et pas facile de répondre à cette question ! Mais au premier abord, je dirais que non. Et je dirais même que si le service est plutôt bien fait et très pertinent d’un point de vue positionnement, il l’est beaucoup moins d’un point de vue pertinence des réponses. En effectuant par exemple la recherche « Chief Technical Officer » (qui est une recherche relativement commune dans le contexte de ce moteur), j’obtiens en 4ème résultat un poste intitulé « Organic Chemist – Clean Technology » (pas grand chose à voir avec ma recherche, non ?). Après étude de la page de l’annonce, nous retrouvons la phrase suivante : « Work in collaboration with the Chief Technical Officer » !!! Et dans la première page de résultats il y a plusieurs exemples du même type! Alors si les créateurs de twitterjobsearch ont développé des algorithmes hyper complexes et soit disant « sémantiques » pour obtenir de tels résultats, je pense qu’ils ont définitivement perdu leur temps. En filtrant de manière efficace leurs sources et en développant une méthode générique d’extraction des intitulés de postes, ils auraient obtenus de bien meilleurs résultats. Bref, à mes yeux, un produit intéressant, mais qui a encore du chemin à faire sur la pertinence pour fournir un vrai service à l’utilisateur.
Là il y a challenge ! Et pas facile de répondre à cette question ! Mais au premier abord, je dirais que non. Et je dirais même que si le service est plutôt bien fait et très pertinent d’un point de vue positionnement, il l’est beaucoup moins d’un point de vue pertinence des réponses. En effectuant par exemple la recherche « Chief Technical Officer » (qui est une recherche relativement commune dans le contexte de ce moteur), j’obtiens en 4ème résultat un poste intitulé « Organic Chemist – Clean Technology » (pas grand chose à voir avec ma recherche, non ?). Après étude de la page de l’annonce, nous retrouvons la phrase suivante : « Work in collaboration with the Chief Technical Officer » !!! Et dans la première page de résultats il y a plusieurs exemples du même type!
Alors si les créateurs de twitterjobsearch ont développé des algorithmes hyper complexes et soit disant « sémantiques » pour obtenir de tels résultats, je pense qu’ils ont définitivement perdu leur temps. En filtrant de manière efficace leurs sources et en développant une méthode générique d’extraction des intitulés de postes, ils auraient obtenus de bien meilleurs résultats.
Bref, à mes yeux, un produit intéressant, mais qui a encore du chemin à faire sur la pertinence pour fournir un vrai service à l’utilisateur.
Evri est un moteur de recherche lancé en version bêta le 29 mai par la société du même nom. Mais que fait-il au fait ce Evri ? D’après L’Atelier :
Il « va interconnecter les résultats de recherche des utilisateurs en fonction de leurs centres d’intérêt. »
Et L’Atelier poursuit en disant qu’il s’agit de :
« Une application qui correspond à la tendance vers plus de web sémantique où la machine comprend les informations qu’elle délivre« .
On assiste en ce moment à un boom du Web sémantique (ou Web 3.0) ! C’est pour la bonne cause bien sûr, le Web sémantique étant censé apporter de nombreux bénéfices aux utilisateurs, en l’occurrence pour la recherche. Reste qu’ils n’en sont pas véritablement conscients et donc qu’il est difficile de les faire passer d’un Google à un moteur de recherche alternatif, même si ce dernier est plus performant. On peut terminer en notant que :
Jérôme : Le web sémantique et les moteurs sémantiques sont vraiment les termes à la mode en ce moment. C’est ainsi qu’un nouveau futur moteur nommé evri, se propose d’aider les internautes à trouver des contenus en relation avec leurs centres d’intérêt. Parfait. Belle ambition. J’ai hâte de disposer d’un tel outil. Mais en habituel monsieur septique, j’ai quelques doutes, car encore une fois on nous fait miroiter que la machine va avoir accès au sens de l’information, alors que le web sémantique ce n’est pas tout à fait ça.
Un très bon billet de Alex Iskold fait le point sur les mythes et les réalités de la recherche sémantique. Ce billet est en anglais, mais je vous conseille vivement de le lire.
Alex Iskold insiste sur le fait que contrairement à la croyance générale :
Alex Iskold recadre donc le web sémantique et le définit comme une transposition à l’échelle du web des bases de données relationnelles. Et comment interrogeons-nous de telles bases de données ? Avec un langage structuré. Le challenge des moteurs de recherche sémantiques se situerait donc non pas dans l’étiquetage du Web, mais bel et bien dans son interface de recherche :
Comment interroger une base structurée ?
Ainsi, contrairement à Alex Iskold, je ne pense pas que les moteurs de recherche sémantiques prendront le pas sur Google en offrant une interface exhibant toute leur puissance, mais au contraire, lorsqu’ils trouveront une solution pour effectuer des recherches complexes tout en gardant une interface de recherche la plus simple possible.
Tout le challenge des Google Killers à venir est là (je pense entre autres à Yahoo! avec Search Monkey) : Comment offrir une interface de recherche simple pour interroger un contenu complexe et structuré ?
Emilie : la qualité des résultats d’une recherche est importante mais elle ne doit être possible à tous les prix, notamment via la complexification des modalités de recherche offertes aux utilisateurs. Plusieurs enquêtes ont montré que l’interface épurée de Google avait beaucoup contribué à son succès. En outre, tout doit être transparent : l’algorithme de recherche est difficile à concevoir, à mettre en oeuvre ? L’utilisateur final n’a pas à le savoir. D’ailleurs, peu importe que la recherche soit sémantique ou d’un autre type pour un utilisateur à partir du moment où il trouve ce qu’il recherche. C’est ce qui lui importe le plus selon moi.
La recherche par mots-clefs atteint-elle ses limites ? Je viens de tomber dessus sur cet un article qui date du 26 avril !!! J’ai pris un peu de retard dans la lecture de mes flux RSS. Désolée si vous l’avez déjà lu :(
L’article de TechCrunch revient sur le tableau réalisé par Novak Spicak dans lequel est représentée l’évolution de la recherche par mots-clefs depuis les prémices du Web jusqu’à ajourd’hui. Il met en parallèle l’efficacité des recherches avec l’augmentation phénoménale des données numériques. Et la conclusion c’est que quand nous aurons des milliards et des milliards de pages, la recherche par mot-clef ne suffira plus. Une façon pour lui de mettre en avant la nécessité de passer à des techniques de recherche différentes, comme la recherche basée sur le sens ! Et pour cause, il est le CEO et le fondateur de la startup sémantique Radarnetwoks.
Jérôme : Encore la sémantique ? Les machines capables d’accéder au sens ? Désolé mais c’est encore de la science-fiction. En revanche la structuration des informations comme les micro-formats me semble être la solution à moyen terme pour améliorer la recherche… Mais comment structurer toute cette informations ? Yahoo! A son idée…
Du coup, de moteurs de recherche comme Powerset, évoqué ici, ont de fortes chances d’empreinter la route du succès… en récupérant des internautes déçus par les recherches classiques ?
Le moteur de recherche sémantique/en langage naturel Powerset vient d’être lancé.
Emilie : Tiens, au fait, pourquoi n’utilise t’on pas le qualificatif « linguistique » ? On parle de moteur de recherche sémantique, mais dire qu’il y a de la sémantique sous-entend qu’il y a aussi de la syntaxe, non ? Et je trouve que « langage naturel » est une bien grande expression !
Jérôme : Effectivement, on s’empresse souvent de parler de sémantique et donc de sens, alors que les moteurs sont encore très loin d’accéder au niveau linguistique : Syntaxe, morphologie, grammaire propres à la langue.
Présenté comme un potentiel « Google killer », on ne peut se faire pour l’instant qu’une petite idée de ses capacités vu qu’il ne permet de rechercher que dans les articles de Wikipédia. Les réactions sont plutôt positives…
Voici quelques articles où les auteurs parlent de Powerset, des tests qu’ils ont faits et disent ce qu’ils pensent de ce moteur de recherche : TechCrunch France, Accessoweb, Abondance, NetEco, Clubic… Les autres articles sont sur Wikio.
Alors, la linguistique peut-elle rivaliser avec Google ? En termes de qualité, de rapidité… ?
Jérôme : J’ai toujours été convaincu que oui. Maintenant reste à le prouver! Beaucoup de bonnes choses dans powerset. L’outil me semble un peu compliqué et l’interface un peu lourde. Mais j’ai été assez surpris par exemple lors de la recherche sur French Paradox de constater que Powerset me surlignait le passage : « the French tend to eat higher levels of animal fat ». PowerSet mériterait de longs tests et un long billet, mais pour le moment, la base est un peu trop restreinte. A suivre de très prêt en tout cas !
Emilie : « PowerSet mériterait de longs tests et un long billet ». Oui, tout à fait !