Retour au site
Connexion :
Abonnement NewsletterOk

Recherche : Microsoft s'offre un moteur sémantique

Brève Business Internet

L'avenir de la recherche chez Microsoft ne passera peut-être pas par Yahoo, mais le numéro un mondial des éditeurs n'abandonne pas pour autant ses velléités en matière de croissance externe sur Internet. Microsoft a en effet confirmé mardi l'acquisition de la société Powerset, dévolue au développement de techniques de recherche en langage naturel. Le montant de la transaction n'a pas été dévoilé, mais les initiés évoquent une somme avoisinant cent millions de dollars.

Basée à San Francisco, Californie, Powerset a été fondée en 2005. La start-up a reçu, l'année suivante, le soutien des fonds Foundation Capital, Founders Fund et Paperboy Ventures. En mai 2008, elle a lancé son premier produit commercial, un outil de recherche sémantique pour Wikipedia, l'encyclopédie collaborative en ligne.

Rêve de linguiste, la recherche en langage naturel, ou recherche sémantique, repose sur l'interprétation de phrases construites plutôt que sur une sélection de mots clé et d'opérateurs booléens. Défendue par Tim Berners Lee, l'un des pères fondateurs du Web actuel, elle consiste donc à analyser de façon sémantique et syntaxique la proposition entrée à l'internaute, voir comment les mots s'articulent, pour déterminer le sens exact de la recherche. Plutôt que de saisir des mots disparates, on posera donc sa question sous la forme d'une phrase complète.

Powerset, recherche naturelle dans Wikipedia


En proie à la montée en puissance de Google, notamment sur le marché américain ou ses parts sont passées de 7,6% en mai 2007 à 5,9% en mai 2008 (chiffres Hitwise), Microsoft tente un pari sur l'avenir, dans la mesure où l'intégration des technologies développées par Powerset à MSN Search - Live Search ne se fera vraisemblablement pas sans heurts et, surtout, pas avant plusieurs années.
Actu précédente
Brève suivante
Les Commentaires des lecteurs
_
 
le 02 Juill. 08 à 09h38
Edition
 
C'est peut-être en effet simplement un "rêve de linguiste". La recherche classique sur le Web on commence quand même à la maitriser, à part peut-être les derniers à s'y être mis. A voir.
 
le 02 Juill. 08 à 09h42
Edition
Message très intéressant
 
J'ai testé le moteur sémantique de Wikipedia et c'est impressionnant mais cela ne fonctionne que si la question est posée selon un modèle prédéfini.
En gros, hors de question de poser une question sans faire attention à la grammaire et aux règles syntaxiques de la langue dans laquelle fonctionne le moteur.

Il reste cependant du travail car certaines questions ne rapportent que des réponses un peu à coté de la plaque (mais toutefois en rapport avec le sujet, ce qui revient à utiliser un moteur classique basé sur l'index des termes recherchés).

Il faudrait aussi que plus de thèmes soient reconnus. Pour le moment la notion de date, lieu, personnage c'est OK (donc très utile pour une recherche liée à histoire/géographie) mais pour une utilisation spécifique, du boulot reste à abattre.

Une bonne avancée, toutefois...d'autant plus que cette recherche sémantique combine à la fois l'analyse syntaxique mais aussi une recherche complémentaire par mots clés, ce qui augmente la précision des résultats.

Edit : voici un super lien sur l'approche théorique/pratique de la mise en œuvre d'un moteur de ce type. A lire si ça vous intéresse : www.lingway.com...
Edité le 02/07/2008 à 09:43
 
Voir profilContacter le membre
le 02 Juill. 08 à 09h43
Edition
 
Dams333 a écrit:
C'est peut-être en effet simplement un "rêve de linguiste". La recherche classique sur le Web on commence quand même à la maitriser, à part peut-être les derniers à s'y être mis. A voir.

+1

Je pense aussi que la plupart des recherches se font sur 1 ou 2 mots, guere plus... alors la recherche en "langage naturel" me semble etre un peu du flan...
A mon avis, il y aurait bien plus d'interet a partir sur de l'indexation poussee de photos et videos (reconnaissance de contexte, des gens, des objets, etc)
 
le 02 Juill. 08 à 09h44
Edition
 
Hum pour la recherche sur Google j'tape ma question et j'ai souvent la réponse. Comme dit Dams <<simplement un "rêve de linguiste">> moi j'en vois pas trop l'utilitée pour ma part.
 
Contacter le membreVoir profil
le 02 Juill. 08 à 09h45
Edition
 
romanohunter a écrit:
J'ai testé le moteur sémantique de Wikipedia et c'est impressionnant mais cela ne fonctionne que si la question est posée selon un modèle prédéfini.

Attention, ce n'est pas le moteur DE wikipedia mais le moteur d'une boite totalement independante qui a choisi d'utiliser wikipedia comme base de test (pasque l'indexation du net, c'est long, lourd et couteux pour une demo)
 
le 02 Juill. 08 à 09h46
Edition
 
Dams333 a écrit:
C'est peut-être en effet simplement un "rêve de linguiste". La recherche classique sur le Web on commence quand même à la maitriser, à part peut-être les derniers à s'y être mis. A voir.

Détrompe toi, je connais pas mal de monde (qui ne connait rien à l'informatique sinon utiliser word....) et qui font des recherches par phrases complètes !!! J'ai beau leur expliquer mais cela ne rentre pas. Le principe est donc pas mal à mon avis.

A suivre donc d'ici quelques temps

Bonne journée à tous.
 
le 02 Juill. 08 à 09h46
Edition
 
J'avais éssayé ce moteur sous wikipedia et il marchait plutot bien. Après il est limité à l'anglais mais si la recherche sémantique tend à se généraliser, sa va demander un boulot énorme car la sémantique varie d'une langue à l'autre en clair c'est pas prèt d'arriver
 
le 02 Juill. 08 à 09h48
Edition
 
Je pense que la recherche dite booléenne a fait son temps et qu'il faut à présent évoluer vers ce type de recherche plus proche du langage humain. C'est vrai que la recherche par "mots présents" uniquement sans tenir compte du sens... n'a jamais eu de sens justement. Ca donne lieu a des aberrations assez souvent même si ce type de recherche reste assez efficace mais grâce à d'autres critères.
En revanche je ne vois pas pourquoi il faudra attendre des années pour voir ça se mettre en place.
 
le 02 Juill. 08 à 09h48
Edition
 
KP2 a écrit:
romanohunter a écrit:
J'ai testé le moteur sémantique de Wikipedia et c'est impressionnant mais cela ne fonctionne que si la question est posée selon un modèle prédéfini.

Attention, ce n'est pas le moteur DE wikipedia mais le moteur d'une boite totalement independante qui a choisi d'utiliser wikipedia comme base de test (pasque l'indexation du net, c'est long, lourd et couteux pour une demo)

Tout à fait, j'ai écrit comme ça par pure fainéantise crapuleuse plutôt que de m'expliquer sur plusieurs lignes :ane:
 
le 02 Juill. 08 à 09h49
Edition
Message peu intéressant
 
l'intégration des technologies développées par Powerset à MSN Search - Live Search ne se fera vraisemblablement pas sans heurts et, surtout, pas avant plusieurs années.
Autant dire que Microsoft l'a racheté pour l'entérer et ainsi éviter que Yahoo et Google ne prennent plus d'avance qu'il n'en ont déja sur MSN Search et Live Search

Surtout que rien que d'imaginer MS intégrer ça à leur moteur de recherche me fait mourir de rire :
"êtes vous sûr de vouloir effectuer une recherche sur les société en situation de monopole et utilisant la concurrence déloyale, la contrefaçon, le vol de brevets et le dumping et la corruption des classe politiques aux État Unis d'Amérique afin de ne pas être démantelées?"
"Annuler ou reformuler votre question?"
Edité le 02/07/2008 à 09:52
 
le 02 Juill. 08 à 09h51
Edition
 
A quand le moteur de recherche évolué qui comprend le langage du kikoolol ?
"Jve le sit 2 tokio o tel !" et hop il tombe sur un site pour apprendre le français.
 
le 02 Juill. 08 à 09h52
Edition
 
Bah, le moteur de recherche français Exalead fait aussi de la recherche sémantique !
 
le 02 Juill. 08 à 09h55
Edition
 
Atreide a écrit:
l'intégration des technologies développées par Powerset à MSN Search - Live Search ne se fera vraisemblablement pas sans heurts et, surtout, pas avant plusieurs années.
Autant dire que Microsoft l'a racheté pour l'entérer et ainsi éviter que Yahoo et Google ne prennent plus d'avance qu'il n'en ont déja sur MSN Search et Live Search

Surtout que rien que d'imaginer MS intégrer ça à leur moteur de recherche me fait mourir de rire :
"êtes vous sûr de vouloir effectuer une recherche sur les société en situation de monopole et utilisant la concurrence déloyale, la contrefaçon, le vol de brevets et le dumping comme moyen de corruption auprès des classe politiques aux État Unis d'Amérique?"

Onze messages et déjà un troll. Les forums Clubic en sont de plus en plus infestés :/

Je ne pense pas que ce type de recherche soit vérifié. Les phrases du genre "comment faire une bombe" et assimilées ont déjà plus de chances d'être "blacklistées"...
Par contre pour la censure qui existe en Chine (et ailleurs), la recherche sémantique est effectivement plus contrôlable qu'un simple mot clé (ex. "Comment joindre les militants pour les droits de l'homme en Chine" est un bon exemple de question censurée :paf: )

-Oo- a écrit:
A quand le moteur de recherche évolué qui comprend le langage du kikoolol ?
"Jve le sit 2 tokio o tel !" et hop il tombe sur un site pour apprendre le français.

J'aurai plutôt pensé à un site qui permet aux gens d'aller en Suisse (ou ailleurs) pour l'euthanasie :nexath
Edité le 02/07/2008 à 09:55
 
le 02 Juill. 08 à 09h58
Edition
 
romanohunter a écrit:
En gros, hors de question de poser une question sans faire attention à la grammaire et aux règles syntaxiques de la langue dans laquelle fonctionne le moteur.

Ouais donc déjà ça va restreindre fortement le nombre d'utilisateurs... Parce que 'sa' n'a pas le même sens que 'ça', parce que 'comme même' ça veut rien dire, j'en passe et des meilleures. Epuration du Web par la connaissance?? Mmmh, je love!!
 
le 02 Juill. 08 à 09h58
Edition
 
@ -Oo- => Tu pense qu'ils y arriveront ?? Ca serait un grand bon pour l'humanitée :) mais avec une recherche sur Tokyo Hotel ils pourraient plutôt aller sur un site genre apprendre à écouter de la VRAI musique et pas des ados prépuberes qui jouent aux Pokemon ??

Sinon l'idée est pas mal. Genre tu tape "Wesh trankil bien ou bien" et tu va direct sur un site d'initiation au language de personnes normale sans déficience psychologique :)
Edité le 02/07/2008 à 10:08
 
le 02 Juill. 08 à 10h00
Edition
 
Atreide a écrit:
l'intégration des technologies développées par Powerset à MSN Search - Live Search ne se fera vraisemblablement pas sans heurts et, surtout, pas avant plusieurs années.
Autant dire que Microsoft l'a racheté pour l'entérer et ainsi éviter que Yahoo et Google ne prennent plus d'avance qu'il n'en ont déja sur MSN Search et Live Search

L'enterrer ? Ce serait idiot, je pense, parce que je doute que cela empeche Yahoo, google (ou meme une autre boite) de travailler sur la recherche sémantique.
 
le 02 Juill. 08 à 10h00
Edition
 
Microsoft a en effet mardi l'acquisition du moteur de recherche sémantique Powerset.

Cherchez l'erreur
 
le 02 Juill. 08 à 10h04
Edition
 
Laquelles ?? Microsoft ?? ou la phrase en elle même ???
:ane:

En tout cas ça ce voit que c'est le matin ^^
 
le 02 Juill. 08 à 10h04
Edition
 
Bienvenue dans le web 3.0
 
 



 
Clubic.com
 
Achetez-facile.com
 
Jeuxvideo.fr
 
neteco.com
 
mobinaute.com