Demander un devis

Pour demander un devis, contactez-nous en nous exposant vos besoins et attentes ainsi que vos deadline. Un devis vous sera renvoyé dans les plus brefs délais.

EN
+33 (0)6 13 79 84 50

Du Lundi au Vendredi - De 09h à 18h

Google sémantique en 5 étapes

oct. 6 2014

Le knowledge graph a marqué une étape majeure dans l'évolution et la reconnaissance de Google en tant que moteur de recherche sémantique. En effet, il est désormais possible de trier et d'extraire de façon intelligente des données reliées logiquement entre elles. En clair, un moteur de recherche sémantique est à même de comprendre et donc de répondre de façon ciblée à n'importe quelle source et requête, en utilisant des bases de données telles que Freebase, des outils comme Google Maps...

Knowledge Graph et relations intelligentes

Pour comprendre comment il est possible d'arriver à cette appréhension parfaite du traitement des données sur le web, voici des explications mises en ligne par David Amerland, sur les 5 étapes initiées par Google pour identifier les entités et la logique sémantique :

1. Des lettres au concept

Voilà le principe de la recherche sémantique de Google. Et c'est là qu'intervient Hummingbird, l'update la plus marquante depuis des années. Elle va analyser le sens d'une phrase dans sa globalité et non plus dans un enchainement de mots pour extraire le véritable sens de la question. La réponse sera donc beaucoup plus précise. A cette analyse s'ajoutent les résultats fournis par  les interactions humaines à travers les signaux sociaux.

Google utilise des informations provenant de "sources sures" comme Freebase ou Wikipédia pour construire son Knowledge Graph. Mais pas seulement : il se base également sur des donnés beaucoup plus larges et même si le Q&A service n'existe plus, les données récupérées sont toujours utilisables.

2. Lecture du web

Au coeur de ce projet, le Google Brain. C'est un moyen d'utiliser le "machine learning" pour cerner les valeurs relationnelles des connexions qui se créent entre des points de données individuelles. Google developpe un systéme d IA de plus en plus performant, destiné à traiter non plus des millions de points de données mais des milliards, affinant de plus en plus des résultats qui deviennent spectaculaires.

Machien learning et analyse des interconnexions

La lecture du web se base sur des techniques de scrapping, destinées à collecter toutes les informations sur le web, images, textes, vidéos commentaires...Une fois celles ci recueillies, leur validité sera vérifiée et évaluée : des recoupements seront opérés qui confirmeront le poids de l'information transmise. Ces informations sont recoupées avec l'actualité et les pics de recherche.

L'objectif de ce traitement des informations : pouvoir anticiper avec précision non seulement les faits à venir mais, plus important, cerner les facteurs déclencheurs des évènements. Google Now est un parfait exemple de ce que Google réalise déjà en terme d'anticipation de désirs.

3. Interroger le web

Il n'est pas toujours facile de trouver des informations sur la toile ou de comprendre ce que l'on trouve.

La pertinence d'une réponse est bien plus liée à la formulation précise de la question et à sa récurrence. Le web et le système de questions/ réponses fait que toute requête recevra satisfaction. “Web-based question answering systems typically employ rewriting procedures for converting components of questions into sets of queries posed to search engines, along with techniques for converting query results into one or more answers.”

En appliquant les concepts clés de la recherche et de l'extraction d'informations, le machine learning et le traitement du langage, Google arrive à ce point : les réponses à une " simple question" sont le résultat de l'analyse d'un corpus complexe de documents sur le web.

4. Interroger les gens

Le knowledge Graph comporte un lien qui permet de corriger les erreurs lues. Google crée un fichier d'historique permettant à un algorithme d'évaluer, sur la base des corrections passées faites par un utilisateur, leur validité ou pas. Et ce système de validation est mis en place pour d'autres produits. Les quizz proposés sur la toile par exemple permettent eux aussi d'affiner les connaissances : le simple fait de choisir de faire tel ou tel test est déjà un indicateur de poids.

Le problème stratégique majeur de cette technique pour collecter des infos reste celui-ci : savoir imaginer quelles questions sont pertinentes, sous quelle forme les présenter et à quelle cible.

Il faut donc parvenir à trouver votre vrai public pour arriver à en cerner toutes les attentes spécifiques.

5.Les questions ouvertes

Il est évident que de nouvelles relations et de nouvelles entités apparaissent en continu, poussant la recherche à évoluer en parallèle. Trouver, vérifier, analyser, classer correctement est un travail sans fin. On se heurte aussi à des problèmes divers comme l'homonymie qui complique les résultats d'affichage de requête,  "jaguar" réfère t-il à l'animal ou bien à la voiture ? Seul le contexte sémantique pertinent va permttre de répondre à la demande.

Et parce que rien n'est plus clair que des images, voici une vidéo qui présenten les changments liés au web sémantique.

 

Avec un internet où le sémantique prend une part de plus en plus importante, il devient nécessaire de rédiger des articles de manière structurée, simple et compréhensible à la fois pour le lecteur et le moteur. Au delà d'une simple optimisation des posts sur Google+, tous vos articles doivent être aménagés pour que les moteurs puissent les comprendre sémantiquement.... il y a peu à parier que nous verrons bientôt naitre des prestations de rédaction sémantique.

Ajouter un commentaire