09.10.2008
Demain l'intelligence des données


Une contribution de Hubert Guillaud* (4/4)
NB : Hubert Guillaud nous a aimablement autorisé à publier l'article qui suit et qui est déjà paru sur le site Internet actu en 2007 mais qui demeure... d'actualité.
"Quand on regarde l’avenir, on a souvent tendance à penser que le changement le plus radical reposera sur l’internet des objets, une intelligence qui va bouleverser notre relation avec eux et leurs relations entre eux. Bien sûr, parce qu’on va les tenir dans nos mains, parce qu’ils vont bouger sous nos yeux, ces changements-là seront spectaculaires.
Pourtant, demain, il n’y a pas que les objets qui seront intelligents : il y aura aussi les données. Et l’impact de ce changement pourrait bien être tout aussi radical.
Voilà longtemps que Tim Berners-Lee nous explique que le web sémantique est l’avenir du web (voir la traduction de l’article originale dans la lettre de l’URfist de Toulouse de novembre 2001 .pdf). Reste que le terme est difficile à faire comprendre et entendre à bien des néophytes. Sans compter que l’évolution qui se profile dans le domaine des données ne repose pas seulement sur la sémantisation du web et ne se résume pas à inscrire des méta-données pour décrire les données.
L’intelligence des données (au sens, plutôt, que l’on donne à “intelligence économique”), c’est d’abord leur abondance et leur accessibilité, même si chaque donnée demeure elle-même tout à fait brute. C’est par exemple accéder aux données de tel capteur, de telle caméra ou de tel moniteur. C’est la possibilité, demain de tracer n’importe quel évènement du monde réel. C’est la fouille de données accessible depuis chez soi, permettant d’analyser les statistiques de la criminalité ou de la circulation dans sa ville, ou des informations sur ce que lisent les gens, avec un raffinement de détails, des modalités de recherche et de précision dans la requête toujours plus grands.
Ce n’est donc pas seulement la sémantisation qui change la donne, mais aussi l’accès à un nombre croissant de données, associé à la possibilité de les reconfigurer, de les recombiner sans cesse, de plus en plus facilement, pour en tirer des intuitions neuves ; la possibilité d’en faire des mashups, de produire des nouveaux services dont elles forment la matière première… Quand les données elles-mêmes ne sont pas “intelligentes”, leur masse, bien exploitée, peut produire du sens bien au-delà de ce que nous imaginons, comme l’explique Ian Ayres. Pas seulement des masses d’information statiques et statistiques d’ailleurs, mais des données qui vont être de plus en plus dynamiques, parce qu’elles seront accessibles à distance et en temps réel bien sûr, mais surtout parce que ces données mêmes seront le résultat de flux de données eux-mêmes mouvants. De combinatoires. De formules appelant d’autres données, provenant de bases sémantisées, de nos historiques de navigation, ou de requêtes sur des applications tierces.
Comme l’imageait Bradley Horowitz, responsable du département des nouvelles technologies chez Yahoo, en évoquant l’avenir de l’internet des objets pour la BBC : “Mon téléphone sait toujours l’heure qu’il est. Il sait approximativement toujours où je suis via GPS ou via le réseau téléphonique qu’il utilise. Si le système sait aussi que je suis présent à tel évènement à telle heure (via mon agenda ou mes messages), alors quand je prends une photo, le système est capable d’automatiser l’étiquetage de cet évènement et d’introduire les métadonnées automatiquement. C’est ce vers quoi nous tendons : un monde où le qui, quoi, où et quand peuvent être générés, lus et résolus automatiquement par les machines.”
Le croisement des données elles-mêmes, au lieu et à l’heure où elles sont collectées ou regroupées va en générer de nouvelles.
L’intelligence des données, ce n’est pas que le web sémantique, c’est aussi le web implicite, celui qui comprend ce que vous faites, ce que vous avez fait et en déduit ce que vous allez faire. C’est celui qui trace vos données, votre histoire, qui suit votre “parcours”, votre “chemin” pour apprendre de vous et mieux vous servir et qui se diffuse demain au-delà du web, jusqu’à nos mobiles.
L’intelligence des données c’est enfin ce web que nous façonnons à coups de liens, d’étiquettes, d’intelligence collective : “Chaque fois que nous forgeons un lien entre les mots, nous lui enseignons une idée”, disait Kevin Kelly. C’est ce web qui apprend de nous. Ces données qui prennent du sens quand on les touche. Nos actions qui deviennent une donnée primordiale pour donner de l’intelligence à l’ensemble. Un web sémantique a posteriori, en quelque sorte, qui repose sur le constat qu’il semble parfois plus difficile de rendre les données “intelligentes” en les qualifiant a priori, que d’acquérir une “intelligence”, une perception et une compréhension riches, des données brutes que notre monde produit à jet continu.
Assurément, l’intelligence des données va transformer notre rapport à l’information aussi sûrement que l’internet des objets va bouleverser notre rapport à notre quotidien (l’un n’ira pas sans l’autre d’ailleurs).
Nous allons mesurer le monde, notre vie, notre entourage, notre réseau comme jamais. Tout sera traçable et tracé, comme le montre d’une manière ludique Socialistics, cette petite application pour Facebook qui mesure les pulsations de votre réseau social. Un outil de lifelogging (ces outils qui augmentent notre intimité d’informations) qui rassemble toutes les données de votre réseau relationnel pour produire des mesures vous permettant d’en connaître les tendances (répartition par âge, par ville ou pays, par genre, par tendances politiques ou religieuses…). Cet outils de classement et d’analyse illustre à merveille la puissance de l’information que l’on pourrait être capable de produire demain. Cela ne va pas seulement nous donner accès à une “nouvelle classe d’outils”, comme l’évoquait Tim Berners Lee, mais radicalement changer nos pratiques, notre regard sur celles-ci et sur tout ce que nous faisons et nous entoure.
Reste qu’il ne faut pas oublier que les données ne sont pas intelligentes pour elle-mêmes. Leur couplage peut aussi produire des syllogismes faciles et des erreurs d’interprétation : coupler une base de donnée statistique sur la criminalité et une autre sur la pauvreté de la population fera peut-être ressortir l’image fameuse des “Classes laborieuses, classes dangereuses”. Cela n’en fait pas forcément une vérité, disait déjà l’historien Louis Chevalier. Et puis, on n’est pas obligé d’aimer la perspective d’un monde infiniment lisible, traçable et analysable. Ca ne doit pas nous empêcher d’y réfléchir."
Hubert Guillaud
*Hubert Guillaud est éditeur de formation, est rédacteur en chef d'InternetActu.net et responsable de la veille à la Fondation Internet nouvelle génération.
13:54 Publié dans - Après Web...2, - Innovation, - Marketing-Communication, - Mobilités, - Prospective, trends | Lien permanent | Commentaires (0) | Envoyer cette note
| Tags : hubert guillaud, intelligence des données, web 2, web 3, après web |
|
del.icio.us
|
|
Digg |
Facebook
Vers le Web 3.0


Une contribution de Hubert Guillaud*(3/4)
NB : Hubert Guillaud nous a aimablement autorisé à publier l'article qui suit et qui est déjà paru sur le site Internet actu en 2006 mais qui demeure... d'actualité.
“Le web 2.0, qui décrit la capacité de relier sans couture des applications (comme la cartographie) et des services (comme le partage de photographies) via l’internet, est devenu ces derniers mois le centre d’attention de toutes les sociétés de la Silicon Valley. Pour autant, l’intérêt commercial pour le Web 3.0 - ou “le web sémantique” - émerge seulement maintenant.
L’exemple classique de l’ère du Web 2.0 est le mashup - par exemple, un site web de location de vacances relié aux cartes de Google pour créer un service nouveau et plus utile qui montre rapidement, sur une carte, la liste des locations disponibles.
Le Saint Graal des promoteurs du web sémantique consiste en un système capable de donner une réponse raisonnable et complète à une question simple du type : “Je recherche un endroit chaud pour les vacances. J’ai un budget de 3 000 dollars. Ah, et nous avons un enfant de 11 ans.”
Répondre à une telle question aujourd’hui peut exiger des heures de tri dans des listes distinctes de vols, hôtels et locations de voitures, qui proposent des options souvent contradictoires. Avec le web 3.0, la requête appellerait une réponse cohérente, aussi méticuleusement assemblée que si elle l’avait été par un agent de voyage humain.
Comment de tels systèmes s’établiront-ils, et quand commenceront-ils à fournir des réponses signicatives, commence à être le sujet de discussion de nombreux chercheurs et d’experts”, explique John Markoff pour le New York Times (enregistrement obligatoire).
Pour Markoff, ce web 3.0 s’appuie sur la fouille des connaissances humaines, comme Google l’a exploitée avec son Page Rank (qui interprète les liens d’une page web à une autre comme un vote). Et de donner une somme d’exemples à sa thèse : “Nous allons d’un web de documents connectés à un web de données connectées”, explique Nova Spivack, de Radar Networks, une start-up qui exploite le contenu de sites de réseaux sociaux et qui signalait il y a peu, sur son blog, son ras-le-bol du web 2.0 (“Détruire le mythe du web 2.0″). KnowItAll, issu d’un groupe de recherche de l’université de Washington, extrait et agrège l’information de sites de critiques de produits pour donner des informations compréhensibles à l’usager. Ainsi, aujourd’hui, pour avoir une information sur un voyage, vous devez passer en revue de longues listes de commentaires glanées sur le web. Avec le web 3.0, le système vous classera tous les commentaires et trouvera, par déduction cognitive, le bon hôtel pour votre besoin particulier.
“Dans son état actuel, le web est souvent décrit comme étant dans sa phase Lego, avec plein de parties différentes capables de se connecter les unes aux autres. Ceux qui portent la vision d’une prochaine phase, le web 3.0, le voient comme une ère où les machines commenceront à faire des choses apparemment intelligentes.”
“Il est clair que la connaissance humaine est plus exposée aux machines qu’elle ne l’a jamais été”, explique Danny Hillis de Metaweb. Des systèmes d’intelligence artificielle, comme Metaweb. Des systèmes d’intelligence artificielle, comme Cyc, qui combinent des bases de règles classiques à l’analyse des contenus du web, pourraient permettre d’exploiter toujours mieux cette incroyable base de donnée que constitue aujourd’hui le web pour fournir des réponses à des questions complètes. A moins, pense le responsable de la recherche de Yahoo!, que le salut ne vienne de l’intervention agrégée des utilisateurs : “Avec FlickR, vous trouvez des images qu’un ordinateur ne pourrait pas trouver. Des problèmes qui nous on défiés depuis 50 ans, deviennent brusquement triviaux.”“
Hubert Guillaud
*Hubert Guillaud est éditeur de formation, est rédacteur en chef d'InternetActu.net et responsable de la veille à la Fondation Internet nouvelle génération.
13:50 Publié dans - Après Web...2, - Innovation, - Internet, Web2.0, - Prospective, trends | Lien permanent | Commentaires (2) | Envoyer cette note
| Tags : hubert guillaud, web 3, web 3.0, web 2 |
|
del.icio.us
|
|
Digg |
Facebook
Vers un Web granulaire


Une contribution de Hubert Guillaud* (2/4)
NB : Hubert Guillaud nous a aimablement autorisé à publier l'article qui suit et qui est déjà paru sur le site Internet actu en 2007 mais qui demeure... d'actualité.
"La conception web peut-elle devenir plus granulaire ? Par granulaire, on entend la possibilité de composer des sites web complexes à partir de “pièces détachées”, de fonctions unitaires externalisées auprès d’autres acteurs. Ainsi, on peut de plus en plus imaginer l’externalisation de processus tels que l’authentification d’un utilisateur (OpenId), la mise en place d’un système de réputation (RapLeaf), le stockage (Amazon S3) ou le traitement de données (Amazon EC2), la vérification des e-mails (Undisposable) de vos visiteurs, etc. Autant de bases de données et de fonctions qui, connectées les unes aux autres, finissent par constituer l’infrastructure même de services riches et complexes. Cela induit deux avantages majeurs explique Emre Sokullu pour Read/Write web : diminuer le coût et le temps de développement, et profiter à la demande de solutions puissantes et massives.
Mais “pourquoi alors l’implémentation de ces solutions - qui sont pourtant l’une des promesses du web 2.0 - reste -t-elle si lente ?”, s’interroge Emre Sokullu. Parce qu’avec ces applications on ne se contente pas de sous-traiter un service, on transfère une partie de son capital. Déléguer l’authentification, ou la gestion de la réputation, c’est-à-dire une partie de sa relation avec ses propres clients/utilisateurs, n’a rien d’évident. “Partager” son client pour construire des “suites servicielles” qui répondent de manière plus complète, ou plus personnalisée, à ses besoins est certes nécessaire, comme l’explique depuis longtemps Bruno Marzloff (par exemple dans Mobilités.net, pp. 54-58) - mais il s’agit bien d’abandonner, ou a minima de partager, la propriété d’une part de son capital, ce à quoi peu d’entrepreneurs sont aujourd’hui préparés…
Ces services sont aussi perçus comme incertains : comment faire confiance à des start-ups, voir même à des grandes sociétés comme Amazon, quand on ne voit pas toujours clairement où et comment elles tirent profit de ces services ? L’éventuelle indisponibilité fait aussi partie des risques invoqués : plus la chaine compte de maillons indépendants, plus les sources de problèmes potentiels se multiplient (pour ma part, j’aurais tendance à dire que c’est là l’argument le moins pertinent : la plupart de ces services sont extrêmement fiables et supportent très bien les montées de charge, c’est d’ailleurs l’un de leurs principaux arguments de vente).
Enfin, la mise en oeuvre n’est pas si facile. Les développeurs doivent comprendre de nouvelles structures de développement et intégrer des API (interfaces de programmation) toujours différentes pour expérimenter ces services.
Face aux nécessité toujours plus grandes de fonctionnalités, face à l’exigence d’innovation qu’imposent les petits comme les grands acteurs du web, on devine pourtant qu’il n’y a pas d’autres modèles à terme. Qu’on ne peut plus imaginer de vastes développements sans faire appel à des éléments extérieurs. Ça n’est d’ailleurs pas totalement nouveau. Les sociétés de service font depuis plusieurs années de l’”intégration de services”, même s’il s’agit plus souvent d’agencer différents logiciels entre eux au sein des frontières du système d’information, que d’exploiter une multitude de web services.
Comme le souligne Didier Durand, cette structuration permettra bientôt de monter des sociétés sans infrastructures propres “en limitant son travail au strict apport de sa valeur ajoutée spécifique, sans répliquer les bases opérationnelles déjà disponibles en tant que service et pouvant fonctionner à l’échelle du web tout entier”. Les services vont donc pouvoir se croiser pour prospérer les uns grâce aux autres. Les sociétés pourront accéder à des centaines de millions d’utilisateurs par des canaux et dans des contextes les plus variés, sans avoir à résoudre des problèmes d’échelle ou de disponibilité de services… Une perspective qui est déjà en train de transformer radicalement le ticket d’entrée dans le monde de l’innovation technologique logicielle, et qui pourrait, pourquoi pas, souligne Didier Durand, redistribuer les cartes de l’investissement entrepreneurial.
Ce web granulaire contient en germe une autre perspective qui pourrait s’avérer encore plus déterminante à l’avenir : la capacité de ces pièces détachées à “transformer les applications en environnements programmables”, comme le décrit Tim O’Reilly en évoquant Pipes, la dernière et remarquable innovation lancée par Yahoo! (Pipes pour “tuyaux”, en référence à ces lignes de code qui permettent de faire communiquer deux programmes informatiques, comme l’explique InFlux). Yahoo! Pipes est un service en ligne qui permet de mixer très librement des flux d’information ou des fonctionnalités, via un éditeur de programmation visuel et simplifié, pour créer de véritables applications composites, sans avoir besoin de savoir programmer. “L’usager technophile et “early-adopter” est donc aujourd’hui convié à évoluer dans une sphère socio-technique dont “on” lui offre de maitriser les outils, les environnements, les procédures, les techniques”, conclut Olivier Ertzscheid. On peut ainsi créer en quelques minutes une application qui va illustrer à partir de photos de FlickR les articles du Monde, du Figaro ou de votre propre site à partir des mots clefs présents dans le texte ; ou encore construire une application qui mixe les informations sur les restaurants de Chicago via Yahoo! Local et les photos de ceux-ci via FlickR.
Bien évidemment ce qui devient le plus important dans cet environnement, c’est la qualité des données et de leur structuration, comme le souligne très justement Alex Iskold pour Read/Write Web. Sans compter qu’il faudra aussi que ce type d’outils s’ouvre vraiment… En effet, l’essentiel des bases de données que Yahoo!Pipes permet d’utiliser à ce jour sont celles de de services appartenant à Yahoo. Faut-il y voir un signe que même les grands du Web 2.0 ont du mal à partager la propriété de leur capital ?"
Hubert Guillaud
*Hubert Guillaud est éditeur de formation, est rédacteur en chef d'InternetActu.net et responsable de la veille à la Fondation Internet nouvelle génération.
13:46 Publié dans - Après Web...2, - Innovation, - Internet, Web2.0, - Prospective, trends | Lien permanent | Commentaires (0) | Envoyer cette note
| Tags : hubert guillaud, web granulaire, web 2, web 3, après web |
|
del.icio.us
|
|
Digg |
Facebook
Vers le Web implicite


Une contribution de Hubert Guillaud* (1/4)
NB : Hubert Guillaud nous a aimablement autorisé à publier l'article qui suit et qui est déjà paru sur le site Internet actu en 2007 mais qui demeure... d'actualité.
"Le concept du web implicite est simple”, explique Alex Iskold de Read/Write Web. “Quand nous touchons l’information, nous votons pour elle. Quand nous venons sur un billet depuis un article qu’on a apprécié, nous passons du temps à le lire. Quand on aime un film, nous le recommandons à nos amis et à notre famille. Et si un morceau de musique résonne en nous, nous l’écoutons en boucle encore et encore. Nous le faisons automatiquement, implicitement. Mais les conséquences de ce comportement sont importantes : les choses auxquelles nous prêtons attention ont une grande valeur pour nous, parce que nous les apprécions.”
Le web nous donne justement l’occasion de capturer ce sur quoi nous portons de l’attention. Le web implicite est déjà une réalité, comme le montrent les moteurs de recherche et les moteurs de recommandations : nos gestes et actions en ligne révèlent nos intentions et nos réactions. Et d’en donner comme bon exemple, Last.fm, le moteur de recommandation de musique qui, se basant sur votre bibliothèque d’artistes préférés, vous recommande des chansons que vous ne connaissez pas. Nos achats, nos navigations, nos requêtes alimentent des moteurs de recommandation qui affinent le World Wide Web pour nous. “Nous sommes donc passés d’une toute puissance du lien hypertexte, point nécessairement nodal de développement du réseau et des services et outils associés, à une toute puissance du “parcours”, de la navigation “qui fait sens”, de la navigation “orientée” au double sens du terme”, explique avec brio Olivier Ertzscheid. Bien sûr, cette attention portée à nos actions contient en germe des menaces sur notre intimité : pas tant sur le fait de monétiser nos parcours dans des logiques marketing propres au service qu’on utilise, mais plus encore des dérives d’exploitation tierces de nos profils. Que Google exploite notre historique de requêtes pour affiner les nôtres et nous proposer de la publicité adaptée quand on utilise ses services, soit, mais que ce même parcours bénéficie à l’un de ses partenaires ou à un autre service que je fréquente (ou pire, que je ne fréquente pas) posera certainement des questions plus profondes.
Le lien hypertexte a-t-il encore du sens ?
Le lien hypertexte va-t-il disparaître ? C’est l’une des implications terriblement provocatrice que suggère l’idée du web implicite. Le lien hypertexte, sous sa forme actuelle, nous conduit d’un endroit fixe à un autre endroit fixe, sans prendre en compte notre parcours, nos désirs, nos envies, le temps qui passe, l’actualité… En fait, ce n’est pas tant le lien hypertexte qui est appelé à disparaître que la stabilité de la relation entre deux documents que le lien créé. Demain, nos liens lieront des données, des documents et des données, des documents en train de se faire et des données à venir. Les liens se produiront tout seuls ou presque, au sein d’applications, à partir de nos traces et à partir de termes ouverts à l’interprétation. Le web devient un espace d’inférences, comme s’il mimait un début de capacité de raisonnement, lui permettant de s’adapter, de muter, selon l’environnement, pour mieux nous servir, voire mieux nous ressembler.
Nos liens vont devenir instables. Nos mots eux-mêmes ne seront peut-être plus que des inconnues dans des équations de phrases, des termes mouvants au gré de l’actualité ou des visiteurs pour mieux s’adapter aux contextes de chacun. C’est ce que montre par exemple une des nouvelles fonctions de Google Doc (une fonction qui date visiblement de novembre 2006, mais que Google Blogoscoped a mis en avant seulement récemment) : GoogleLookup. L’idée de GoogleLookup est assez simple : permettre d’interfacer les résultats d’un tableau avec des données issues du web. Le but : permettre à votre tableau aujourd’hui, à votre graphique et à vos textes demain, de rester à jour. En entrant une formule particulière, qui cherche les données sur le web, il est ainsi possible de créer un tableau où le nom du maire ou celui d’un ministre se met à jour tout seul, via l’internet (explications et limites actuelles des données interrogeables). Votre tableau de données peut aussi se connecter à des résultats sportifs ou à GoogleFinance et incorporer les dernières valeurs d’un marché (explications complémentaires). Les documents que nous rédigerons pourront demain citer des fonctions ou des données plutôt que des noms de personnes ou des chiffres, leur permettant de s’actualiser ou de se contextualiser seuls. Votre article sur Second Life ne citera plus le nombre d’inscrits au service au jour et à l’heure ou vous aurez écrit votre billet, mais le chiffre évoluera avec le temps en prenant en compte les données chiffrées émises par LindenLab.
Bien sûr, il a toujours été possible d’interfacer une base de donnée et un tableau, mais faire que cette base de donnée soit en prise directe avec un résultat de requête en ligne, en temps réel, est un pas de plus - sans compter le degré de simplicité et de complémentarité atteint qui semble mettre encore un peu plus le web en interaction avec lui-même. Dans la lignée de Freebase ou d’autres briques sémantique, ou du wiki sémantique (Google Doc a d’ailleurs souvent été évoqué comme un wiki évolué et réussi) que nous évoquions il y a moins d’un an, le web sémantique continue sa mue pour arriver jusqu’à nous.
Reste à ces applications et ces moteurs à s’affiner, à élargir leur périmètre et leurs modalités de requête : demain ils sauront ce que nous sommes capables de chercher selon l’heure de la journée, notre lieu de connexion, le lieu d’où nous venons, notre environnement applicatif ouvert, les actualités qui nous concernent…
Le lien hypertexte ne disparaîtra pas, car c’est lui qui rend ce web implicite possible, c’est lui qui en est l’armature, c’est parce que l’on fait des liens que les données prennent du sens comme le montre le PageRank de Google. Mais un autre web naît à côté de celui que nous connaissions. Assurément, comme le souligne encore Olivier Ertzscheid citant les théories de l’hypertexte de Vannevar Bush, “le parcours, le “chemin” (trail) importent au moins autant que le lien”. “Au moins autant”, c’est dire si ce web est encore amené à progresser."
Hubert Guillaud
*Hubert Guillaud est éditeur de formation, est rédacteur en chef d'InternetActu.net et responsable de la veille à la Fondation Internet nouvelle génération.
13:28 Publié dans - Après Web...2, - Innovation, - Internet, Web2.0, - Marketing-Communication, - Mobilités, - Prospective, trends | Lien permanent | Commentaires (0) | Envoyer cette note
| Tags : hubert guillaud, web impicite, web 2, web 3, après web |
|
del.icio.us
|
|
Digg |
Facebook







