dimanche 5 juin 2011

Where no man has gone before... Big Data (#1)

... pour reprendre la phrase d'introduction de la série Star Trek. Il commence à se passer des choses intéressantes sur ce sujet qui va maintenant au delà des incantations du marketing des acteurs de la BI.

Big Data n'a de sens que si l'on parle de données que l'on n'utilise pas encore soit parce qu'on ne peut pas les capturer, soit elles sont impossibles à traiter du fait de leur volumétrie ou encore non compréhensibles avec nos outils actuels...

Capturer la... voix
Sur YouTube, il y'a depuis peu une fonction béta qui permet à la volée de convertir la voix en... sous-titre. C'est le bouton en rouge avec les lettres "CC" pour closed caption. On voit sur l'image le discours de Steve Jobs retranscrit à la volée.


Il y'a encore des erreurs - j'aurais dit 10% - mais c'est assez bluffant pour tout dire. Mes amis grincheux m'ont déjà dit que ca ne sert à rien si tu comprends l'anglais... mais bon ^^ Mais on est tous d'accord que cela ouvre le champ de données disponible de façon tout à faire considérable non - Imaginez toutes les conversations humaines converties... en une donnée informatique !

Convertir les conversations téléphoniques en données pour analyser votre service client !
Imaginons maintenant que l'ensemble des conversations téléphoniques de votre service client soient "capturées" de cette façon - que ce flux de données soit également rapproché de données de contexte comme des évènements ou encore les caractéristiques clients - que l'on trouve le bon algorithme ou traitement pour y trouver les mots clés - le tout en temps réel malgré cette volumétrie de données ! On pourrait alors avoir quelque chose comme sur le site http://www.infomous.com avec les mots et leur relations.


Mais cela serait encore insuffisant... cela ne donnerait qu'à un instant T ce qui se passe. Il serait plus intéressant de savoir ce qui s'est passé et surtout ce qui va se passer. C'est un peu la même idée que Twitter serait capable de prédire... la bourse (ici l'étude).

Je n'ai qu'une conviction qui est qu'il faut beaucoup plus de données pour comprendre notre environnement. Que l'indicateur qui compte par exemple le nombre d'appels à un service client même au croisement de 30 axes est une trop grande réduction de la réalité...

Mais tout est à faire... il faudra résoudre le problème du traitement de ces données (le plus simple à mon avis et de très loin !), trouver le bon traitement statistique ou le bon algorithme et avoir des outils de visualisation des résultats.

Bref, on est encore très loin de parcourir la galaxie de données qui s'offre à nous...

Aucun commentaire:

Enregistrer un commentaire