SYROKKO
Faites parler vos données
welcome to our website

 

 

  

Nous maîtrisons les méthodes statistiques les plus connues et les plus utilisées par les professionnels du Datamining. Cependant, nous proposons d’aller plus loin en offrant à nos clients la possibilité d’aborder leurs données d’une manière entièrement nouvelle, à travers la notion de concept et son analyse via la transformation des données classiques en données symboliques.

 

(voir aussi la rubrique DEFINITIONS)

 

Qu’est-ce qu’un concept en statistique ?

 

Là où l'analyse classique traite des milliers d'individus (clients, services, produits financiers...), nous travaillons, non pas au niveau des individus (ex. : un client) mais au niveau des concepts ; par exemple, le type de clients A, représentant tous les clients d’une banque âgés de moins de 35 ans. Plus généralement, un concept est défini par une intention (ses propriétés caractéristiques) et une extension (l'ensemble des individus satisfaisant cette propriété).

 

D'où viennent les concepts?

 

Un concept décrit donc plusieurs individus (ici, la banque aura par exemple 10.000 clients de moins de 35 ans, regroupés dans le concept A).

 

On obtient les concepts de deux manières :

        à partir de variables qualitatives (ex : département, ville, nom de client). Chaque valeur de la variable qualitative retenue est alors un concept.

     à partir d'un grand tableau de données, on procède à une classification automatique qui consiste à regrouper des données ayant un fort lien entre elles. Les classes (clusters de données) obtenues formeront autant de concepts.

 

Tout type de données (quantitatives, qualitatives) peut être transformé en concept (y compris des bases de données lacunaires au départ) et révéler ainsi de nouvelles lois, de nouvelles causalités, qui n’apparaissaient pas lorsqu’on les traitait sous leur forme classique.

 

Que sont les données symboliques ?

 

Ce sont des données qu'on ne peut pas manipuler comme des nombres.

 

Là où l’analyse classique décrira un concept en calculant des moyennes (ex. : la consommation moyenne de ces 10.000 clients), des médianes, des écarts-types, etc., nous conservons toutes les variations internes au concept (ex. : la répartition en % de la consommation au sein du groupe, l’âge minimum et l’âge maximum, etc.) et nous travaillons statistiquement sur ces variations, sans les masquer.

 

Le fait de conserver ces variations fait que chaque case de nos tableaux ne comprend pas un chiffre unique, mais comprend des histogrammes, des diagrammes, un intervalle, une loi de répartition, une probabilité, etc. C’est ce que nous appelons des données symboliques, et ce sont ces données, qui décrivent la réalité, que nous traitons statistiquement.

 

L'analyse symbolique consiste à traiter statistiquement ces concepts en étendant les méthodes classiques (analyse factorielles, classification automatique, arbre de décision, etc.) à des données symboliques.

 

Autrement dit, nous faisons de la statistique de statistiques ! Nous passons de la statistique d'individus à la statistique de concepts, catégories ou classes. Cela change totalement l’angle de vue sur les données et surtout, cela permet de réaliser des analyses plus riches que les analyses traditionnelles.

 

Cela permet notamment de :

 

        réduire, sans perte d'information, des millions de données (individus) à des entités statistiques (concepts) de taille beaucoup plus malléable ;

√     concaténer des informations "hétérogènes" (provenant de tableaux de données différents) pour étudier les nouveaux concepts ainsi créés ;

        identifier au niveau conceptuel des comportements (de produits, de clients...) ou process atypiques, anticiper des comportements, trouver des variables explicatives à certains phénomènes/corrélations, etc. ; 

        mieux prendre en compte la dimension du temps (tel type de client consomme tel produit sur telle période de temps, utilise tel service financier, puis tel autre, puis un troisième, etc., suivant des trajectoires chronologiques pouvant être considérées comme autant de concepts).

 

 

 
Home
Notre différence
Notre offre
Notre méthode
Applications
A propos
All Rights Reserved...