Les key views, un outil de data mining pour une visualisation synthétique de vos tris croisés

Stéphane Ganassali
18 nov. 2021
4 min de lecture

Puisqu’il ne suffit pas de le dire, il est important de l’écrire : chaque entreprise collecte aujourd’hui de grands volumes de données qu’elle se doit d’analyser pour orienter ses réflexions et, in fine, ses décisions. Cette phase s’avère parfois complexe, tant les possibilités de traitements sont nombreuses, afin de rendre cette data accessible et utile à tous.

Les techniques de data mining, pour identifier rapidement les résultats significatifs

Parmi les traitements habituels figurent les croisements entre plusieurs variables. Appelés également analyses bivariées, ils peuvent être légion, surtout si la base de données dont vous disposez est conséquente. Par exemple, il est de coutume de croiser chaque variable d’identité d’une enquête (âge, fonction, genre, etc…) avec l’ensemble des autres données présentes. Dans ce cadre, l’objectif consiste à mesurer l’influence d’une ou plusieurs variables sur une autre. C’est alors le moment parfait pour que le chargé d’études, ou autre ingénieur de la data, privilégie les techniques et outils de data mining qui ont la bonne idée d’identifier rapidement les résultats les plus significatifs.

Selon Stéphane Ganassali, maître de conférences en sciences de gestion, « les techniques et les outils de data mining permettent au chargé d’études d’explorer un grand nombre de relations possibles parmi un très grand nombre de variables de son étude. L’idée centrale de cette famille de méthodes est de faciliter un accès plus rapide et plus visuel aux informations essentielles, aux relations les plus significatives, contenues dans un vaste ensemble de données. »

Les key views, des tableaux avec les résultats les plus significatifs issus d’analyses croisées

Parmi les techniques de data mining, les key views en sont une parfaite représentation. Il s’agit de tableaux de caractéristiques, élaborés par Le Sphinx, dont l’objectif est de « présenter dans un seul tableau les résultats les plus significatifs d’un grand ensemble d’analyses croisées ». Concrètement, on cherche à réduire le nombre de valeurs à présenter, en se limitant à celles qui permettent d’amener du sens. Une variable pivot est choisie, elle sera caractérisée par les modalités les plus pertinentes issues d’autres variables sélectionnées par le chargé d’études. Plus besoin donc de multiplier les tris croisés qui ont une forte tendance à surcharger des rapports parfois déjà un peu trop lourds.

Prenons l’exemple d’un baromètre social dans lequel nous souhaitons caractériser la perception du climat à l’intérieur de l’entreprise (bon, moyen ou mauvais) en fonction des caractéristiques des employés : le genre, l’ancienneté, l’âge et la fonction. Si nous choisissons d’analyser l’information au travers d’habituels tris croisés, nous recevrons une information exhaustive mais difficile à interpréter.

Les key views vont combiner automatiquement la production de ces quatre tris croisés et identifier les modalités qui sont significatives entre elles, grâce à la garantie des tests statistiques. Seules les modalités surreprésentées et sous-représentées sont donc mises en avant pour clarifier au mieux l’information, et permettre une compréhension plus rapide.

Le principe de surreprésentation et de sous-représentation est associé à un test de significativité comme le Chi2 : les effectifs calculés dans chacune de vos cellules sont comparés à un effectif théorique. Si l’effectif calculé est nettement supérieur à celui qu’il devrait être s’il n’y avait pas de relation entre les deux variables, alors on parle de surreprésentation. A l’inverse, si l’effectif calculé est nettement inférieur à celui qu’il devrait être théoriquement, alors on parle de sous-représentation. Ce key view précise par exemple que, au sein de l’entreprise concernée, ce sont plutôt les collaborateurs présents depuis longtemps (5 à 10 ans), qui trouvent que le climat est mauvais. A l’inverse, les cadres (managers et équipe de direction) arrivés récemment (moins de 2 ans) estiment que le climat est bon.

L’analyse factorielle des correspondances, comme représentation visuelle

Si le key view peut être représenté sous forme de tableau, comme ci-dessus, il peut l’être également sous forme de carte d’analyse des correspondances. La matrice AFC (Analyse Factorielle des Correspondances) s’intéresse justement « aux combinaisons de modalités afin d’identifier les grandes dimensions des résultats, et les modalités qui sont liées statistiquement. »

Il s’agit-là d’une représentation visuelle qui permet de comprendre l’information principale en un clin d’œil. On comprend ici que les techniques de data mining sont liées à celles de la data visualisation. En effet, tout comme le data mining cherche à faciliter l’exploration des données, la data visualisation cherche à en faciliter la lecture. Il parait alors pertinent de s’appuyer sur les forces de ces deux méthodes pour, d’une part, limiter le volume des données à explorer et, d’autre part, rendre plus lisibles les éléments à observer. Ici, dans un objectif de vulgarisation de l’information, la présentation sous forme de tableau est probablement à privilégier par rapport à l’AFC qui se veut plus technique. Toutefois, l’AFC, de par son aspect graphique, est plus susceptible de mettre en avant le storytelling de votre tableau de bord, si vous misez sur les effets de scénarisation (filtres, analyses en cascades…). Alors, si vous souhaitez tester les key view, la solution DATAVIV’ by Sphinx, spécialisée dans l’analyse de données, la mise en forme des résultats et le partage en ligne, vous permet d’utiliser cette forme de représentation. Pour l’essayer gratuitement, c’est ici et pour en savoir plus sur les fonctionnalités, c'est par là !

Références bibliographiques Ganassali S (2014), Enquêtes et analyses de données avec Sphinx

2 commentaires

Елена Мальтипу

30 oct. 2025

Pour les utilisateurs Mac à la recherche d'un logiciel de montage vidéo performant et créatif, Capcut pour Mac est une excellente option. Ce logiciel propose des fonctionnalités telles que le montage sur timeline, le mixage audio et l'ajout de texte pour des vidéos qui se démarquent. Capcut pour Mac prend en charge l'exportation en haute résolution, ce qui le rend idéal pour le partage en ligne et les présentations professionnelles. De nombreux utilisateurs apprécient la fluidité de Capcut pour Mac sur les appareils Mac, même lors de la gestion de plusieurs clips et d'effets complexes. Son interface intuitive par glisser-déposer réduit le temps de montage, tandis que les modèles intégrés facilitent la création de projets. Que ce soit pour la…

tom burke

22 sept. 2025

Les Key Views appears to be a powerful data mining tool that simplifies the visualization of cross-tabulations, making complex data easier to interpret. Having a synthetic and clear view of data is essential for decision-making in research, business, and analytics. Tools like this not only save time but also improve accuracy in reporting. Similarly, in the textile industry, digitizing for embroidery ensures that designs are converted into precise, machine-readable files for flawless stitching. Just as data visualization transforms raw information into actionable insights, embroidery digitizing transforms artwork into professional, detailed embroidery ready for production. Great innovation!

Afrique et Moyen Orient

Les key views, un outil de data mining pour une visualisation synthétique de vos tris croisés

Les techniques de data mining, pour identifier rapidement les résultats significatifs

Les key views, des tableaux avec les résultats les plus significatifs issus d’analyses croisées

L’analyse factorielle des correspondances, comme représentation visuelle

Posts récents

2 commentaires