Sphinx Quali

La solution dédiée au traitement des données textuelles

L’option Sphinx Quali est la solution dédiée au traitement des données textuelles, à l’analyse sémantique, qui intègre les avancées récentes de l’ingénierie de la connaissance (ontologie, réseaux sémantiques…) et se situe à la pointe des technologies innovantes.

Une importation des corpus

Sphinx iQ2, Sphinx Quali, importation du corpus sur Sphinx

Avec l’expansion des données de toutes natures et la multiplication des opinions émises sur le web et les réseaux sociaux, il devient essentiel de traiter les données quelle que soit leur provenance : questions ouvertes de questionnaires, entretiens, focus group, articles de presse, bases propres aux institutions, extraits de sites web, commentaires issus de forums… Sphinx Quali permet d’importer l’ensemble de ces corpus.

Exemples d’études et de méthodes qualitatives

Enquête de satisfaction – Hotline

Cette enquête de satisfaction menée auprès des clients d’un éditeur de logiciel bien connu complète les mesures de la qualité du service par des questions sur les problèmes rencontrés et la justification des évaluations faites. Mots clé et expressions récurrentes confirment le bon niveau des évaluations et pointent sur les motifs d’insatisfaction exprimés dans le langage même des utilisateurs. Un simple clic permet de les retrouver, de plus un système d’alerte en temps réel fait remonter les verbatims les plus critiques…

Avis en ligne – Expérience touristique

Cette recherche examine la perception des séjours touristiques. 600 avis postés sur Trip Advisor sont recueillis selon un plan d’expérience construit sur 2 destinations (Maroc, Tunisie) et 2 modes d’hébergements (Hôtel club et Gîtes, B&B). Une première exploration permet met en évidence que le mode d’hébergement a plus d’influence sur les contenus que la destination. Les avis sont ensuite automatiquement codés sur la base d’un thésaurus construit pour les besoins de cette recherche. On met ainsi en évidence que l’expérience de l’accueil prime sur les autres composantes du séjour.

Entretiens non directifs – Leadership

Dans cette thèse, les entretiens approfondis effectués auprès de 14 dirigeants sont analysés de manière exploratoire par une classification automatique. Elle met en évidences 4 grands thèmes affinés en considération de la littérature sur les conditions d’exercice du leadership. L’intégralité des entretiens est alors lue et codée selon cette grille. La fréquence avec laquelle les éléments du code book se trouvent évoqués dans les 297 tours de paroles permet de préciser l’importance des dimensions du leadership et leur dépendance par rapport à l’expérience et la culture des dirigeants. Enfin une triangulation permet de confirmer la robustesse des résultats.

Données massives – Transition écologique

Le corpus des contributions au grand débat, 35 000 contributions, plus de 10 millions de mots, dresse un panorama des préoccupations des français. Les mots expressions et idées clés mis en évidence par l’analyse lexicale et sémantiques confirment ce qu’on savait déjà en précisant les hiérarchies et l’influence des situations locales. Mais surtout la data visualisation et l’interactivité conduisent à des interprétations originales argumentée par du verbatim qu’il aurait autrement été impossible de découvrir dans la masse de ces informations. Enfin les commentaires très minoritaires en pourcentage se trouvent ici documentés par des centaines de personnes ce qui autorise d’en approfondir l’analyse et les logiques.

Base bibliographique – La relation marque-consommateur

Cet exemple montre comment une revue de littérature peut être communiquée en présentant des synthèses lexicales et statistiques de l’ensemble des articles analysés. Les grands thèmes ainsi dégagés sont ensuite affinés par une recherche ciblée correspondants aux concepts plus spécifiquement étudiés (thésaurus) : les relations marques/consommateurs et les émotions mises en jeu.
Les résultats portent sur la cohérence des axes de recherches identifiés dans l’ensemble des 287 articles et sur leur évolution au cours des 4 périodes considérées.

Cet exemple montre comment l’analyse d’un corpus de documents peut conduire à des interprétations fondées sur des données objectives et contrôlables par le lecteur. La data visualisation permet en effet d’acquérir très rapidement une expérience du corpus étudié et de discuter les interprétations proposées par l’auteur.

Mur d’images en ligne – Coberen

Cet exemple porte sur la première partie d’une grande enquête en ligne portant sur la consommation de boissons en Europe. Il s’agissait de faire choisir 3 images évoquant le fait de boire. Le mur d’image proposé était composé de 25 images variant les boissons, les situations, les motivations… Les répondants étaient alors invités à expliquer leur choix. Ainsi est recueilli un corpus multilingue de plus de 15000 commentaires.
L’examen des mots et expression clé dans la langue de chaque pays permet de se faire une première idée des réponses fournies.

Pour produire une synthèse, et mettre en évidence les différences régionales ou par pays, un extrait calibré le la base intégrale et codé en ligne par les chercheurs de chaque pays participant. On peut ainsi établir que la génération et le genre ont plus d’influence que le pays lui-même, tout en illustrant ces conclusions par du verbatim dans la langue d’origine.