
Le dépistage numérique du burn-out
La linguistique informatique peut-elle aider à détecter un burn-out? C’est à cette question que nous cherchons à répondre dans le cadre d’un projet de recherche financé par le Fonds national suisse de la recherche scientifique FNS.
Dr Mascha Kurpicz-Briki, Professorin für Data Engineering, Institute for Data Applications and Security IDAS, BFH
Selon une étude de 2020 réalisée en Suisse, presque une personne active sur trois ressent des symptômes d’épuisement émotionnel [1]. L’étude montre également que le stress lié au travail coûte près de 7,6 milliards de francs suisses par an aux employeurs. L’accumulation des sollicitations sur le lieu de travail peut entraîner le syndrome dit du burn-out.
Ce syndrome est difficile à identifier cliniquement dans la mesure où les symptômes coïncident souvent avec d’autres syndromes ou pathologies. Il est ainsi difficile de distinguer un burn-out d’une dépression classique. La psychologie clinique utilise des inventaires. Les inventaires sont des évaluations psychologiques consistant à demander aux patient-e-s de répondre à un questionnaire à choix multiples. Dans la pratique, on utilise souvent le Maslach Burnout Inventory, composé de 22 questions à choix multiples dans trois catégories: épuisement professionnel, dépersonnalisation ou perte d’empathie et auto-évaluation des performances. Même si elle a fait ses preuves, cette pratique est parfois remise en question dans la littérature spécialisée. On critique d’une part la seule prise en compte de trois caractéristiques spécifiques, alors que d’autres symptômes peuvent être révélateurs d’un burn-out. L’utilisation des inventaires pose un autre problème d’ordre général: les patient-e-s ne répondent pas honnêtement, soit dans le but d’orienter le résultat, soit parce que le sujet les met mal à l’aise. En revanche, la combinaison de ces questionnaires avec des entretiens ou des questions ouvertes offrant des possibilités d’analyse indirectes présente un fort potentiel. Ces approches n’ont cependant pas encore réussi à s’imposer compte tenu des contraintes et des difficultés d’analyse qui les accompagnent.
Quand les ordinateurs apprennent le langage humain
L’ingénierie linguistique, également connue sous le nom de traitement automatique du langage naturel (TALN) couvre le champ du traitement automatique du langage humain grâce à l’informatique. Le langage humain peut revêtir différentes formes une fois traité, p. ex. un texte ou des fichiers audio. Parmi les applications caractéristiques de ces technologies figurent les correcteurs automatiques d’orthographe et de grammaire ou l’extraction d’informations dans un grand volume de textes (fouille de textes). Le langage humain étant extrêmement complexe et lié au contexte, ces tâches se révèlent ardues pour un ordinateur. Un mot peut avoir une signification radicalement différente, voire opposée, selon le contexte. Ainsi, les liens logiques qui s’organisent sur plusieurs phrases ou les concepts tels que l’humour ou l’ironie posent des problèmes majeurs.
Des progrès décisifs ont été accomplis dans le domaine de l’ingénierie linguistique au cours des dernières années, notamment grâce à la vectorisation de mots (word embedding). Les vecteurs de mots sont des modèles linguistiques dans lesquels les mots sont représentés sous la forme de vecteurs mathématiques. Cela permet à l’ordinateur de déduire des liens sémantiques entre les mots grâce à des calculs mathématiques. Étant donné que l’ordinateur a plus de facilités à effectuer des calculs mathématiques qu’à traiter le langage humain, ces modèles présentent des avantages déterminants pour le traitement automatique du texte.

Le traitement de texte automatique s’est déjà inspiré avec succès des méthodes de la psychologie, à l’image du test d’association implicite [2], qui mesure les préjugés inconscients chez l’être humain. L’emploi d’une méthode numérique basée sur ce test a permis de démontrer que les modèles linguistiques souvent utilisés en informatique reflétaient les stéréotypes sociaux [3] [4]. Autre exemple d’application: l’utilisation de l’ingénierie linguistique pour identifier les personnes à tendance suicidaire à partir des textes qu’elles rédigent [5].
Le projet «BurnoutWords»
Dans le cadre du projet BurnoutWords, l’équipe du Data Science and Engineering Research Group à l’Institute for Data Applications and Security IDAS utilise des approches innovantes pour étudier de nouvelles méthodes d’analyse des textes libres ou des transcriptions d’entretien à l’aide de l’ingénierie linguistique. Ce projet est financé par le Fonds national suisse de la recherche scientifique FNS dans le cadre du programme d’aide Spark.
Il étudie les relations entre les mots et les parties de phrases dans les potentielles questions-réponses à texte libre d’un nouveau questionnaire sur le burn-out, en y intégrant les relations mathématiques entre les vecteurs de mots.
Il s’agit de montrer dans quelle mesure le langage d’une personne souffrant de burn-out diffère mathématiquement de celui d’une personne en bonne santé, ce qui permettrait d’automatiser le dépistage de la maladie. Le projet a pour but de savoir si ces questions à texte libre sont pertinentes au regard du but recherché et de développer un système de mesure automatisé pour analyser ce type de questions.
Il doit permettre de faciliter, à l’avenir, le dépistage clinique du burn-out par des méthodes numériques automatisées et de contribuer grandement à la résolution de ce problème de société.
Littérature
[1] Promotion Santé Suisse, Job Stress Index 2020, feuille d’information 48, 9/2020.
[2] Greenwald, Anthony G.; Debbie E. McGhee, and Jordan L.K. Schwartz. 1998. Measuring individual differences in implicit cognition: the implicit association test, Journal of personality and social psychology, 74(6):1464.
[3] Caliskan, Aylin; Joanna J. Bryson, and Arvind Narayanan. 2017. Semantics derived automatically from language corpora contain human-like biases, Science, 356(6334):183–186.
[4] Kurpicz-Briki, Mascha. 2020. Cultural differences in bias? Origin and gender bias in pre-trained german and french word embeddings, 5th SwissText & 16th KONVENS Joint Conference 2020, Zurich, Switzerland.
[5] Morales, Michelle; Prajjalita Dey; Thomas Theisen; Danny Belitz, and Natalia Chernova. 2019. An investigation of deep learning systems for suicide risk assessment, in Proceedings of the Sixth Workshop on Computational Linguistics and Clinical Psychology, 2019, pp. 177–181.
Infos