"banner top"

Data-Mining au service de la promotion de la santé

Download

De nombreuses maladies chroniques sont liées à l’alimentation. Notre recherche multidisciplinaire a pour but de découvrir des règles significatives en matière d’influence de l’alimentation sur les maladies chroniques par une approche innovatrice et à l’aide de méthodes d’exploration des données (Data-Mining).

Les habitudes alimentaires jouent un rôle important pour la santé de l’homme, raison pour laquelle les questions de santé prennent toujours plus d’importance pour les supermarchés, les professionnels de la santé, les organisations sportives et les gouvernements. Les gens sont de plus en plus conscients de l’influence de l’alimentation sur leur santé, mais ils sont à peine conscients des caractéristiques, des limitations et surtout des constituants de leur apport alimentaire. Entre-temps sont apparus de nombreux régimes et programmes de nutrition qui aident à déterminer l’état de santé des individus. Les programmes n’incluent cependant pas d’analyse critique quant à la manière dont l’alimentation affecte les maladies chroniques.

Le but de notre recherche consiste à démontrer l’influence des aliments sur les maladies chroniques en analysant une grande quantité de données. À cette fin, une base de données exhaustive – constituée de données nutritionnelles, collectées par le marché alimentaire, ainsi que de données du panier – est liée aux données démographiques et sanitaires de la même région. La base de données qui en résulte est utilisée pour découvrir des modèles alimentaires aboutissant à des maladies de civilisation chroniques modernes. Pour notre recherche, nous utilisons des techniques d’exploration de données permettant d’extraire et de découvrir ces modèles cachés. L’exploration de données est de plus en plus utilisée dans le domaine de l’analyse des données issue récemment de l’informatique, et qui se différencie des analyses statistiques traditionnelles. Les techniques d’analyse statistiques classiques sont souvent mises au point pour étayer ou infirmer une hypothèse à partir d’un ensemble de données plus limité. L’analyse statistique examine habituellement la validité de l’hypothèse en effectuant des tests avec des données recueillies à cette fin. Les techniques de Data-Mining ne sont par contre pas utilisées pour établir une plus grande confiance dans une hypothèse, mais plutôt pour extraire des relations inconnues présentes dans l’ensemble des données. L’exploration des données est donc une méthode d’analyse de données sans hypothèses qui peut utiliser des méthodes statistiques comme outils, mais qui ne suppose pas au préalable qu’une hypothèse sera vérifiée ou rejetée.

Le «Proof of Concept» de notre idée de recherche a déjà fait l’objet d’une étude préliminaire dans laquelle une base de données sur la consommation américaine de la côte ouest a d’abord été intégrée aux données démographiques et sanitaires de la même population. Ensuite, à l’aide de nos méthodes d’analyse de Data-Mining, nous avons identifié des règles intéressantes qui démontrent le lien entre les habitudes alimentaires et les maladies chroniques1.

Étapes du Data Mining

Quelles sont les maladies chroniques ou les maladies liées au mode de vie ?
L’épidémie croissante des maladies en relation avec le mode de vie, qui touche à la fois les pays industriels et les pays émergents, est liée à l’évolution de l’alimentation et du mode de vie. Les changements dans l’industrie alimentaire mondiale se traduisent par un changement des habitudes alimentaires, par exemple par une consommation accrue d’aliments riches en énergie et à forte teneur en matières grasses, en particulier en acides gras saturés, et de petites quantités d’hydrates de carbone non raffinés. Dans ces pays, on passe d’un modèle «taux élevé de maladies infectieuses» associées à la malnutrition, à un modèle «taux élevé de maladies chroniques ou liées au mode de vie» associées à la nutrition dans les zones urbaines et industrielles. L’OMS a déjà identifié ce phénomène2. Obésité (adiopositas), hypertension (hypertonie), maladies du cœur, diabète de type 2, cancer, troubles psychiques et bien d’autres font partie des maladies liées au mode de vie.

Data-Mining dans la recherche en matière d’alimentation
Les données sont produites de manière exponentielle, d’autant plus que de nos jours la capacité de stockage est pratiquement illimitée. La Data-Mining est de plus en plus utilisée dans l’analyse des données en tant que domaine multidisciplinaire émergent de: statistiques, apprentissage automatique, banques de données, récupération d’informations, visualisation. Selon Fayyad et al.3, l’exploitation des données peut être divisée en quatre étapes: recueillir et nettoyer des sources de données, intégrer des banques de données nettoyées, utiliser des méthodes de Data-Mining pour découvrir de nouvelles règles et interpréter le savoir pour créer de nouvelles connaissances. La figure 1 illustre ces étapes.

Promotion de la santé comme but
Notre objectif est la prévention et la prévision des maladies liées au mode de vie dans les pays industrialisés et émergents au moyen de l’analyse des données de la consommation alimentaire et des données démographiques et sanitaires en Suisse, mais également à l’étranger. La nouveauté de notre approche consiste à découvrir des modèles cachés et les règles qui y sont associées sur la base d’une méthode de recherche sans hypothèses. Relier les données sur la consommation alimentaire – provenant du panier d’achat ou d’enquêtes statistiques dans les ménages – aux données démographiques et aux statistiques sur la santé à l’aide de méthodes de Data-Mining constitue un moyen pertinent pour déterminer si un sous-groupe précis de la population est particulièrement menacé par certaines maladies chroniques ou par des maladies liées au mode de vie en raison de son modèle de consommation alimentaire.

À l’avenir, nous souhaitons nous concentrer sur la collecte de données sur les aliments auprès d’une chaine de supermarchés suisse ou sur l’utilisation de données d’enquêtes nationales pour les relier à des données sur la santé provenant de la même région. Nous espérons ainsi mieux comprendre le lien entre la consommation alimentaire, l’état de santé et la mobilité de la population. Cette compréhension permettra d’avancer dans le domaine de la promotion de la santé des consommateurs. La banque de données intégrée qui sera développée sera orientée application et marché. La synergie entre l’informatique de gestion et la nutrition en santé publique offre une approche prometteuse et appropriée pour pratiquer des recherches multidisciplinaires sur la nutrition en épidémiologie (l’épidémiologie traitant, on le sait, de la distribution, des causes et des conséquences de conditions et événements liés à la santé dans les populations). Nous sommes persuadées que nous contribuerons ainsi à améliorer les résultats cliniques à long terme, ainsi que la santé publique et les résultats financiers connexes.

 

Sources


1 F. Einsele, L. Sadeghi, R. Ingold, H. Jenzer, A Study about Discovery of Critical Food Consumption Patterns Linked with Lifestyle Diseases using Data Mining Methods, Proceedings of the International Conference on Health Informatics (HEALTHINF-2015);17: pp.239–245.

2 WHO, World Health Organization Geneva 2003, Diet, Nutrition and the Prevention of Chronic Diseases, Report of a Joint WHO/FAO Expert Consultation.

3 U. Fayyad, G. Piatetsky-Shapiro, and P. Smyth, From Data Mining to Knowledge Discovery in Databases, AI Magazine Volume 17 Number 3 (1996), www.aaai.org/ojs/ index.php/aimagazine/article/viewFile/1230/1131 (20.8.2018)