"banner top"

Data Mining im Dienste der Gesundheitsförderung

Download

Viele chronische Erkrankungen sind ernährungsbedingt. Wir verfolgen bei unserer multidisziplinären Forschung einen neuartigen Ansatz, um mittels Data-Mining-Methoden aussagekräftige Regeln über den Einfluss von Ernährung auf chronische Krankheiten zu entdecken.

Ernährungsmuster spielen eine wichtige Rolle für die Gesundheit der Menschen. Aus diesem Grund gewinnen gesundheitliche Belange bei Supermärkten, Gesundheitspraktikern, Sportorganisationen und Regierungen zunehmend an Bedeutung. Vermehrt ernäh­ren sich Menschen gesundheitsbewusst, aber sie sind sich der Eigenschaften, Einschränkungen und vor al­lem der Bestandteile ihrer Nahrung kaum bewusst. Es gibt mittlerweile viele Ernährungsschemata und ­-programme, denen Einzelpersonen folgen und die ihnen helfen festzustellen, wie gesund sie sind. Die Program­me beinhalten aber oft keine kritische Analyse darüber, wie die Ernährung die chronischen Krankheiten beein­flusst.

Unsere Forschungsidee besteht darin, den Einfluss der Lebensmittel auf chronische Krankheiten mittels Analyse grosser Datenmengen aufzuzeigen. Dazu wird eine umfangreiche Datenbank aus den erhobenen Ernährungsdaten oder Warenkorbdaten des Lebens­mittelmarktes mit den demografischen und den Gesundheitsdaten aus derselben Region verknüpft. Die daraus resultierende Datenbank wird verwendet, um Ernährungsmuster zu erkennen, die zu modernen chro­nischen Zivilisationskrankheiten führen. Um solche versteckten Muster zu extrahieren und zu entdecken, verwenden wir Data-­Mining-­Techniken für unsere For­schung. Data Mining wird zunehmend im Bereich der Datenanalyse eingesetzt, die in jüngerer Zeit aus der Informatik hervorgegangen ist und sich von traditio­nellen statistischen Analysen unterscheidet. Klassi­sche statistische Analysetechniken werden häufig ent­wickelt, um Beweise zur Unterstützung oder gegen eine Hypothese aus einem begrenzteren Datensatz zu bil­den. Somit wird üblicherweise bei der statistischen Analyse die Gültigkeit der Hypothese untersucht, in­ dem statistische Tests anhand von Daten durchgeführt werden, die möglicherweise zu diesem Zweck erhoben wurden. Data-Mining-­Techniken hingegen werden nicht hauptsächlich dazu verwendet, um Vertrauen in eine Hypothese zu bilden, sondern vielmehr, um unbe­kannte Beziehungen zu extrahieren, die im Datensatz vorhanden sind. Data Mining ist daher eine Hypothe­sen­freie Datenanalyse­-Methode, die statistische Me­thoden als Werkzeuge verwenden kann, aber zunächst nicht davon ausgeht, dass eine Hypothese verifiziert oder zurückgewiesen wird.

Das «Proof of Concept» unserer Forschungsidee wur­de bereits aufgrund einer Vorstudie untersucht. In dieser Vorstudie wurde vorerst eine US-­amerikanische Konsumdatenbank von der Westküste mit den demografischen und den Gesundheitsdaten derselben Bevöl­kerung integriert. Anschliessend wurden unter Anwen­dung unserer Data-­Mining-­Analysemethoden interessante Regeln, die die Verbindung zwischen Ernährungsgewohnheiten und chronischen Krankhei­ten demonstrierten, entdeckt.1

Abbildung 1: Data-Mining-Schritte

Was sind chronische oder Lebensstilkrankheiten?
Die wachsende Epidemie der Lebensstilkrankheiten, von denen sowohl Industrie­ als auch Schwellenländer betroffen sind, hängt mit Veränderungen der Ernährung und des Lebensstils zusammen. Veränderungen in der Weltnahrungsmittelwirtschaft spiegeln sich in sich verändernden Ernährungsgewohnheiten wieder, beispielsweise durch erhöhten Verzehr ener­giereicher Nahrung mit hohem Fettgehalt, insbesonde­re gesättigten Fettsäuren, und geringen Mengen nicht raffinierter Kohlenhydrate. In diesen Ländern zeigt sich ein Wechsel vom Muster «hohes Vorkommen von Infek­tionskrankheiten», die mit Mangelernährung zusam­menhängen, zum Muster «hohes Vorkommen von chronischen oder Lebensstilkrankheiten», die mit der Ernährung in urbanen und industriellen Gebieten ver­bunden sind. Dieses Phänomen wurde bereits durch die WHO erkannt.2
Zu den Lebensstilkrankheiten gehören Fettleibig­keit (Adipositas), Bluthochdruck (Hypertonie), Herzerkrankungen, Typ­-2-­Diabetes, Krebs, psychische Störungen und viele andere.

Data Mining in der Ernährungsforschung
Daten werden mit einer exponentiellen Rate produ­ziert, zumal die Speicherfähigkeit heute praktisch unbegrenzt ist. Data Mining wird zunehmend in der Datenanalyse verwendet als ein aufstrebendes multidisziplinäres Feld von: Statistiken, maschinellem Lernen, Datenbanken, Informationsrückgewinnung, Visualisie­rung. Gemäss Fayyad et al.3 kann Data Mining in vier Schritten aufgeteilt werden: Datenquellen sammeln und reinigen, bereinigte Datenbanken integrieren, Data­ Mining­-Methoden einsetzen, um neue Regeln zu entdecken, und Wissensinterpretation, um neues Wissen zu schaffen. Abbildung 1 zeigt diese Schritte auf.

Gesundheitsförderung als Ziel
Unser Ziel ist die Prävention und Vorhersage von Lebensstilkrankheiten in Industrie­ und Schwellenlän­dern mithilfe der Analyse von Lebensmittelkonsum­ und demografischen und Gesundheitsdaten in der Schweiz, aber auch im Ausland. Die Neuheit unseres Ansatzes besteht darin, verborgene Muster und die da­mit verbundenen Regeln auf der Grundlage einer Hypo­thesen-­freien Forschungsmethode zu entdecken. Die Verknüpfung von Lebensmittelkonsumdaten – sei es aus dem Warenkorb oder aus der statistischen Haushaltserhebung mit demografischen Daten und Gesund­heitsstatistiken mithilfe von Data-­Mining-Methoden – ist ein aussagekräftiger Weg, um zu bestimmen, ob eine bestimmte Bevölkerungs­-Untergruppe aufgrund ihrer Lebensmittelkonsummuster besonders durch be­stimmte chronische oder Lebensstilkrankheiten ge­fährdet ist.

In Zukunft wollen wir uns mit der Beschaffung von Lebensmitteldaten einer Schweizer Supermarktkette oder Nutzung der nationalen Erhebungsdaten und de­ren Verknüpfung mit den Gesundheitsdaten aus dersel­ben Region befassen. Damit wollen wir ein besser fun­diertes Verständnis für die Verbindung zwischen Lebensmittelverzehr, Gesundheitszustand und Volks­beweglichkeit erhalten. Dieses Verständnis wird hel­fen, Fortschritte im Bereich der Gesundheitsförderung von Konsumenten zu erzielen. Die entwickelte inte­grierte Datenbank ist anwendungs-­ und marktorien­tiert. Die Synergie zwischen Wirtschaftsinformatik und Public­Health-­Ernährung zu nutzen, ist eine erfolgversprechende und angemessene Vorgehensweise, um multidisziplinäre Ernährungsforschung in der Epide­miologie zu betreiben. Epidemiologie befasst sich be­kanntlich mit der Verbreitung sowie den Ursachen und Folgen von gesundheitsbezogenen Zuständen und Er­eignissen in Bevölkerungen. Wir sind sehr zuversicht­lich, dass wir auf diesem Weg dazu beitragen, klinische Langzeitergebnisse, Volksgesundheit und die damit verbundenen finanziellen Ergebnisse zu verbessern.

 

Literatur


1 F. Einsele, L. Sadeghi, R. Ingold, H. Jenzer, A Study about Discovery of Critical Food Consumption Patterns Linked with Lifestyle Diseases using Data Mining Methods, Proceedings of the International Conference on Health Informatics (HEALTHINF-2015);17: pp.239–245.

2 WHO, World Health Organization Geneva 2003, Diet, Nutrition and the Prevention of Chronic Diseases, Report of a Joint WHO/FAO Expert Consultation.

3 U. Fayyad, G. Piatetsky-Shapiro, and P. Smyth, From Data Mining to Knowledge Discovery in Databases, AI Magazine Volume 17 Number 3 (1996), www.aaai.org/ojs/ index.php/aimagazine/article/viewFile/1230/1131 (20.8.2018)