Data Mining: Die systematische Anwendung statistischer Methoden auf einen Datenbestand
Data Mining (Engl.; im Deutschen: „Daten Bergbau), also die systematische Anwendung statistischer Methoden auf einen Datenbestand, hat generell zum Ziel, bestimmte Muster zu erkennen oder auch sehr große Datenbestände, die händisch nicht zu bewältigen wären, zu verarbeiten. Dabei entstammen eine Vielzahl der im Data Mining eingesetzten Verfahren ursprünglich der Statistik (genauer: der multivariaten Statistik). Diese eigentlichen „Statistik-Verfahren“ werden zumeist nur in ihrer Komplexität für die Anwendung im Data-Mining angepasst.
Verwendungen von Data Mining
Data Mining findet seine Verwendung insbesondere bei der:
Ausreißer-Erkennung
Mittels dieser Verwendung von Data Mining wird in einem speziellen Datenbestand nach Datenobjekten gesucht, die inkonsistent zu dem Rest der Daten dieses Bestandes sind, weil sie z.B. ungewöhnliche Attributswerte haben oder von einem generellen Trend abweichen.
Clusteranalyse
Aufgabe von in der Clusteranalyse verwandtem Data Mining ist es, aus einer großen Datenmenge verschiedene Gruppen von Objekten zu identifizieren, die sich auf eine gewisse Art ähnlicher sind als andere Gruppen.
Klassifikation
Hier werden mit Hilfe von Data Mining bestimmte Objekte zu Gruppen zugeordnet.
Assoziationsanalyse
Data Mining in der Assoziationsanalyse durchsucht häufige Zusammenhänge in den Datensätzen und formuliert anschließend diesbezügliche Schlussregeln.
Regressionsanalyse
Hier modelliert Data Mining statistische Zusammenhänge zwischen unterschiedlichen Attributen.
Anwendungsgebiete
Neben seinem klassischen Anwendungsgebiet, also der Informatik mit all ihren verwandten Bereichen, findet modernes Data Mining heute Anwendung insbesondere:
- im Internet (etwa zur Analyse von großen Textbeständen oder beim Analysieren des Nutzerverhaltens oder zur Netzwerkanalyse der Social-Media-Seiten);
- im Marketing (z.B. bei der Zielgruppenauswahl für bestimmte Kampagnen, bei der Kundenprofilerstellung oder der Warenkorbanalyse im Supermarkt);
- in der Medizin
und im Finanzsektor (insbesondere bei der Rechnungsprüfung).