Data Mining

Trends, Muster und Zusammenhänge erkennen

"Data Mining ist, wenn man vorher nicht so genau weiß, wonach man eigentlich sucht!"
(Verfasser unbekannt)

Data Mining ist eine neue Abfragetechnik, die es dem Anwender ermöglicht, auf Basis von großen Datenbanksystemen wie z.B. Data Warehouse, versteckte Informationen, Trends, Muster, Zusammenhänge und Vorhersagen abzuleiten.

Aus bisherigen Bestelldaten können auf diese Weise Kundenprofile gewonnen werden. Damit lässt sich das Marketing besser auf die Bedürfnisse der Kunden zuschneiden. Doch auch für die Leistungserbringung lassen sich wertvolle Rückschlüsse ziehen - sei es im Handel, in der Industrie oder bei Banken und Versicherungen.

Data Mining-Werkzeuge sind darauf spezialisiert, noch unbekannte Zusammenhänge innerhalb von Unternehmensdaten zu finden. Im Gegensatz zu den klassischen Abfragewerkzeugen muss ihr Anwender nicht von vornherein wissen, wonach er sucht. Vielmehr führen sie den Anwender von sich aus zu den oft vermeintlich interessanten Informationen.

Folien Download, PDF 23 kB »

Warenkorbanalyse

Die Warenkorbanalyse gehört zur Gruppe der Clusteranalysen. Dabei werden Gruppen von häufig gemeinsam verkauften Produkten aufgefunden. Sie kommen fast ausschließlich im Einzelhandel zur Anwendung und stellen hier die beste Möglichkeit bereit, das Kaufverhalten zu analysieren und Kundenbedürfnisse aufzuspüren.

Die Ergebnisse können dazu dienen, die einzelnen Produkte gemäss ihrer Gruppenzugehörigkeit in den Regalen aufzustellen. Ist es möglich, die Warenkorbanalyse mittels Kundendaten zu verknüpfen, können Kaufwahrscheinlichkeiten für zukünftige Einkäufe errechnet werden.

Eine weitere Anwendungsmöglichkeit besteht darin, Kunden - sofern dies im Einklang mit dem Datenschutzgesetz passiert - mit personenbezogenen bzw. gruppenbezogenen Werbeaktionen anzusprechen.

Fallbasiertes Schließen

Mit dieser Technik können zukünftige Entscheidungen aus den Erfahrungen der Vergangenheit abgeleitet werden. Hierfür werden charakteristische Eigenschaften von einzelnen Fällen in einer Datenbank gespeichert, beispielsweise alle relevanten Parameter zur Entscheidungsfindung und der daraus resultierende Geschäftsfall.

Bei neu auftretenden Entscheidungssituationen werden Parameter gesichtet und mit der Datenbank verglichen, um die größtmögliche Übereinstimmung mit den historischen Daten zu finden. Der Grad der Ähnlichkeit der Konstellationen ist der Genauigkeit der Vorhersage proportional.

Fallbasiertes Schließen entstammt dem Forschungsgebiet des maschinellen Lernens, dieses wiederum aus der Künstlichen Intelligenz (KI)-Forschung. KI ist ein Zweig der Informatik, der sich mit Methoden beschäftigt, die es einem Computer erlauben, Probleme zu lösen, die vom Menschen durch Intelligenz gelöst wurden.

Um den Anspruch des Lernens gerecht zu werden, ist es wichtig, die Parameter aller relevanten Unternehmensentscheidungen zu protokollieren, um immer genauere und bessere Vorhersagen treffen zu können.

Neuronale Netze

Neuronale Netze sind informationsverarbeitende Systeme, die aus vielen einfachen Einheiten, den Neuronen, bestehen. Sie tauschen Informationen per Stimulationen über gerichtete Verbindungen aus. Die Forschung ist zum Teil durch die Ähnlichkeit der Technik zu den Gehirnen von Säugetieren motiviert. Heute, vor allem im kommerziellen Einsatz, stehen andere Gesichtspunkte im Vordergrund.

Um ein neuronales Netzwerk sinnvoll verwenden zu können, muss zuerst die Aufgabenstellung an Hand von Beispielen trainiert werden. Das Lernen (überwacht bzw. unüberwacht) des nötigen Basiswissens wird durch die Angabe von Eingangsmengen und den zu berechnenden Ausgangsmengen erreicht.

Das größte Problem bei neuronalen Netzwerken liegt in dem Umstand, dass der Weg zur Lösung nicht einsichtig wird. Die Ergebnisse sind aber hervorragend, und die NASA verwendet neuronale Netze zur Wartung des Space Shuttles. Das Einsatzgebiet ist beinahe grenzenlos, und bedenkt man, dass es (noch) keine Richtlinien für den Entwurf eines neuronalen Netzwerks gibt, kann man in Zukunft mit vermehrtem Einsatz rechnen.

Auch in Deutschland gibt es seit kurzem einen Anbieter von intelligenten Suchmaschinen auf der Basis neuronaler Netzwerke. Insuma, wie der Name des Start-up-Unternehmens lautet, ist aus einem Forschungsprojekt an der Universität Tübingen in Zusammenarbeit mit der Universität Petersburg entstanden. Das Land Baden-Württemberg hat dieses Projekt finanziell unterstützt.

Genetische Algorithmen

Genetische Algorithmen versuchen, ähnlich den neuronalen Netzwerken, biologische Vorgänge abzubilden - hier die Evolution. Prinzip ist die Tatsache, dass die Natur durch Kreuzungen und Mutationen von Chromosomen immer lebensfähigere und an die aktuellen Umweltbedingungen angepasstere Spezies hervorbringt.

Der Grundbaustein des Genetischen Algorithmus ist das einzelne Chromosom, das durch ein Bitmuster repräsentiert wird. Eine Menge solcher Chromosomen bildet eine Population.

Zwei Chromosomen werden zufällig ausgewählt und gekreuzt, danach wird die gesamte Population verändert, ebenfalls unter Einfluss einer Zufallskomponente. Dann wird das einzelne Chromosom einer Berechnungsmethode unterzogen, die es für das vorliegende Problem bewertet. Bei diesem Schritt werden nur die stärksten Chromosomen berücksichtigt, die sich im Idealfall dem Problem respektive der Umwelt optimal angenähert haben.

Dieses Verfahren wird bei Optimierungsproblemen eingesetzt, aber auch zur Verbesserung eines neuronalen Netzwerkes.

Automatische Clusteranalyse

Das Verfahren der automatischen Clusteranalyse wird benützt, um Gruppen von Datensätzen aufzufinden, die Ähnlichkeiten aufweisen. Dabei wird von den Rohdaten aus nach noch nicht bekannten Zusammenhängen gesucht. Dies geschieht meist als erster Schritt in sehr großen Datenbeständen, um erste Daten mit ähnlichen Eigenschaften zu sichten, die darauf mittels anderer Techniken weiter untersucht werden.

Analyse von Beziehungen zwischen Datensätzen

Diese Methode versucht Beziehungen zwischen den einzelnen Datensätzen herzustellen, meistens um Marketingaktionen besser auf einzelne Kunden abstimmen zu können. Beispielsweise können Haushalte ihrem Einkommen nach spezieller angesprochen werden, obwohl diese Parameter nach einer Clusteranalyse nicht berücksichtigt worden wären.

Entscheidungsbäume

Der Datensatz wird bei dieser Technik als Baumdiagramm dargestellt. Der Datensatz wird dabei nach bestimmten Merkmalen, wie z.B. Kunde, Produkte segmentiert. Anhand der existierenden vorhandenen, historischen Daten, die in Klassen eingeteilt sind, werden weiter Untergruppen gebildet.

Es wird nun versucht, an jeder Verzweigung die bestmöglichste Frage zu stellen. Die Qualität des Datensatzes hängt sehr stark von diesen gestellten Fragen ab, deshalb ist hier mit einer richtigen Frage gemeint, wie stark die Frage den Datensatz organisiert oder anders: sie soll die Wahrscheinlichkeit einer Ausprägung innerhalb eines Segments ändern.

Das Ziel ist dabei die Blätter des Baumes so homogen wie möglich zu gestalten, d.h. die Daten sollten bezüglich des ausgewählten Merkmals relativ gleiche Werte annehmen. Aus Gründen der Wirtschaftlichkeit und Effektivität wird der Baum nicht bis ins letzte Detail modelliert, sondern solange unterteilt und weitergeführt, bis die Segmente nur noch einen Eintrag enthalten.

Der Vorteil der Entscheidungsbäume besteht darin, dass sie helfen auf einzelne Datensätze auch in größeren Datenbanken effizient zuzugreifen, d.h. die Zugriffszeiten sind unabhängig von der Größe der Datenbank konstant. Der Nachteil der Entscheidungsbäume ist, dass sie viel Speicherplatz und Verwaltungsaufwand benötigen.

Daten vorher aufbereiten

Was all diese Methoden gemeinsam haben, ist die Einschränkung, dass sie nur mit strukturierten Daten umgehen können. Das heißt, es ist im allgemeinen notwendig, die für eine Analyse verwendeten Daten erst speziell dafür aufzubereiten.

Links und Literatur

Werbung
Tagcloud

Führung Marketing Bewerberauswahl Kommunikation Wettbewerb Wissensmanagement Innovation IT-Trend Instrument Akzeptanz Netzwerk Management Konkurrenz Marke Information Karriere Erfolg Vertrieb Prozess Kennzahlen IT Potenzial Dynamic Experience Entscheidung Zukunft Projektmanagement Erfahrungswissen Kulturkompetenz Verkäufer Change-Management Assessment Ablauf Risiko Krise Strategieverwirklichung Organisation Strategie Projekt Emotion Konflikt Lernen Management by Veränderung Kundenrückgewinnung Zielvereinbarung Methode Kündigung Kompetenz Kunden Trend Finanzierung Mensch Unternehmen System Grundsätze Planung Mitarbeiter Qualität Prioritäten Internet Verhalten Ziele Mediation Vision Kundenzufriedenheit Controlling Value Börse Empfehlungsmarketing Personal Mitarbeiterbindung Präsentation Markt Social Media social network CRM Potenzialentwicklung Organisationsentwicklung Wachstum Produktion Business-Ettikette Commitment Führungskraft Coaching Mitarbeitergespräch Unternehmenskommunikation Regeln E- Motivation Produkt Service Messung HRM Werte Modell Akquise Nachhaltigkeit Corporate Widerstand Psychologie Mentoring Kundenbindung Orientierung Demographie Medien Anforderungsprofil Verhandlung CSR Gehirntraining Projekt Office Recruiting Macht Ideen Kultur Veränderungsprozess Zielgruppe Profit Telefonie Navigation Team Mitarbeiterbefragung Intuition Leadership Outsourcing Wandel Ethik Kommunikationsmodell Beratung Community Mitarbeiterzufriedenheit Führungstipps High Potentials E-Mail Kundenloyalität Manager Knigge Umwelt Inspiration ILTIS Diversity Intelligenz Charisma Research Kreativität Führungsstil Hörbuch Markterfolg Qualitätsmanagement Loyalitätsmarketing Unternehmenskultur Image Altersstruktur Event Checkliste Netzwerksicherheit Datenschutz Navigationsinstrument Souveränität Authentizität Leistung CMS Mitarbeitermotivation

Management Twitter

Sorry, no feeds for me

Werbung
Werbung