Data Mining

Was ist Data Mining:

Data Mining ist ein englischer Begriff, der mit der Informatik verbunden ist und dessen Übersetzung Data Mining ist . Es besteht aus einer Funktionalität, die Daten sammelt und organisiert, um relevante Muster, Assoziationen, Änderungen und Anomalien zu finden .

Der Begriff Data Mining entstand erstmals 1990 in Datenbank-Communities. Data Mining ist der Prozessanalyseschritt, der als KDD ( Knowledge Discovery in Databases ) bekannt ist. Seine wörtliche Übersetzung lautet "Knowledge Discovery in Databases".

Data Mining kann in einige grundlegende Schritte unterteilt werden: Erkundung, Modellbildung, Musterdefinition sowie Validierung und Verifizierung.

Data Mining ist eine relativ junge Praxis in der Welt des Computing. Es verwendet Information Retrieval, künstliche Intelligenz, Mustererkennung und statistische Techniken, um nach Korrelationen zwischen verschiedenen Daten zu suchen, die es Ihnen ermöglichen, nützliches Wissen für ein Unternehmen oder eine Einzelperson zu gewinnen. Data Mining kann für ein Unternehmen ein wichtiges Instrument zur Steigerung von Innovation und Rentabilität sein.

Die Verwendung von Data Mining ist in großen Datenbanken durchaus üblich und das Endergebnis ihrer Verwendung kann durch Regeln, Hypothesen, Entscheidungsbäume, Dendrogramme usw. angezeigt werden.

Ein gut ausgeführtes Data Mining sollte folgende Aufgaben erfüllen: Anomalieerkennung, Lernen von Assoziationsregeln (Abhängigkeitsmodellierung), Clustering, Klassifizierung, Regression und Zusammenfassung. Der Data-Mining- Prozess erfolgt normalerweise mit Daten, die im Data Warehouse enthalten sind .

Es gibt mehrere Unternehmen und Software, die sich dem Data Mining widmen, da die Identifizierung von Mustern in Datenbanken immer wichtiger wird. Die Identifizierung relevanter Standards ist jedoch nicht nur in der Computerwelt möglich. Das menschliche Gehirn verwendet einen ähnlichen Prozess, um Muster zu erkennen und Wissen zu erwerben.

In den letzten Jahren wurde Data Mining häufig in den Bereichen Wissenschaft und Technik wie Bioinformatik, Genetik, Medizin, Bildung und Elektrotechnik eingesetzt.

Das Konzept des Data Mining wird oft mit dem Extrahieren von Informationen über das Verhalten von Menschen verbunden. Aus diesem Grund wirft Data Mining in einigen Situationen rechtliche Fragen sowie Fragen zum Datenschutz und zur Ethik auf. Trotzdem behaupten viele Leute, dass Data Mining ethisch neutral ist, da es keine ethischen Implikationen hat.

Real Data Mining- Beispiele

Data Mining wird häufig von Unternehmen und Organisationen verwendet, um Wissen über Benutzer / Mitarbeiter / Kunden zu gewinnen. Im öffentlichen Sektor ist es beispielsweise möglich, den Familienstand eines Arbeitnehmers und das von ihm verdiente Gehalt zu überprüfen, um zu sehen, ob dies einen Einfluss auf sein Eheleben hat.

Unternehmen wie Supermarktketten können anhand dieser datenübergreifenden Produkte ermitteln, welche Produkte zusammen gekauft werden. Wenn ein Kunde, der Produkt X kauft, auch Produkt Y kauft, ist es möglicherweise eine gute Idee, die beiden Produkte in der Nähe zu positionieren, um dem Kunden den Kauf zu erleichtern.