Datamining - Wat het is, definitie en concept - 2021 - Economie-Wiki.com

Datamining is het proces van het doorzoeken van grote databases om nuttige informatie te vinden die kan worden gebruikt voor besluitvorming. De Engelse term "datamining" wordt ook gebruikt.

Het kan worden opgevat als de technologie en software die worden gebruikt om gedragspatronen in de database te vinden. De fundamentele basis hiervoor is dat deze patronen helpen bij het nemen van beslissingen. Het kan bedrijven bijvoorbeeld helpen de gedragspatronen van hun klanten te begrijpen. Op zo'n manier dat het het opstellen van strategieën zou vergemakkelijken om de verkoop te verhogen of de kosten te verlagen.

Voordelen van datamining

Het fundamentele voordeel van dit gegevensanalyseproces is het grote aantal bedrijfsscenario's waarop het kan worden toegepast, als voorbeeld hebben we:

  • Voorspelling: Prognose van de omzet van het bedrijf.
  • Waarschijnlijkheid: Selectie van de beste klanten voor direct contact via telefoon of e-mail.
  • Sequentieanalyse: Analyse van de producten die klanten hebben gekocht en controleer de onderlinge relatie.

Stadia van datamining

Binnen een dataminingproces kunnen we vijf fasen vinden:

  • Doelstelling en gegevensverzameling: Allereerst moeten we ons concentreren op wat voor soort informatie we willen verkrijgen. Laten we ons het voorbeeld voorstellen dat een supermarkt wil weten op welk tijdstip van de dag de meeste klanten aanwezig zijn. Dit zou in dit geval het doel en de informatie zijn die de handel wil verkrijgen.
  • Gegevensverwerking en -beheer: Zodra we weten welke gegevens we willen verzamelen, zetten we de gegevens aan het werk. Dit is misschien wel de moeilijkste fase van het proces. Welnu, het vereist het selecteren van het representatieve monster waarop de analyse zal worden uitgevoerd. Nadat het monster is gekozen, moet worden geanalyseerd welk type variabelen of regressiemodel op het monster zal worden uitgevoerd.
  • Modelselectie: Het hangt nauw samen met de vorige fase. Het gaat om het creëren van een model of algoritme dat ons het best mogelijke resultaat geeft. Hiervoor moet een uitgebreide analyse van de in het model op te nemen variabelen worden uitgevoerd. Dit wordt een ingewikkelde taak, omdat dit afhangt van het type informatie dat moet worden geanalyseerd. Daarom voeren dataminers verschillende tests van het algoritme uit, zoals: lineaire regressie, beslisboom, tijdreeksen, neuraal netwerk, enz.
  • Analyse en beoordeling van resultaten: Eigenlijk is het om de resultaten te analyseren om te zien of ze een logische verklaring opleveren. Uitleg die besluitvorming vergemakkelijkt op basis van de informatie die de resultaten opleveren.
  • Modelupdate: De laatste stap van het proces zou de update van het model zijn. Het is erg belangrijk dat het na verloop van tijd wordt gedaan, zodat het niet verouderd raakt. De variabelen van het model kunnen onbeduidend worden en daarom is een periodieke controle van het model vereist.