Datamining - Wat het is, definitie en concept

Datamining is het proces van het doorzoeken van grote databases om nuttige informatie te vinden die kan worden gebruikt voor besluitvorming. De Engelse term "datamining" wordt ook gebruikt.

Het kan worden opgevat als de technologie en software die worden gebruikt om gedragspatronen in de database te vinden. De fundamentele basis hiervoor is dat deze patronen helpen bij het nemen van beslissingen. Het kan bedrijven bijvoorbeeld helpen de gedragspatronen van hun klanten te begrijpen. Op zo'n manier dat het het opstellen van strategieën zou vergemakkelijken om de verkoop te verhogen of de kosten te verlagen.

Voordelen van datamining

Het fundamentele voordeel van dit gegevensanalyseproces is het grote aantal bedrijfsscenario's waarop het kan worden toegepast, als voorbeeld hebben we:

  • Voorspelling: Prognose van de omzet van het bedrijf.
  • Waarschijnlijkheid: Selectie van de beste klanten voor direct contact via telefoon of e-mail.
  • Sequentieanalyse: Analyse van de producten die klanten hebben gekocht en controleer de onderlinge relatie.

Stadia van datamining

Binnen een dataminingproces kunnen we vijf fasen vinden:

  • Doelstelling en gegevensverzameling: Allereerst moeten we ons concentreren op wat voor soort informatie we willen verkrijgen. Laten we ons het voorbeeld voorstellen dat een supermarkt wil weten op welk tijdstip van de dag de meeste klanten aanwezig zijn. Dit zou in dit geval het doel en de informatie zijn die de handel wil verkrijgen.
  • Gegevensverwerking en -beheer: Zodra we weten welke gegevens we willen verzamelen, zetten we de gegevens aan het werk. Dit is misschien wel de moeilijkste fase van het proces. Welnu, het vereist het selecteren van het representatieve monster waarop de analyse zal worden uitgevoerd. Nadat het monster is gekozen, moet worden geanalyseerd welk type variabelen of regressiemodel op het monster zal worden uitgevoerd.
  • Modelselectie: Het hangt nauw samen met de vorige fase. Het gaat om het creëren van een model of algoritme dat ons het best mogelijke resultaat geeft. Hiervoor moet een uitgebreide analyse van de in het model op te nemen variabelen worden uitgevoerd. Dit wordt een ingewikkelde taak, omdat dit afhangt van het type informatie dat moet worden geanalyseerd. Daarom voeren dataminers verschillende tests van het algoritme uit, zoals: lineaire regressie, beslisboom, tijdreeksen, neuraal netwerk, enz.
  • Analyse en beoordeling van resultaten: Eigenlijk is het om de resultaten te analyseren om te zien of ze een logische verklaring opleveren. Uitleg die besluitvorming vergemakkelijkt op basis van de informatie die de resultaten opleveren.
  • Modelupdate: De laatste stap van het proces zou de update van het model zijn. Het is erg belangrijk dat het na verloop van tijd wordt gedaan, zodat het niet verouderd raakt. De variabelen van het model kunnen onbeduidend worden en daarom is een periodieke controle van het model vereist.

Populaire Berichten

Amerika's grootste banken

In navolging van de algemene trend van andere jaren staat het bedrijf JP Morgan Chase van Jamie Dimon aan het roer, en staat op nummer 1 in de ranglijst van de grootste banken in de Verenigde Staten. Beginnend met een waarde van zijn activa van bijna 2.380 miljard euro en een marktkapitalisatie van 279 duizendLees meer…

ValueSchool en werken samen om financiële educatie te stimuleren

Economipedia en Value School bundelen hun krachten om financiële geletterdheid te bevorderen en het begrip van basisonderwerpen als sparen, financieren en beleggen te vergemakkelijken. Aan de ene kant is ValueSchool een project gericht op het bevorderen van financiële cultuur, sparen en beleggen in Spanje. Geboren uit de behoefte om te delenLees meer…

Big data vormt de wereld van de toekomst

Er is veel gezegd over Big Data en de impact die het heeft op sommige sectoren, niet alleen de economie en het bedrijfsleven, maar ook op het openbaar bestuur of de gezondheid. Maar wat betekent Big Data? Big Data verwijst naar de enorme hoeveelheid data die tegenwoordig wordt gegenereerd in de verschillende acties dieLees meer…