Data Mining

Wat is Data Mining:

Datamining is een Engelse term die is gekoppeld aan de informatica en waarvan de vertaling bestaat uit datamining . Het bestaat uit een functionaliteit die gegevens verzamelt en organiseert, en daarin relevante patronen, associaties, wijzigingen en anomalieën vindt .

De term datamining ontstond voor het eerst in 1990 in databasegemeenschappen. Datamining is de procesanalysestap die bekend staat als KDD ( Knowledge Discovery in Databases ), de letterlijke vertaling is "Knowledge Discovery in Databases".

Datamining kan worden onderverdeeld in een paar basisstappen: verkenning, modelbouw, patroondefinitie en validatie en verificatie.

Datamining is een relatief recente praktijk in de wereld van de informatica en het gebruikt informatieherwinning, kunstmatige intelligentie, patroonherkenning en statistische technieken om te zoeken naar correlaties tussen verschillende gegevens waarmee u nuttige kennis voor een bedrijf of individu kunt opdoen. Voor een bedrijf kan datamining een belangrijke tool zijn die innovatie en winstgevendheid verbetert.

Het gebruik van datamining is vrij gebruikelijk in grote databases en het eindresultaat van hun gebruik kan worden weergegeven door middel van regels, hypothesen, beslissingsbomen, dendrogrammen, enz.

Goed uitgevoerde datamining zou taken als: anomaly detection, association rule learning (afhankelijkheidsmodellering), clustering, classificatie, regressie en samenvatting moeten uitvoeren. Het dataminingproces gebeurt meestal met behulp van gegevens in het datawarehouse .

Er zijn verschillende bedrijven en software die zich bezighouden met datamining, omdat de identificatie van patronen in databases steeds belangrijker wordt. De identificatie van relevante normen is echter niet uniek voor de computerwereld. Het menselijk brein gebruikt een soortgelijk proces om patronen te identificeren en kennis op te doen.

In de afgelopen jaren is datamining op grote schaal gebruikt op het gebied van wetenschap en techniek, zoals bio-informatica, genetica, geneeskunde, onderwijs en elektrotechniek.

Het concept van datamining wordt vaak geassocieerd met het extraheren van informatie over het gedrag van mensen. Om deze reden werpt data mining in sommige situaties juridische problemen op en kwesties met betrekking tot privacy en ethiek. Desondanks beweren veel mensen dat datamining ethisch neutraal is, omdat het geen ethische implicaties heeft.

Voorbeelden van echte datamining

Datamining wordt vaak gebruikt door bedrijven en organisaties om kennis te vergaren over gebruikers / werknemers / klanten. In de publieke sector is het bijvoorbeeld mogelijk om te controleren tussen de burgerlijke staat van een werknemer en het salaris dat hij verdient om te zien of dit van invloed is op zijn huwelijkse leven.

Bedrijven zoals supermarktketens kunnen deze kruisgegevens gebruiken om producten te bepalen die samen worden gekocht. Als een klant die product X koopt ook product Y koopt, kan het een goed idee zijn om de twee producten in de buurt te plaatsen om het voor de klant gemakkelijker te maken om te kopen.