Data mining, prema hrvatskom prijevodu „rudarenje podataka“ ili „podatkovno rudarenje“. To je oblik analitike podataka i predstavlja sortiranje, organiziranje ili grupiranje velikog broja podataka i izvlačenje relevantnih informacija. Laičkim rječnikom „data mining“ najjednostavnije je objasniti kao proces pronalaženja korisnog znanja ili informacija. Odnosno otkrivanje znanja iz velike količine podataka (tzv. big data).
Razvija se kroz vrijeme sukladno razvoju novih tehnologija koje su naravno donijele i nove mogućnosti. Od neuronskih mreža u samom začetku do današnjih digitalnih rješenja koja sve više uključuju umjetnu inteligenciju (Artificial Intelligence) na svim poljima.
Zašto je data mining koristan u poduzetništvu?
U polju informacijskih i komunikacijskih znanosti kojim se bavim veže se najčešće uz „Business intelligence“ (skraćeno BI). Uporaba rudarenja je jako široka: od vojnih i obavještajnih sustava do poslovne ekonomije.
U poduzetničkom svijetu data mining poboljšava proces donošenja odluka na strateško-poslovnoj razini pružajući uvid u tzv. „skrivene podatke business intelligence (BI) metodologijom. Rudarenjem podataka također se otkrivaju odnosi, logičnost, pravilnost te općenito bilo kakve strukture među podacima.
Rudarenje podrazumijeva organiziranje baza čišćenjem podataka kako bi se pristupilo znanju i stjecanju istog na temelju postojećih podataka u bazama. Razvoj tehnologije, računala, interneta bitno doprinosi lakšem organiziranju podataka. No da bi oni postali korisni, potrebno je njihovo pretvaranje u informacije i znanje.
Danas u tom procesu uvelike pomažu i otvoreni podaci („open data“) koji su prema novoj regulativi EU donijeli mogućnost šire uporabe podataka te cjelokupan javni sektor ima obvezu objave otvorenih podataka koje upravo u procesu rudarenja podataka omogućavaju kvalitetnu osnovu za pretvaranje podataka u znanje.
Pritom se termin rudarenja podataka često poistovjećuje s dva različita procesa: otkrivanje i predviđanje znanja. Proces otkrivanja znanja implicira korisnikovo razumijevanje eksplicitnih informacija za koje je bitno da su u čitljivom obliku. Predviđanje se odnosi na buduće događaje sukladno statističkim metodama kojima se temeljem postojećih podatka dobivenih rudarenjem podataka projiciraju trendovi i analize budućih pokazatelja kretanja poslovnih procesa temeljem poslovnih odluka (i primjene primjerice teorije odlučivanja).
Temelj suvremenog strateškog poslovanja
Kako biste bolje shvatili pojam rudarenja možemo ukratko reći da se rudarenje podataka razvija sve brže progresivnim razvojem novih informacijskih i komunikacijskih tehnologija koje upotrebljavaju koncepte, metode i tehnike različitih disciplina. Kao npr. statističke metode, metode umjetne inteligencije i metode upravljanja bazama podataka.
Suvremeno poslovanje u informacijskom dobu svakako donosi potrebu obrade velikog niza podataka dostupnih na internetu koji kroz rudarenje podataka u realnom vremenu (analitiku) i razvoj sustava baza podataka rezultira dolaženjem do korisnih informacija i znanja.
U tom smislu možda ste se sreli s pojmovima kao što su KDD (Knowledge Discovery in Databases), CRM (Customer Relationship Management) ili Database Intelligence što zapravo i jesu primjene rudarenja podataka u poslovnoj praksi.
Svakako, informacijska tehnologija kakvu je poznajemo danas, omogućuje nam praćenje i evidentiranje velike količine podataka u digitalnom obliku. Kao i nove oblike pretraživanja podataka te samog njihovog strukturiranja u baze podataka, a količina tih podataka mjeri se u gigabajtima i terabajtima.
Stoga metodologija „data mininga“ odnosno „rudarenja podataka“ jest tehnika koja postaje temelj suvremenog strateškog poslovnog odlučivanja.
Izvor: womeninadria.com