Podaci i umjetna inteligencija (AI); AI i podaci.
Gotovo uvijek čujete dva pojma izgovorena u istom dahu. Zašto je to tako?
Ako ste poduzetnik i pokušavate razumjeti više o ovim temama, bilo da se radi o poboljšanju vaših radnih procesa ili proizvoda ili nekog aspekta vašeg poslovanja, donosimo vam generalnu ideju o tome što ljudi misle kada inzistiraju na tome da ova dva pojma uvijek promatraju zajedno.
Umjetna inteligencija (AI) treba podatke da učini bilo što.
U svojoj srži, AI je algoritam, što na jednostavnom jeziku znači proces koji uzima ulaze i proizvodi izlaze. Slično kao i vaš automobil, koji je samo komad metala koji stoji u garaži dok ne dobije gorivo za pokretanje, sam algoritam bez podataka za obradu ne može napraviti ništa korisno. Zapravo, ne može učiniti ništa.
To znači da, ako želite da vaša tvrtka iskoristi prednosti umjetne inteligencije, prvi zadatak je prikupiti vaše podatke i dovesti ih u prihvatljivu formu. Ovo može biti pravi kamen spoticanja, smatra Phong Nguyen, osnivač konzultantske tvrtke za podatkovnu znanost Partners in Company. “Prema klijentima s kojima smo radili i s kojima smo razgovarali, prepreke tome da budemo više vođeni podacima (data driven) obično su posjedovanje čistih, dosljednih podataka te njihova centraliziranost i sigurnosti”, kaže ona.
To obično znači ili izvlačenje podataka iz proračunskih tablica ili spajanje podataka s više platformi – poput platforme za upravljanje odnosima s klijentima (CRM) i marketinške platforme – u centralizirano spremište, gdje se podaci mogu početi kombinirati i uspoređivati za analizu. Obično će se tada ipak trebati očistiti i normalizirati na razne načine kako bi se osiguralo da su dosljedno i u pravom obliku prije nego što timovi za analizu mogu izvući ispravne zaključke i zatim dalje praviti dodanu vrijednost na tim podacima pomoću AI, piše Inc.
Velike količine podataka su potrebne za pouzdane rezultate
Štoviše, većina AI treba velike količine podataka za dobivanje pouzdanih rezultata, iz istog razloga iz kojeg vam je potreban veliki uzorak bilo čega kako biste donijeli razumnu prosudbu. Svi smo upoznati s političkim anketama, gdje profesionalci obično tvrde da je točnost veća od 95 posto o tome kako veća populacija planira glasovati na izborima uzimajući uzorke oko 300 ljudi.
To je za jednostavan izbor između dvije opcije. Ako pokušavate napraviti predviđanja, kao što je razlikovanje vrsta ponašanja kupaca u vašim marketinškim podacima, htjet ćete započeti s mnogo tisuća uzoraka. Često ćete koristiti i puno više podataka da biste dobili snažno povjerenje u svoje rezultate.
O koliko podataka govorimo? Odgovarajuća statistička analiza može vam dati precizan broj za ono što pokušavate učiniti, ali kao opće pravilo, stotine tisuća redaka obično su na donjem kraju za analize temeljene na strojnom učenju. “Nisam navikla raditi s nečim što ima manje od milijun redaka“, kaže Chantel Perry, iskusna podatkovna znanstvenica u velikim tvrtkama i autorica knjige Data Newbie to Guru.
A za nešto poput marketinške analize, gdje sklonosti kupaca koje pokušavate razumjeti mogu varirati iz dana u dan i od mjeseca do mjeseca, također želite dovoljno podataka u dovoljno dugom razdoblju da napravite korisna predviđanja: “Želite biti u poslu najmanje šest mjeseci i prikupljati podatke o svojim kupcima najmanje šest mjeseci”, kaže Perry.
Sada shvaćate zašto je AI treba podatke. Ta ovisnost ide i u drugom smjeru. Istina je da ne možete imati jedno bez drugog.
Puno podataka proizlazi iz umjetne inteligencije (AI).
Baš kao što je AI algoritmi trebaju podatke kao svoj ulaz, i njihov izlaz je često neki oblik podataka.
Recimo da se vaši marketinški podaci skupljaju na takav način da otkrijete da imate osam glavnih skupina kupaca. Nadalje biste mogli otkriti da bi različite skupine kupaca trebale primati različite vrste oglasa. Ti rezultati su podaci koje možete unijeti u drugi algoritam, onaj u kojem onda možete upotrijebiti to označavanje da predvidite kojem će klasteru budući kupac pripadati, a zatim imate automatizirani proces koji im dodjeljuje oglase za koje se predviđa da će biti najviše djelotvorni.
Kad bolje razmislite, svi podaci postoje kao rezultat nekog procesa sličnog algoritmu, često AI. Ponekad AI pokreće taj proces prikupljanja podataka, ponekad nije, a ponekad razlika nije toliko jasna. Uzmimo, na primjer, podatke o prosječnom prihodu i obrascima potrošnje u zemljopisnom području koje ciljate: Moglo bi doći iz kombinacije anketa, vladinih podataka, podataka koje su obradile kartičarske kuće i trgovci, i sve to zajedno bi postala jedna skupina podataka, koji bi vaši marketinški algoritmi mogli koristiti da vam pomognu ciljati različite kupce na različite načine.
Ključno je razumijevanje povratne veze
Postoji uobičajena izreka na koju se često poziva kada se govori o znanosti o podacima: “Nitko ne vjeruje u model, osim osobe koja ga je stvorila, i svatko vjeruje u dati skup podataka, osim osobe odgovorne za njegovo prikupljanje.”
Skloni smo vjerovati da su podaci nužno istiniti i da se ne oslanjaju na čovjeka ili umjetnu inteligenciju. Ali to je često neistina. Ako želite doći do smislenih rezultata, morate pažljivo proučiti podatke koji ulaze u vaše modele – kao i modele koji su proizveli podatke koje dajete svojim modelima.
“Najveća stvar u kojoj vidim problem je kvaliteta podataka“, kaže Perry. “Sve što ulazi u proces donošenja odluka mora se provjeriti sa aspekta točnosti, pristranosti i drugih problema – posebno kada se radi s modelima strojnog učenja.”
Razumijevanje ove povratne veze između podataka i AI pomoći će vam da izbjegnete oslanjanje na analize koje nisu baš tako dobre kao što se na prvi pogled čine.