Ač název „data mining“ znamená v doslovném překladu „dolování dat“, skutečný význam je trošku jiný. „Mining“ v tomto spojení znamená spíše „vytěžování“ dat, a ještě přesněji – vytěžování informací z dat. Obecně si tedy pod pojmem data mining lze představit jakékoliv metody a způsoby práce, při níž se data používají pro získání nějakých obchodně relevantních informací a aktivně se využívají k řízení firem.
V čem se potom liší od obecného termínu business intelligence? Data mining tvoří část business intelligence, která se odlišuje zejména specifickými metodami, zpravidla z oblasti statistiky, které se při data miningu používají. Zatímco například v reportingu jde zejména o to, najít správná data, provést analýzu trendů a odchylek a pak tato data vhodně zobrazit, v data miningu se snažíme pomocí speciálních statistických metod a algoritmů data dále „obohatit“ a touto cestou zvýšit jejich význam a vypovídací schopnosti.
Jako jednu ze základních data minigových úloh GLOBTECH zpravidla řeší profilování (profiling) a segmentaci (segmentation) zákazníků. Zejména v oblasti prodeje a služeb rezidentním zákazníkům není možné a ani efektivní řešit individuální potřeby každého jednotlivého zákazníka. Rozdělení báze zákazníků do několika segmentů na základě jejich specifických potřeb je velice výhodným kompromisem, který umožňuje přiblížit jednotlivé části marketingového mixu (tedy produkty, ceny, nabídky a reklamu a v neposlední řadě distribuční kanály) zákazníkům a současně udržet náklady na přijatelné úrovni.
Profil každého segmentu tvoří sada popisných charakteristik, které daný segment významně odlišují od ostatních segmentů a které je možné využít při cílení segmentované nabídky a v komunikaci se zákazníky. Pro segmentaci je důležitá zejména bohatost (šíře) dostupných dat popisující každého zákazníka. GLOBTECH pak často jako první krok v data miningu řeší propojení dostupných „spolehlivých“ dat z datového skladu s daty „méně spolehlivými“, tj. s daty z veřejných databází, z výzkumů apod. Takto obohacená data, pokud jsou rozumným způsobem vyčištěna, pak nabízí dobrý základ pro první analýzu profilů a segmentů. Analýzou clusterů, modelováním latentních tříd (charakteristik, které nejsou sledované, ale lze je s určitou pravděpodobností dovodit) nebo s pomocí rozhodovacích stromů pak lze velice efektivně dojít ke skupinám zákazníků s jasnými preferencemi a vlastnostmi.
Segmentování však neznamená pouze cestu od dat k informacím. Při práci na segmentaci GLOBTECH vždy úzce spolupracuje se zadavateli – zpravidla marketingovými a CRM specialisty – a snaží se pochopit účel prováděné segmentace a zajistit, aby navržené segmenty a jejich popisné charakteristiky bylo možné skutečně prakticky využít.
Mezi další data miningové úlohy často realizované společností GLOBTECH patří scoringy a prediktivní modely. Při scoringu je hlavním úkolem odhadnout pravděpodobnost určitého jevu na základě zkušenosti z případů, u kterých daný jev v minulosti nastal. Příkladem scoringu může být výpočet pravděpodobnosti, s jakou určitý zákazník přestane platit (faktury nebo svoje dluhy), nebo s jakou pravděpodobností si koupí určitý produkt. Důležitým předpokladem pro přípravu takových úloh je nejen dobrá znalost dat, ale také pochopení procesů, které daný jev doprovází. Základní metodou při přípravě scoringu je korelační analýza, tedy analýza významnosti jednotlivých faktorů pro daný jev, ať již přímo, nebo zprostředkovaně přes jiné jevy, případně pokročilejší metody, jako jsou neuronové sítě.
Od scoringů a prediktivních modelů je pak již často jen krok k ucelenému procesu řízení kampaní (ať již marketingových – prodejních – nebo CRM), které výsledky data miningu využívají, ale které jsou současně zdrojem velmi užitečných dalších vstupních dat pro další učení a zdokonalování modelů. Nastavení procesů a vybudování uceleného systému práce s modely je důležitým výstupem každého projektu GLOBTECHu.
Další oblastí, kde data miningové metody najdou své uplatnění, jsou různé optimalizační úlohy. Optimalizace v oblasti technické (například telekomunikačních sítí) nebo optimalizace procesů, lidských zdrojů nebo například sítí poboček či prodejen patří také k zajímavým data miningovým úlohám, které se řeší zejména v posledních letech stále častěji. Zatímco data o zákaznících dnes již řada firem systematicky shromažďuje a zpracovává v datových skladech, informace o procesech, jejich efektivitě a kvalitě jsou systematicky zpracovávány a uchovávány pouze výjimečně. Proto v těchto případech bývá prvním krokem zajištění sběru dat a jejich zpracování a teprve pak je možné přikročit ke skutečnému vytěžování.
Tak jako každý projekt, i data miningové úlohy je však vždy potřeba začít otázkami: co potřebuji, k čemu to potřebuji a jak to plánuji využívat, tedy popisem cíle.
Rostislav Levíček
senior consultant společnosti GLOBTECH, spol. s r. o.