PUBLICYSTYKA O DataMiningu słów kilka
AUTOR Marcin 'mCrvn' Karwiński
Górnictwo danych - Data Mining, skomplikowany proces pozyskiwania wiedzy (niezwykle odkrywczej) z chaotycznych zazwyczaj olbrzymich zbiorów. Mogło by się wydawać, że z racji na egzotykę terminu, nie jest on nijak z naszym codziennym życiem związany. Nic bardziej mylnego...


Trudno w to uwierzyć, ale z efektami obliczeniowego procesu wydobywania "ukrytych" danych spotyka się niemalże każdy. Jak to jest możliwe, że nawet o tym nie wiemy? Bo jest to właśnie jedna z tych zdobyczy technologicznych świata informacji, w jakim przyszło nam żyć, która steruje naszym otoczeniem w sposób niemalże bezwiedny. Otoczeniem wypełnianym nieustanną inwigilacją rodem z fantastyki naukowej, świata, w którym nasze gusta i guściki są nierzadko cenniejsze od numerów naszych kont bankowych...

Czy zastanawialiście się może czemu markety, takie wielkie pokroju Reala czy MAKRO mają w określony, specyficzny wręcz sposób uorganizowany asortyment? Czemu, by dokonać zakupów produktów pierwszej potrzeby jak pieczywo, wędliny, nabiał i warzywa, zazwyczaj trzeba pokonać "hektary" nęcących ponętnymi ekspedientkami i promocyjnymi cenami stoisk? Odpowiedź jest prosta - banalnie logiczna kwestia... Mamona, zielone, dolary, jeny, euro, złocisze... Wokół nich kręci się świat, to one wpływają na przyszłość całych cywilizacji.

Analizując bowiem wyniki sprzedaży, można wysnuć wielorakie wnioski. Sprzęgając je z odpowiednimi danymi o rozmieszczeniu towarów na półkach, można uzyskać niebagatelny wzrost "pieniędzy na czysto". Jak to jest możliwe? Spójrzmy na prosty przypadek pani Kowalskiej odwiedzającej sklep w ściśle zdefiniowanym celu - kupić tylko to, co naprawdę potrzebne. Jak taka historia się kończy? Nagle koszyk zapełnia się całą gamą produktów... a w kasie pracownicy/e z uśmiechem na ustach nabijają kolejne kody. Brzmi znajomo? No właśnie...

Ten drobny przypadek nosi nazwę tzw. analizy koszykowej. Polega ona na wyłapywaniu z tłumu zakupywanych produktów powiązań między typami towarów. I nie mowa tu o oczywistych zależnościach pokroju chleb-masło-wędlina, a raczej takich mniej domyślnych. Przykład? Brytyjski WalMart wykrył takowe powiązanie: "przy zakupie piwa często zakupywane są też pieluszki". Doprawdy ciekawy fakt. Po przygotowaniu tych tzw. reguł asocjacyjnych menadżerowie centrów handlowych i marketów mogą dostosować układ towaru by zapewnić jednoczesne "logiczne rozmieszczenie", zmaksymalizowanie trasy, jaką musi pokonać pani Kowalska, a tym samym zwiększenie profitów firmy. Sprytne, co? No ba...

Nawet zawartość "gablot przykasowych" jest ściśle zaplanowana. Batony i inne cukierki tylko czekają na łakomczuchów, którzy już wytrzymać nie mogą... Dzieciaki towarzyszące rodzicom urządzają w tym miejscu pokaz technik wywierania wpływu. W końcu dzielnie snuły się za starszymi po tych nudnych stoiskach, więc teraz chyba im się należy?! A prezerwatywy? Badania wykazały, że jeśli by umieścić je gdzieś w głębi sklepu, to przymus podróży z takim towarem odsłoniętymi i zatłoczonymi "ścieżynkami" zmusi blisko 80% klientów do porzucenia idei "bezpiecznego seksu". Chore, ale tak niestety jest. I trzeba przyznać, że fachowcy mają głęboko gdzieś to, czy złapiesz HIV-a czy inne paskudztwo. Klient, który nie kupi towaru, to klient stracony na rzecz konkurencji. A na to nie można sobie pozwolić... No to już wiecie czemu sklepy są zbudowane tak, a nie inaczej... Jeśli wciąż nie wierzycie w me słowa, sprawdźcie na sobie jak bardzo wasz koszyk będzie się różnił przy kasie od wstępnie zamierzonej listy zakupów...
A to tylko czubek góry lodowej zastosowań DM-u. Zastanawialiście się czemu sklepy netowe "podpowiadają nam", radzą co by jeszcze kupić? Przecież to nie dlatego, że sprzedawca się o nas troszczy... Nie, to kolejny efekt analizy koszykowej. Tym razem nie mamy przecież fizycznych stref towarowych. Jak więc przekonać klienta do nadmiarowych zakupów? Proste i logiczne... Bo inni kupili! Taka niewidoczna presja psychiczna nieraz czyni cuda. Już choćby blisko 60 % szansa, że klient przejdzie do innego działu, tym samym zapoznając się z ofertą, wart jest całego tego "koszykowego" zamieszania.

Przegrzebywanie danych występuje też dużo częściej w innym sektorze biznesu. Próbowaliście kiedyś dostać kredyt? Może kojarzycie termin "zdolność kredytowa"? Owa zdolność to nic innego jak wynik innej analizy - całego spektrum czynników, które banki biorą pod uwagi nim powierzą komuś dużą kwotę. Niemożliwe się to wydaje, lecz przecież należy rozważyć wszystko co o danej osobie wiemy. A wiedzieć można naprawdę dużo - czy inne kredyty były brane, jak były spłacane, jakie są zarobki czy nawet na co pieniądze najczęściej idą. Rachunek przychodów i rozchodów to skomplikowany proces wydobywania zasad kierujących klientami. Tym samym sposobem tworzone są oferty na przyszłość - przez analizę dotychczasowych klientów.

Wszędobylskie reklamy ofert telefonicznych to kolejny wynik odpowiednich wnioskowań opartych na liczbowych wartościach opisujących zachowania i potrzeby klientów. Spece marketingowi już dawno poznali tajemnicę sukcesu - reklama musi trafiać w gusta i potrzeby klienta... Chcecie przykładu? Średnio wychodzi, że w ciągu doby użytkownik komórki w Polsce około 65% połączeń realizuje w ramach własnej sieci... Nic więc dziwnego, że gros promocji opiera się na standardzie "w ramach sieci i na stacjonarne". Orange'owscy "Przyjaciele" czy Plusowy "Czasowstrzymywacz" to ledwie czubek góry lodowej ofert w zanadrzu naszych kochanych operatorów. Inna metoda stosowana przez menagerów Ery opiera się z kolei na wysnuciu prostego związku - jesteśmy skąpi i wolimy jeśli ktoś inny do nas dzwoni (blisko 28% użytkowników komórek reprezentuje taki pogląd). Brzmi znajomo? 2 min odebranych połączeń zamieniane na 1 min wykonywanych... Uczciwa zamiana. I jaki ciekawy pomysł na skuszenie owych blisko 30% użytkowników do przejścia do Ery...

Górnictwo danych ma jednakże pewne specyficzne i niezwykle popularne docelowe obszary wykorzystania. Mowa tu o analizie ogólno-rynkowej. Stosowana jest głównie przez prężne koncerny zainteresowane "ekspansją" i pochłanianiem co słabszej konkurencji. Nim dana firma uzna inną za wartą zakupu przeprowadza ona szereg analiz stanu "przyszłego członka rodziny". Bazując na koszmarnie olbrzymich ilościach danych z zakresu możliwości kredytowych, zarobków, możliwych zysków, spodziewanych strat, charakterystyk zachowania się i opierania się tendencjom spadkowym rynku, biznesmani korzystają z odpowiednich osiągnięć ery informacyjnej, tym samym dzięki odpowiednio oprogramowanym technikom Data Miningu dołączają do elit managerskich.

Rejonów zastosowań technik ekstrapolacji wiedzy z szeregu "zer i jedynek" tworzących rozbudowane bazy danych jest jeszcze wiele. Od analizy rozwiązań architektury w celu wyszukania ukrytych wzorców, przez analizę ruchu na cybernetycznej autostradzie informacji, po wspomaganie badań medycznych (diagnostyka np. patologiczna czy biotechnologia i genetyka) - drążenie danych będzie coraz ściślej splatało się z naszą rzeczywistością, i czy chcemy tego czy nie, z coraz większym butem brutalnie będzie wkraczać w nasz świat. Od nas tylko zależy, czy przymkniemy oko na możliwości pozyskania wiedzy niezbędnej do otrzymania interesującej i dobrze płatnej posady, czy też uznamy temat za niewart zainteresowania. Ci, którzy jednak czasem myślą o swej przyszłości na rynku informatycznym, może wezmą sobie do serca me słowa... Uczcie się, poznawajcie techniki eksploracji danych, bo nieznane są wyroki Boskie i nigdy nie wiadomo jaka umiejętność okaże się wytrychem do bram niebios waszych marzeń majątkowych.