BI je mrtvé! Ať žije Data as a Service!

Vždycky jsem se vyhýbal používání nových buzzwordů, zvlášť v datařině. Naším cílem je demytizovat  řadu pojmů a termínů, spojených se světem dat, jejich zpracováním, analýzou a využíváním. Tentokrát je to jiné. Pod pojmem Data as a Service se skrývá něco, co může svět využití dat v businessu opravdu hodně proměnit.

Všichni chceme “dělat Redbull”

Když jsem se pohyboval ve světě marketingu, byly promyšlené reklamní koncepty a kampaně Redbull vzor pro všechny markeťáky. Na každé marketingové nebo social media konferenci jste potkali aspoň jednu “kejsku”, co vám dávala křídla. A každej českej markeťák říkal. “Když voni maj na jedno video rozpočet 10x větší, než já mám na celej rok. To by se mi taky líbilo, dělat takový kampaně.” A když jste s nima o tom mluvili, velmi rychle jste došli k tomu, že “dokonalá” kampaň je jenom součást uceleného a velmi promyšleného marketingového konceptu. A ať už používáte 4P nebo 7P marketingu, to jedno péčko to nezachrání, když ostatní péčka jaksi pokulhávají. A pak logicky nejsou ani ty rozpočty.

S datama je to stejný. Všichni chceme dělat machine learning, neuronové sítě, zpracování řeči a já nevím co ještě. Ale když se podíváte např. na trh data science, zjistíte, že spousta data science týmů se buď rozpadla, nechala se koupit svým největším zákazníkem, nebo začala vyvíjet vlastní produkt. Proč? Když se totiž nějaká firma chce seriózně pustit do aplikace umělé inteligence, zjistí, že musí dřív nebo později stavět vlastní tým, který první 1 - 3 roky nedělá nic jiného, než čistí data a narovnává procesy ve firmě tak, aby umělá inteligence měla z čeho žít. Těžko se staví pricing engine, který má dynamicky stanovovat ceny vašich produktů na základě monitoringu konkurence, když 95% vašich produktů má v historii pouze 1 cenu. Tu, kterou dostal od category managera v době jeho zalistování. Takže i data mají svoje “péčka”, bez kterých to prostě nejde. O čem mluvím? O zralosti firmy takový koncept vůbec aplikovat. Jeden “starej a dobrej” maturity model vypadá třeba takto:

V BizzTreat používáme trochu zjednodušený model. Oba ale říkají to samé. Dělat dobře data, znamená postupovat po dílčích krocích. A přeskočit jeden z nich je záruka neúspěchu. Shit in, shit out.

Všiváckej lidskej faktor

Když nad tím budete trochu přemýšlet, bavit se s týmy, kde se daří budovat data-driven kulturu, zjístíte, že za úspěchem, či neúspěchem všech projektů stojí to, jak dobře se podaří adaptovat samotné lidi. Nejdřív jsme tu měli (a stále máme) nesmrtelné excely. Pak přišly BI nástroje, vč. lepších či horších self-analytics konceptů, jako Tableau nebo Power BI. Ale to stále nestačí. Proč? V data-driven týmech stále častěji zjišťují, že jen “koukat na data” nemá efekt. Je třeba je aktivně zapojit do procesu. Nestačí mít jen “jedno chytré místo”, kde magická AI “vymejšlí”, co komu prodat. Nestačí koupit chytrý marketing-automation tool, který to “všechno zařídí”. Potřebujete mít možnost různé části datové architektury zapojovat do celé firmy. O čem mluvím?

“Data as a Service”

Zkrátka a dobře, je to logický koncept, jak stavět architekturu služeb a celé firmy tak, aby mohla být opravdu data-driven. Školní příklad může vypadat třeba takhle.

Stále platí, že bez konsolidace dat na jednom “logickém místě” se to prostě neobejde. Tak jasně, postavíme data warehouse, nebo lépe data lake. Ok. Co dál? Aby se nám z jezera nestala bažina, je třeba data čistit a obohacovat. Pak se nad nimi dají stavět lepší nebo horší AI modely. Co je v této části zásadní však je, že součástí této “datové centrály” musí být i analytický engine, který ale původně býval v BI nástrojích. Proč? Protože bez centralizované analytické logiky, metrik, dimenzí a funkcí, budete neustále bojovat s tím, že “v bíajku nám to vychází jinak, než to vidí nákupčí”, který se ale nedívá do grafů. On prostě objednává podle toho, jak mu nákupní aplikace nabízí/doporučuje/radí.

Mno. A teď si představte, že potřebujete, aby tohle všechno fungovalo jaksi realtime. Aby dynamicky podle toho, co se děje v reálném čase, celé datové řešení umělo reagovat. Včas, spolehlivě.

Dneska do tohoto paradigmatu zapadá celá řada dílčích konceptů, jako jsou:

  • streamování dat v reálném čase do vašeho data warehouse (CDI continuous data integration), což dneska podporují všichni nejvýznamnější hráči na poli data warehousingu, vč. Snowflake či BigQuery.
  • ELT (narozdíl od tradičního ETL) konceptu, kdy data transformujete až, když je potřebujete. Za chodu. V reálném čase. Velmi životaschopné implementace lze spatřit jak v dbt, tak třeba v konkurenčním Dataform.
  • trénování, testování a deployment řady dílčích ML/AI modelů a algoritmů a jejich řetězení za sebou.
  • nové koncepty self-service analytiky a vizualizace, jako jsou např. analytické notebooky, jako např. Count.

Co doplňuje celý koncept Data as a Service a činí ho opravdu uceleným, je právě vyjmutí analytické logiky z BI nástroje a její zpřístupnění ostatním komponentám prostřednictvím API. Tohle řešení teď nedávno představila GoodData se svým GoodData.CN řešením, o kterém ještě určitě hodně uslyšíme.

Co je teda doopravdy Data as a Service? Koncept, jak stavět architekturu služeb, produktů, a firem tak, že data jsou dostupná a využitelná kdykoli, kýmkoli, jakýmkoliv způsobem. Data správná, aktuální, spolehlivá.

Zapomněl jsem na něco? Chcete se na něco zeptat? Napište mi

Rado

Radovan Jirka
Datový detektiv
LinkedIn