- Podnikam.sk
- Články
- Manažment
- Dátový sklad ako základný stavebný kameň manažérskeho informačného systému
Dátový sklad ako základný stavebný kameň manažérskeho informačného systému
Ešte pred zhruba desiatimi rokmi by sme riešenia manažérskych informačných systémov (MIS) nachádzali na Slovensku veľmi ojedinele, zatiaľ čo v dnešnej dobe môžme konštatovať, že ak firma nemá kvalitný MIS, tak môže len ťažko konkurovať spoločnostiam, ktorého už takýto systém používajú. MIS radíme do rodiny nástrojov Business Intelligence (BI), ktoré predstavujú širokú triedu aplikačných programov a technológií pre podporu rozhodovania. Manažérsky informačný systém možno definovať ako informačný systém na manažérskom stupni riadenia organizácie, ktorý slúži funkciám plánovania, kontroly a rozhodovania poskytovaním pravidelných informácií vo forme prehľadov a hlásení o sledovaných stavoch a udalostiach v podniku. MIS by mal poskytovať “jedinú pravdu” pre všetky úrovne riadenia v podniku a každý používateľ má k dispozícii len tie informácie, ktoré má právo vidieť. Nevyhnutným predpokladom úspešnosti MISu je dôvera v prezentované údaje.V dnešnej dobe poznáme množstvo riešení podporované rôznymi technológiami na trhu, ktoré spadajú pod označenie MIS a vo väčšine prípadov majú jeden spoločný menovateľ, dátový sklad (data warehouse – DWH).Problematika dátových skladov už nie je v dnešnej dobe žiadnou novinkou, práve naopak. Veľa spoločností už vlastní dátový sklad, alebo sa chystá si ho vybudovať.DWH poskytuje možnosť zhromažďovať, extrahovať, čistiť, transformovať, konsolidovať a unifikovať dáta z rôznych informačných systémov, aj iných ako transakčných. V oblasti budovania DWH existujú dva hlavné prístupy riešenia dátovej architektúry:
- Corporate Information Factory (CIF) podľa Billa Inmona
- Data Warehouse Bus (DWHBus) podľa Ralpha Kimballa
Tak dlho, ako existujú tieto dva prístupy, existuje aj nekonečná debata o tom, ktorý z týchto prístupov je vhodnejší. Jedná sa síce o dve nezlučiteľné koncepcie, no napriek tomu sa v niektorých bodoch zhodujú:
- na úvode prebieha analýza užívateľských požiadaviek a všetkých zdrojových systémov
- použitie metódy zhora-nadol (začína sa najkompletnejším logickým modelom prezentačnej vrstvy, vytvoreným na základe analýzy v predchádzajúcom bode)
- inkrementálny prístup budovania DWH
- prezentačná vrstva DWH pozostáva z entít reálneho sveta a ich vzťahov tak ako naozaj existujú a nie tak, ako by ich chceli vidieť užívatelia
- prezentačná vrstva DWH musí obsahovať atomické dáta
- datamarty používajú dimenzionálny model
Dátový model DWH pozostáva z dvoch hlavných typov informácií, z faktov a dimenzií. Fakty predstavujú numerické hodnoty o sledovanej veličine (napr. zostatky účtu). Dimenzie obsahujú informácie, ktoré predstavujú kontext, v ktorom sú fakty prezentované a skúmané (napr. typ účtu). Konštalácia faktov a dimenzií je v rámci dátového modelu DWH v tvare hviezdy („star schema“), alebo snehovej vločky („snowflake schema“).Spomínané prístupy sa líšia v dvoch hlavných oblastiach:
- logický model prezentačnej vrstvy
- CIF používa entitno-relačný návrh
- DWHBus používa procesný návrh (dimenzionálny model)
- Interpretácia pojmu datamart
- CIF označuje datamart ako problémovo orientovanú podmnožinu dát prezentačnej vrstvy, ktorá je vo vlastníctve oddelenia organizácie. Datamart je plnený z prezentačnej vrstvy.
- DWHBus označuje datamart ako procesne orientovanú podmnožinu entít prezentačnej vrstvy. Samotná prezentačná vrstva je tvorená zjednotením procesne orientovaných datamartov.
Na záver niekoľko praktických informácií o DWH, resp. aká je skutočná pravda:
- Produkt – DWH/BI systém sa nedá kúpiť. Žiadny produkt nemôže obsahovať všetky oblasti ako ETL (Extraction, Transformation and Loading) procesy, prezentačnú vrstvu, aplikačnú OLAP vrstvu, reportovacie služby, nástroje pre prístup k dátam, užívateľský portál, správu metadát, bezpečnosť atď. Veľkí dodávatelia technológií (napr. Oracle) sa však snažia ponúkať kompletnú platformu pre DWH/BI systémy zloženú z rôznych produktov.
- Projekt – zavádzanie DWH/BI systému zahŕňa viacero projektov. Plánovanie a analýzu je potrebné vykonávať na celopodnikovej globálnej úrovni, avšak realizácia musí byť inkrementálna. DWH/BI je skôr nikdy nekončiaci iteratívny proces.
- Dátový model – samotný (logický) dátový model prezentačnej vrstvy nič nerieši. Bez ETL procesov, zabezpečenému prístupu k dátam, správy metadát a ďalších vyriešených oblastí je aj ten najlepší dátový model k ničomu.
- Kópie dát prevádzkového systému – typická chyba je domnievať sa, že skopírovaním prevádzkových dát do reportovacieho systému vzniká DWH/BI systém. Prenesenie dát bez ich reštrukturalizácie neprináša nič podstatného z pohľadu koncového užívateľa.
Zdroj: Ing. Róbert Mikulčík, MBA, ISP spol. s r.o.