Datový sklad jako nástroj BI
Prostá definice skladování dat říká, že jde o získávání a využití dat pocházejících z různých podnikových aplikací
nebo z externích zdrojů . Z odbornějšího pohledu je datový sklad řízeným, periodickým kopírováním dat z různých
zdrojů uvnitř organizace i jejího okolí do prostředí optimalizovaného pro analýzy a zpracování informací,
překonávajícího přitom platformové, aplikační, organizační a jiné bariéry.
Datový sklad tak představuje integrační prvek v podniku a s určitou nadsázkou lze říci, že se jedná o "archiv"
vybraných dat, tj. dat, která jsou extrahována z různých zdrojů za účelem naplnění požadované vypovídající
schopnosti datového skladu.
Vytvoření a účelné zprovoznění datového skladu i v podniku se zaběhlými informačními technologiemi není zdaleka
triviálním procesem. Vyžaduje specifické znalosti v oboru, volbu optimálního, z mnoha možných řešení i celkové
organizační zvládnutí projektu, včetně zaškolení zaměstnanců k úspěšnému využití potenciálu zavedeného řešení.
Pod pojmem centrální datový sklad (též celopodnikový datový sklad) rozumíme integrovanou, předmětově
orientovanou, změnám nepodléhající, časově proměnnou kolekci detailních dat.
Centrální datový sklad, je "srdcem" podnikové architektury pro podporu rozhodování. Vybudováním centrálního
datového skladu získává každá organizace unikátní zdroj celopodnikových detailních dat.
Jeho architektura sebou přináší:
- dobře monitorovatelné prostředí
- vytvoření jednoho místa zajišťujícího kvalitu dat
- minimalizaci interface mezi produkčním a BI prostředím
- zajištění celopodnikového pohledu na data
- snížení nákladů na HW a SW
- snížení redundance dat.
Datový sklad je fyzicky a logicky oddělen od provozních systémů a představuje další krok v budování
informačních systémů.
Metody využití datového skladu
Data z datového skladu se využívají nástroji BI pomocí širokého spektra metod pro prezentaci a analýzy dat.
Nejdůležitějšími metodami jsou:
- operativní "ad hoc" dotazy, tj. předem nepřipravené dotazy na určité hodnoty
- sestavy - jak standardní, generované dávkově, tak operativní vytvářené podle okamžité potřeby
- multidimenzionální analýza OLAP - rychlé prohlížení dat sumarizovaných na různých úrovních z různých
pohledů neboli dimenzí
- statistické analýzy - zjišťování závislosti veličin, identifikace důležitých proměnných, vytváření segmentů apod.
- finanční analýzy, ekonometrické modelování, termínové modely
- analýzy časových řad a tvorba předpovědí budoucích hodnot, identifikace sezónních výkyvů
- vizualizace dat - prohlížení dat v dynamicky provázaných grafech např. pro identifikaci neobvyklých a
extrémních hodnot a závislostí mezi daty
- dolování dat (data mining) - specializované techniky pro zpracování velkých objemů dat a hledání skrytých vazeb
a souvislostí
- převádění hodnot proměnných na geografickou prezentaci - např. zabarvení okresů podle počtu zákazníků
- manažerské informační systémy (MIS) - připravené aplikace pro vedoucí pracovníky se snadným ovládáním, se
zobrazením kritických veličin, jednoduché předpovědi
- specializované aplikace vytvořené podle konkrétních potřeb
- alerting - upozorňování na vznik výjimečného stavu zasláním zprávy.