Vědět o hlavním schématu: Hvězda vs. Sněhová vločka

Vícerozměrné schéma je navrženo tak, aby vytvořilo model systémů datového skladu.

Hlavním účelem těchto schémat je řešit potřeby větších databází vytvořených pro analytické účely (OLAP).

Tato metoda se používá k uspořádání dat v databázi s dobrým uspořádáním obsahu v databázi. Schéma umožňuje zákazníkům klást otázky spojené s obchodními nebo tržními trendy.

Vícerozměrné schéma dále představuje data ve formě datových kostek, které umožňují prohlížení a modelování dat z různých perspektiv a dimenzí.

Je tří typů, ale mnozí si pletou hvězdu a sněhovou vločku. Proto je pro ně obtížné vybrat nejvhodnější model.

Pokud jste jedním z nich, pojďme diskutovat o rozdílech mezi schématem hvězd a sněhových vloček, začněte definicí a pochopením jejich výhod, problémů, diagramů a charakteristik.

Co je vícerozměrné schéma?

Schéma odkazuje na logický popis kompletní databáze a datových trhů. Zahrnuje názvy záznamů a jejich popisy, včetně agregátů a souvisejících datových položek.

Databáze obecně používá k popisu relační model, zatímco systém datového skladu používá model Schema.

Vícerozměrné schéma lze definovat pomocí jazyka DMQL (Data Mining Query Language).

K definování datových tržišť a datových skladů používá dvě primitiva – definici dimenze a definici krychle.

Vícerozměrné schéma používá různé typy modelů schémat. Jsou to:

  • Hvězdné schéma
  • Schéma sněhové vločky
  • Galaxie schéma

Pojďme diskutovat o tom, co jsou schémata hvězd a sněhových vloček.

Hvězda vs. Sněhová vločka: Co jsou zač?

Co je hvězdné schéma?

Hvězdicové schéma je architektonický datový sklad a model business intelligence vyžadující jedinou tabulku faktů pro ukládání naměřených a transakčních dat. Používá také různé menší rozměrové tabulky k uchování atributů o obchodních datech.

Jmenuje se podle své struktury. Jako hvězda, tabulka faktů zaujímá své místo ve středu diagramu a malé rozměrové tabulky přiléhají jako větve ke středové tabulce a vytvářejí strukturu podobnou hvězdě.

Každé hvězdicové schéma se skládá z jedné tabulky faktů, ale z několika malých rozměrových tabulek. Tabulky faktů obsahují specifická, měřitelná data, která je třeba analyzovat, jako je protokolovaný výkon, finanční data nebo záznamy o prodeji. Může to být snímek historických dat najednou nebo transakční.

Schéma Hvězda je navíc nejjednodušší a nejzákladnější mezi datovými sklady a schématy datového trhu. Je efektivní při zpracování základních dotazů. Hvězdné schéma obecně podporuje business intelligence, ad hoc dotazy, analytické aplikace a online analytické zpracování kostek.

Hvězdicové schéma také podporuje počet, průměr, součet a další agregace mnoha záznamů. Uživatelé mohou snadno filtrovat a seskupovat agregace podle dimenzí. Uživatelé například generují dotazy jako „najděte všechny záznamy o prodeji v červnu“ nebo „analyzujte celkové tržby z kanceláře XYZ v roce 2022“.

  Jak změnit barvu pozadí v aplikaci Microsoft Word

Co je schéma sněhové vločky?

Schéma sněhové vločky je multidimenzionální datový model, který může být také známý jako rozšíření hvězdného schématu. Je to proto, že tabulky dimenzí ve schématu sněhových vloček se dělí na poddimenze.

Schéma je sněhová vločka, pokud jedna nebo více tabulek dimenzí nejsou propojeny přímo s tabulkou faktů, ale spíše se propojují prostřednictvím jiných tabulek dimenzí.

Sněhové vločky jsou jev, který normalizuje tabulky rozměrů ve hvězdném schématu. Když normalizujete všechny tabulky dimenzí, výsledná struktura připomíná sněhovou vločku obsahující tabulku faktů uprostřed struktury.

Jednoduše řečeno, schéma sněhové vločky se skládá z jedné tabulky faktů uprostřed modelu, která je propojena s tabulkami dimenzí, které jsou opět propojeny s dalšími tabulkami dimenzí. Toto schéma se používá ke zvýšení výkonu dotazů.

Model je vytvořen pro rychlé a flexibilní dotazování napříč složitými vztahy a dimenzemi. Je to užitečné pro jeden k mnoha a mnoho k mnoha vztahům mezi různými úrovněmi dimenzí.

Díky přísnějšímu dodržování více normalizačních standardů získáte větší efektivitu ukládání. Redundance dat je však zanedbatelná a výkon je nízký ve srovnání s denormalizovanými datovými modely, jako je hvězdné schéma.

Hvězda vs. Sněhová vločka: Jak fungují?

Jak funguje hvězdné schéma?

Tabulka faktů uprostřed modelu hvězdy ukládá dva typy informací – číselné hodnoty a hodnoty atributů dimenze. Pojďme si je porozumět na příkladu prodejní databáze.

  • Číselné hodnoty jsou jedinečné pro každý řádek a datový bod. To nekoreluje ani nesouvisí s daty uloženými v jiném řádku. Jedná se o fakta o dané transakci, jako je celková částka, množství objednávky, přesný čas, čistý zisk, ID objednávky atd.
  • Hodnoty dimenzionálních atributů neukládají žádná data přímo, ale ukládají hodnoty cizího klíče pro řádek v dimenzionální tabulce. Na tyto informace budou odkazovat různé řádky v centrální tabulce, jako je hodnota dat, ID prodejního zaměstnance, ID pobočky, ID produktu atd.

Tabulky dimenzí vždy ukládají podpůrné informace z tabulky faktů. Každá dimenzionální tabulka se vztahuje ke sloupci tabulky faktů spolu s dimenzionální hodnotou a ukládá další data o této hodnotě.

Příklad: Tabulka dimenzí zaměstnanců používá jako hodnotu klíče ID zaměstnance a obsahuje také informace, jako je jméno, pohlaví, adresa a telefonní číslo. Podobně tabulka rozměrů produktu ukládá informace, včetně názvu produktu, barvy, data prvního uvedení na trh, výrobních nákladů atd.

Jak funguje schéma sněhové vločky?

Představte si design sněhové vločky se středovým rámečkem a různými spoji přes tento rámeček s různými tečkami. Pro údržbu datových tržišť a datových skladů přichází na řadu návrh schématu sněhových vloček.

Je to podobné hvězdnému schématu, ale s nepatrnými změnami. Na rozdíl od hvězdicového schématu schéma sněhové vločky rozšiřuje své tabulky subdimenzí, které jsou propojeny s tabulkami dimenzí.

  Kolik stojí zrušení Planet Fitness

Primárním účelem tohoto modelu je normalizovat denormalizované informace modelu hvězdy. Tímto způsobem může vyřešit běžné problémy spojené s hvězdným schématem.

V jádru schématu najdete tabulku faktů, která je propojena s informacemi obsaženými v tabulkách dimenzí. Tyto tabulky opět vyzařují směrem ven k tabulkám dílčích dimenzí, které obsahují podrobné informace popisující informace o tabulce dimenzí.

Příklad: Schéma sněhové vločky obsahuje tabulku prodejních skutečností a tabulky dimenzí umístění prodejen, linek, rodin, produktů a časových dimenzí. Dimenze trhu se skládají ze dvou tabulek dimenzí, přičemž hlavní tabulkou dimenzí je obchod a tabulkou poddimenzí je umístění obchodu. Dimenze produktu má tři tabulky subdimenzí, které zmiňují tabulku subdimenzí produktu, řady a rodiny.

Hvězda vs. Sněhová vločka: Charakteristika

Charakteristika hvězdného schématu

  • Hvězdicové schéma může filtrovat data z normalizovaných dat, aby vyhovovalo potřebám datového skladu. Jedinečný klíč je generován z přidružených informací pro každou tabulku faktů k identifikaci každého řádku.
  • Poskytuje rychlé výpočty a agregace, jako jsou příjmy ze získaných příjmů a celkový počet prodaných položek na konci každého měsíce. Tyto detaily lze filtrovat podle potřeby rámováním vhodných dotazů.
  • Jedná se o měření událostí, které zahrnuje konečný počet hodnot sestávajících z cizího klíče. Tyto klíče se vztahují k rozměrovým tabulkám. Existují různé typy tabulek faktů, které jsou orámovány hodnotami na atomární úrovni.
  • Tabulka skutečností transakce obsahuje údaje o konkrétních událostech, jako jsou prodeje a svátky.
  • Záznamy zahrnují daná období, jako jsou informace o účtu na konci roku nebo každé čtvrtletí.
  • Rozměrová tabulka poskytuje podrobné údaje o atributech nebo záznamech nalezených ve středové tabulce.
  • Uživatel je schopen si sám navrhnout stůl dle potřeb.
  • Ke shromažďování tabulek snímků můžete použít hvězdicové schéma.

Charakteristika schématu sněhové vločky

  • Schéma sněhové vločky vyžaduje malý prostor na disku.
  • Tento model se snadno implementuje díky samostatným a hlavním tabulkám rozměrů.
  • Tabulky rozměrů obsahují alespoň dva atributy pro definování informací o více zrnech.
  • Vzhledem k více tabulkám je výkon ve srovnání s hvězdicovým schématem nízký.
  • Schéma sněhové vločky má nejvyšší úroveň integrity dat a nízkou redundanci díky normalizaci.

Hvězda vs. Sněhová vločka: Výhody

Výhody hvězdicového schématu

  • Hvězdicové schéma je nejjednodušší způsob mezi schématy datového trhu.
  • Má jednoduchou logiku reportování. Tato logika je implikována dynamicky.
  • Je navržen s použitím krmných kostek aplikovaných prostřednictvím online transakčního procesu, aby kostky fungovaly efektivně a efektivně.
  • Hvězdné schéma je tvořeno jednoduchou logikou a dotazy, které lze snadno extrahovat z transakčního procesu.
  • Nabízí zvýšený výkon pro reportovací aplikace.
  • Je nasazen pro kontrolu rychlé obnovy dat.
  • Filtrované a vybrané informace lze snadno použít v různých případech.

Výhody schématu sněhové vločky

  • Hvězdicové schéma se používá k vývoji výkonu dotazů kvůli menším požadavkům na diskové úložiště.
  • Nabízí větší škálovatelnost ve vztazích mezi komponentami a úrovněmi dimenzí.
  • Snadněji se udržuje.
  • Hvězdné schéma nabízí rychlé načítání dat.
  • Je to běžné a jednoduché datové schéma pro datové sklady.
  • Pomáhá zvyšovat kvalitu dat.
  • Strukturovaná data snižují problém integrity dat.
  Clean Up Google Music Odebere všechny karty návrhů z Google Music [Firefox]

Hvězda vs. Sněhová vločka: Omezení

Omezení hvězdného schématu

Má vysoký denormalizovaný a celistvý stav. Pokud uživatel neaktualizuje data, celý proces se zhroutí. Zabezpečení a ochrana jsou také omezené. Navíc hvězdné schéma není tak flexibilní jako analytický model. Nenabízí účinnou podporu různým vztahům.

Omezení schématu sněhové vločky

Hlavním omezením, na které narazíte u Snowflake, je další úsilí o údržbu kvůli rostoucímu počtu malých rozměrových stolů. Mnoho složitých dotazů ztěžuje nalezení požadovaných dat. Navíc doba realizace otázky je vysoká kvůli vyšším tabulkám. Tento model je také tuhý a vyžaduje vyšší náklady na údržbu.

Hvězda vs. Sněhová vločka: Rozdíly

Hvězda a sněhová vločka jsou typy vícerozměrných schémat, ale mají různé struktury a vlastnosti. První je jako hvězda a druhý připomíná sněhovou vločku, která definuje jejich jména.

Ve hvězdicovém schématu vytváří vztah mezi centrální tabulkou faktů a postranními tabulkami dimenzí pouze jediné spojení. Na druhou stranu ve schématu sněhové vločky je k propojení s tabulkami dimenzí potřeba více spojení.

Hvězdicové schéma se obecně používá, když máte v tabulce dimenzí menší počet řádků, zatímco schéma sněhové vločky se používá, když je tabulka dimenzí relativně velká.

Níže uvedený diagram odlišuje dva modely a jak jsou tabulky dimenzí a tabulka faktů propojeny v různých schématech.

ParametryStar SchemaSchemaSnowflake SpaceDiskSchemaStar schéma využívá více místa na disku.Schéma Snowflake využívá méně místa na disku.Redundance datMá vysokou redundanci dat.Má nízkou redundanci dat.NormalizaceTabulky dimenzí jsou denormalizované, což znamená opakování stejné hodnoty v tabulce.Tabulky dimenzí jsou plně normalizováno.Výkon dotazůProvedení dotazů trvá minimálně, což vede k lepšímu výkonu.Spuštění dotazu trvá déle než u hvězdicového schématu, takže je méně výkonné než u hvězdicového schématu.Složitost dotazuSložitost dotazu je nízká.Složitost dotazu je vyšší než hvězdicové schéma.ÚdržbaVzhledem k vysoké redundanci dat je údržba hvězdicového schématu trochu obtížná.Vzhledem k nízké redundanci dat je snadné udržovat a měnit schéma sněhové vločky.Integrita dat Integrita dat je vysoká, protože data jsou ukládána redundantně tam, kde je více kopie existují v tabulkách dimenzí. Integrita dat je nízká, protože zcela normalizuje tabulky dimenzí. Hierarchie Hierarchie pro tabulky dimenzí ve hvězdicovém schématu jsou uloženy v tabulce dimenzí.Hierarchie jsou rozděleny do samostatných tabulek dimenzí.DB designMá jednoduchý DB design.Má velmi složitý DB design.Fact TableTabulku faktů obklopuje více tabulek dimenzí. Tabulka faktů je obklopena tabulkami dimenzí, které jsou také obklopeny tabulkami poddimenzí. Nastavení schématuStar lze snadno navrhnout a nastavit, protože je reprezentují přímé vztahy. Na druhou stranu je nastavení schématu sněhových vloček trochu složité. Zpracování kostky Zpracování kostky je rychlejší. Kvůli složitému spojení je zpracování kostky trochu pomalé. Cizí klíče Má minimální počet cizích klíčů. Má maximální počet cizích klíčů.

Závěr

Schémata Hvězda i Sněhová vločka jsou užitečná v různých sektorech. Rozhodnutí, která z nich je lepší, tedy závisí na jejich požadavcích.

Schéma sněhové vločky je rozšířením hvězdného schématu, kde normalizuje tabulky rozměrů ve hvězdném schématu.

Hvězdicové schéma má jednoduchý design, spouští dotazy rychleji a nastavení je snadné. Na druhou stranu se schéma sněhové vločky snadněji udržuje, zabírá méně místa na disku a je méně náchylné k problémům s integritou dat.

Hvězdicové schéma by tedy mohlo být lepší volbou, pokud potřebujete jednoduchý design, méně cizích klíčů a rychlejší zpracování kostek. Pokud však potřebujete méně místa na disku, nízkou integritu dat a nenáročnou údržbu, může být vhodnější schéma sněhové vločky.

Můžete také prozkoumat některá nejlepší řešení grafové databáze.