etechblog

[Explained] Jak se provádí datové modelování v Power BI

Jste v Power BI noví nebo se v ní chcete lépe seznámit? Měli byste začít s modelováním dat v Power BI a pak se propracovat přes dolování dat a nakonec extrahovat užitečné informace ze sestav Power BI.

Datové modelování je jádrem každého projektu analýzy dat. Zůstává pod skutečnými vizualizacemi dat a řídicími panely, které vidí široké publikum.

Stejně jako jakýkoli jiný nástroj pro analýzu dat, Power BI také potřebuje datové modelování v backendu pro integraci dat, transformaci dat, vytváření vztahů mezi různými tabulkami vstupní datové sady, přidávání výpočtů a tak dále.

Pokračujte ve čtení, abyste se dozvěděli vše, co potřebujete vědět o datovém modelování v Power BI, včetně jednoduchých pokynů krok za krokem, jak vytvořit datový model Power BI.

Co je datové modelování?

V datovém modelování vytvoříte zjednodušenou reprezentaci datových struktur, vztahů a atributů propojením základních bloků datových sad, jako jsou tabulky, řádky, sloupce atd.

Pomáhá při organizaci a porozumění dat pro efektivní ukládání, vyhledávání a analýzu. Backendový datový model pomáhá při navrhování databází, softwaru a systémů.

Datové modelování zahrnuje identifikaci entit, definování jejich vlastností a ukazování toho, jak se vzájemně propojují, aby se vytvořily vzory a užitečné poznatky. Je to klíčové pro analýzu dat, zajištění přesnosti dat a podporu rozhodovacích procesů.

Jak zásadní je analýza dat v Power BI

Datové modelování hraje klíčovou roli v nástrojích pro analýzu dat, jako je např Power BI. Tento nástroj business intelligence spoléhá na dobře strukturované datové modely k vytváření smysluplných vizualizací a přehledů.

Pomocí principů datového modelování můžete efektivně propojovat, transformovat a vizualizovat data z několika zdrojů v rámci velké datové sady. Datové modelování v Power BI vám také pomáhá zajistit, aby data prezentovaná v těchto analytických nástrojích byla přesná a relevantní

A konečně usnadňuje informované rozhodování a odemyká plný potenciál poznatků založených na datech. V podstatě také funguje jako základ, na kterém mohou výkonné nástroje pro analýzu dat, jako je Power BI, poskytovat cenné obchodní informace.

Typy datového modelování

#1. Koncepční datové modelování

Zaměřuje se na celkový obraz dat. Koncepční modelování tedy představuje data na vysoké úrovni bez zohlednění konkrétních databázových struktur nebo technických detailů. Tento koncept pomáhá sladit data s organizačními cíli a pomáhá zúčastněným stranám pochopit účel a význam dat.

#2. Fyzické datové modelování

Když modelujete svou datovou sadu na základě aspektu technické implementace pro ukládání a načítání, jedná se o fyzické modelování dat. Určuje struktury úložiště dat, jako jsou tabulky, indexy a omezení, které můžete použít v databázovém systému.

  Jak zjistit, kdo se dívá na Twitchi

#3. Logické datové modelování

Logické datové modelování překlenuje propast mezi koncepčním a fyzickým modelováním. Takové modelování slouží jako plán pro návrh databáze a usnadňuje komunikaci mezi obchodními partnery a technickými týmy při zachování integrity a konzistence dat.

Techniky datového modelování v Power BI

#1. Hvězdné schéma

Hvězdné schéma je velmi používaná technika modelování dat v Power BI. V tomto přístupu existuje centrální tabulka faktů, která obsahuje klíčové metriky a míry, obklopená tabulkami dimenzí, které poskytují datům kontext. Říká se tomu „hvězda“, protože tabulka faktů je uprostřed a je spojena s tabulkami dimenzí jako hroty hvězdy.

#2. Kardinalita

Mohutnost definuje vztah mezi tabulkami v Power BI. Určuje, kolik jedinečných hodnot v jedné tabulce odpovídá hodnotám v jiné tabulce. Možnosti mohutnosti zahrnují jedna k jedné, jedna k mnoha a mnoho k jedné. Výběr správné mohutnosti je zásadní pro přesné modelování dat.

#3. Směr křížového filtru

Způsob, jakým filtr aplikovaný na data v jedné propojené tabulce ovlivní data druhé tabulky, se nazývá směr křížového filtru. Existují dva typy směru křížového filtru, a to níže:

Singl

Jediný směr křížového filtru je možnost vztahu, kde filtry mohou proudit pouze jedním směrem, obvykle z tabulky dimenzí do tabulky faktů. Zajistí, že filtrování tabulky dimenzí ovlivní tabulku faktů, ale ne naopak.

Obousměrný

Obousměrný křížový filtr umožňuje filtrům proudit v obou směrech mezi tabulkou faktů a tabulkou rozměrů. V některých scénářích může být užitečný, ale měl by být používán opatrně, protože může vést k neočekávaným výsledkům, pokud není správně spravován.

#4. Schéma sněhové vločky

Kredit obrázku: Learn.Microsoft.Com

Schéma sněhové vločky je rozšířením hvězdného schématu, kde jsou tabulky dimenzí dále normalizovány do poddimenzí. To vytváří strukturovanější, ale složitější schéma. I když to může snížit redundanci dat, může to vyžadovat více úsilí při navigaci v Power BI.

#5. Vyhledávací tabulky

Vyhledávací tabulky jsou tabulky dimenzí, které obsahují referenční informace, jako jsou podrobnosti o produktu nebo geografická data. Používají se k obohacení dat v tabulkách faktů a poskytují další kontext pro analýzu.

#6. Datové tabulky

Tabulky dat jsou termín, který se někdy používá zaměnitelně s tabulkami faktů. Obsahují primární data, včetně mír a cizích klíčů, a slouží jako základ pro vytváření sestav a vizualizací Power BI.

Výhody datového modelování v Power BI

  • Datové modelování Power BI umožňuje propojit mnoho datových tabulek, abyste z nich mohli získávat data při analýze celé datové sady, vytváření sestav nebo vytváření řídicích panelů.
  • Dobře strukturované datové modely umožňují působivé a smysluplné vizualizace v Power BI.
  • Široké publikum může snadno interagovat s vizuální stránkou dat, pokud existuje základní datový model.
  • Optimalizované datové modely Power BI vám pomohou rychleji dotazovat data z velké databáze obsahující miliony řádků.
  • Pokud je v backendu strukturovaný datový model, můžete provést hloubkovou analýzu velké datové sady analýzou všech jejích tabulek.
  • Můžete také snadno propojit jeden datový model s druhým nebo odkazovat na datový model v jiné sestavě a propojit datové sady pro extrakci na vysoké úrovni.
  • Můžete ovládat a chránit citlivé části dat a ponechat veřejnou část dat otevřenou vytvořením datových modelů Power BI a jejich zabezpečením pomocí přístupu na základě rolí.
  • Pokud pracujete na datové sadě, která neustále roste v reálném čase shromažďováním dat z maloobchodních POS, aplikací a tržišť, musíte nejprve vytvořit datový model a teprve poté analyzovat celou datovou sadu, jak každý den roste.
  •   Jak používat příkaz dig na Linuxu

    Jak dělat datové modelování v Power BI

    Vytvoření datového modelu v Power BI je opravdu jednoduché. Zde jsou kroky, které musíte dodržet:

    Importujte svou datovou sadu do Power BI

    Nejprve musíte importovat své datové sady do Power BI. Můžete importovat tolik datových sad, kolik chcete, nebo importovat datovou sadu, která má mnoho datových objektů, jako jsou tabulky, sloupce, řádky atd.

    Power BI automaticky analyzuje importovanou datovou sadu nebo datové objekty a vytvoří primární datový model na základě názvů záhlaví sloupců nebo záhlaví tabulek.

    Chcete-li importovat datové sady, postupujte takto:

    • Otevřete desktopovou aplikaci Power BI.
    • Měl by zobrazovat pracovní prostor Power BI spolu s úvodní obrazovkou.
    • Klikněte na Získat data.
    • V dialogovém okně Získat data si můžete vybrat, jakou kategorii dat chcete importovat v levém navigačním panelu a zdroje nebo typy dat v pravém navigačním panelu.
    • Výchozí výběr typu zdroje dat je Vše.
    • Protože moje datová sada je v sešitu aplikace Excel, vyberu možnost Sešit aplikace Excel vpravo a kliknu na Připojit.

    • V dialogovém okně Otevřít přejděte na soubor aplikace Excel, který chcete importovat do počítače, a poklepáním na soubor jej importujte do Power BI.

    • Nyní byste měli být v dialogovém okně Navigátor.
    • Tam zaškrtněte datové objekty, které chcete importovat do sestavy Power BI.
    • Kliknutím na Načíst dokončete proces importu dat v Power BI.

    Vytvořte datový model Power BI

    Když v Navigátoru kliknete na tlačítko Načíst, Power BI začne analyzovat datovou sadu, vytvářet modely datových objektů, vytvářet datové modely a nakonec vás přenese na kartu Zobrazení sestavy.

    Pokud kliknete na nabídku Zobrazení tabulky na levém postranním panelu, měli byste získat tabulková zobrazení všech datových objektů, které jste právě importovali do Power BI.

    Power BI neuloží vaši dosavadní práci automaticky. Takže musíte kliknout na Soubor v nabídce pásu karet a poté na tlačítko Uložit na levém postranním panelu, abyste soubor uložili do umístění v počítači.

    Nyní se ponoříme hlouběji do procesu datového modelování v Power BI. Následuj tyto kroky:

    • Klikněte na kartu Zobrazení modelu na levém panelu pracovního prostoru Power BI.
    • Nyní byste měli vidět výchozí datový model vytvořený Power BI.
    • V aktuálním příkladu se jedná o hvězdicové schéma, protože uprostřed je tabulka faktů a tabulka faktů je obklopena tabulkami dimenzí.

    • Nyní Power BI nemusí vždy přesně vytvořit připojení datového modelu, která potřebujete.
    • V aktuálním příkladu se nepodařilo propojit tabulku faktů s dimenzí Tabulka24, přestože existují podobná záhlaví sloupců Geografie a Geo.
    • Nemohl to udělat, protože záhlaví sloupců se neshodují tak, jak jsou.
    • Dva spojují Table24 s hlavními daty tabulky faktů, jednoduše přetáhněte objekt Geo z Table24 na prvek Geografie tabulky faktů uprostřed.
      Co je a jak to opravit?

    A je to! Úspěšně jste vytvořili datový model v Power BI. Níže najděte význam různých objektů na liniích vztahu:

    • Hvězdička na okraji tabulky faktů a číslice 1 na okraji tabulky dimenzí představují spojení jedna k mnoha.
    • Šipka na spojovací čáře mezi dvěma tabulkami v Power BI označuje směr filtru. Když ostrá hrana šipky směřuje k tabulce faktů, jakýkoli filtr aplikovaný na tabulku dimenzí ovlivní tabulku faktů.

    • Když jsou dvě šipky, filtr ovlivní tabulku obou stran, tedy tabulky faktů a dimenzí.

    Vizualizujte svá data

    Zde je návod, jak nyní můžete vizualizovat svou datovou sadu, abyste získali užitečné statistiky:

    • Klikněte na kartu Zobrazení přehledu.
    • Vyberte libovolný graf ze sekce Vizualizace vpravo.

    • Vybral jsem skládaný sloupcový graf.
    • Rozbalte datové sady úplně vpravo na pracovním prostoru Power BI.

    • Přetáhněte položky do polí osy X a osy Y v editoru grafu.
    • Power BI automaticky vytvoří graf za vás.

    Případy použití datového modelování v Power BI

    Vytvářejte holistické zprávy

    Chcete-li vytvořit vícerozměrnou sestavu nebo řídicí panel na Power BI, musíte používat funkce datového modelu Power BI. Data v jedné tabulce nemusí dávat dostatečný smysl. Když však přinášíte data z různých datových sad a objektů, můžete data vizualizovat v lepším smyslu.

    Integrujte data

    Předpokládejme, že ve zdrojovém sešitu Excelu nebo v databázi SQL je mnoho datových sad nebo datových tabulek. Místo vytváření různých sestav Power BI je můžete všechny propojit do schématu hvězdy nebo sněhové vločky a vizualizovat je jako celek. Sjednocením všech datových objektů můžete zlepšit vyprávění datových příběhů.

    Čištění a transformace dat

    Zda je potřeba vyčistit a transformovat nezpracovanou datovou sadu, se ukáže až při pokusu o vytvoření datových modelů Power BI.

    Pokud například nástroj nedokáže propojit související datové sloupce nebo tabulky v datovém modelu, může dojít k neshodě v záhlaví sloupců. Takže víte, co opravit.

    Dalším příkladem může být více než jeden prvek v tabulkách. Předpokládejme, že v datové sadě jsou pouze 4 geografické oblasti, konkrétně USA, CA, UK a DE. Datový model však ukazuje něco navíc, což je Blank. Je to proto, že některé názvy geografie obsahují zbytečné mezery, a proto je Power BI klasifikuje do nového prvku geografie.

    Kontrola viditelnosti dat

    Pomocí karty Zobrazení modelu můžete omezit, kdo může co zobrazit ve vaší sestavě nebo řídicím panelu Power BI. Kliknutím na ikonu oka na každé datové kartě v pracovním prostoru datového modelu Power BI můžete tabulku skrýt nebo znovu zobrazit.

    Pokud je na datové kartě více než jeden sloupec, můžete také upravit viditelnost těchto sloupců.

    Manipulujte s vybranými datovými tabulkami

    Každá datová tabulka v rozhraní datového modelu Power BI obsahuje Další možnosti nebo ikonu se třemi tečkami. Zde můžete objevit následující aktivity, které můžete provádět na vybrané datové tabulce:

    • Nová míra nebo sloupec
    • Obnovit data
    • Řídit vztahy
    • Přírůstkové obnovení
    • Správa agregací
    • A mnoho dalších

    Závěr

    Takže to je vše o vytvoření a Power BI datový model pro vizualizaci velkých a distribuovaných datových sad v jedné logické sestavě nebo řídicím panelu.

    Doposud jste se dozvěděli o různých technikách modelování dat v Power BI. Také jste našli kroky k vytvoření datového modelu Power BI od začátku. Postupujte podle pokynů a vytvořte si svůj vlastní datový model během okamžiku.

    Jako další následují nejlepší kurzy datových analytiků, které nastartují vaši kariéru datové vědy nebo datového analytika.

    x