2022-09-03 02:34 Doba čtení: 16 min

11 nejlepších zdrojů pro datovou vědu a strojové učení

Data představují nový druh paliva a strojové učení je motorem. Ti, kdo zvládnou obojí, budou mít klíč k budoucnosti.

Ne, nejedná se o frázi z nějaké dystopické knihy.

Toto je realita dneška.

Nový světový řád stojí na základech shromažďování enormního množství dat a jejich přetváření v užitečné poznatky. Je to něco, čeho lidstvo dříve nebylo schopno. Tato technologie umožňuje některým národům předběhnout ostatní a potenciálně získat dominantní postavení na světě.

Proto vyspělé státy k této oblasti přistupují s maximální vážností.

Výnosná kariérní cesta

Kromě geopolitických aspektů je datová věda a strojové učení oborem s obrovským potenciálem. Poptávka po odbornících v této oblasti raketově roste a zdaleka není dostatek specialistů. Platí to i o průměrných odbornících.

Je to, jako bychom objevili mnoho nových planet vhodných k obývání, ale neměli dostatek lidí, kteří by se tam mohli přestěhovat. Mohl bych to opakovat pořád dokola, ale myslím, že následující infografika to ilustruje lépe:

Zdroj: insidebigdata.com

Vidíme, že nástupní platy se pohybují od 50 000 dolarů výše, přičemž manažeři mohou vydělávat i přes 250 000 dolarů.

A nejen to, průměrný člověk vygeneruje za jednu sekundu 1,7 MB dat. To je za celý život přes 3 500 TB dat – více, než kolik jsme schopni v současnosti zpracovat, natož analyzovat. Říci, že budoucnost je slibná, by bylo podhodnocení potenciálu tohoto nového oboru.

Je datová věda a strojové učení náročná?

To je skvělá otázka!

Z mého pohledu je odpověď „ano“ i „ne“.

Umělá inteligence, včetně strojového učení, je nejnáročnější obor, pokud se chcete věnovat výzkumu a posouvat hranice. Pro takovou práci by nestačilo ani PhD. v oboru informatiky a matematiky. Avšak většina lidí nemá ani ambice, ani čas se tímto směrem ubírat.

Na druhé straně stojí aplikace datové vědy a strojového učení.

Znamená to, že berete existující nástroje, postupy a algoritmy a používáte je k řešení problémů v reálném světě. Tato oblast vyžaduje odhodlání, vnímavost a kreativní myšlení. Je také dobré znát základy matematických pojmů, ale to se lze rychle naučit. Co se týče technických znalostí, je tato oblast méně náročná než práce softwarového inženýra.

Jinými slovy, není to hračka, ale poměr mezi námahou a odměnou je velmi výhodný.

Nyní, když jste se rozhodli stát datovým vědcem a odborníkem na strojové učení, pojďme se podívat na nejlepší dostupné možnosti.

Strojové učení (Google)

Mnoho lidí neví, že Google nabízí rozsáhlý, velmi praktický a bezplatný kurz strojového učení. Společnost to prezentuje jako součást svého závazku rozvíjet technologie AI/ML a sdílet znalosti s veřejností.

Nejlepší na tomto kurzu je, že nevyžaduje žádné vstupní znalosti, nicméně je potřeba počítat s tím, že si budete muset sami nastudovat některé statistické koncepty.

I když to není nezbytně nutné, pokud nemáte žádné znalosti pokročilé statistiky, vysvětlení v tomto kurzu vám nemusí stačit. Dalším specifikem je, že tento kurz představuje strojové učení prostřednictvím TensorFlow, což je implementace ML od Googlu. Google se tak snaží propagovat své API pro strojové učení. Avšak s ohledem na hodnotu, kterou tento kurz nabízí, to nepovažuji za problém.

TensorFlow je jeden z nejjednodušších způsobů, jak se dostat do ML a těší se obrovské popularitě.

Data Science

Jméno Harvard vzbuzuje respekt a stejně je tomu i u tohoto kurzu.

Nejedná se o rychlokurz, kde si letmo vyzkoušíte strojové učení napsáním několika skriptů. Tento kurz je tvrdou zkouškou, která vyžaduje hodně práce a investici času.

Kurz je dostupný zdarma včetně videí, kódu (na GitHubu) a řešení cvičení. Takže nic vás neomezuje, pokud se rozhodnete ho absolvovat.

Kdo je cílová skupina?

Vy... nemám žertuji.

Řekl bych, že je vhodný pro pracující profesionály s dobrým matematickým vzděláním, i když je matematika třeba už moc nebaví (důležitá je schopnost logického uvažování). Buďte ale varováni: můžete si myslet, že jste dobří, ale tento kurz bude těžkou zkouškou - cvičení jsou náročná až k slzám, ale to je možná přesně to, co hledáte!

Strojové učení

Vejděte do baru plného datových vědců a zeptejte se, kdo je Andrew Ng. Dostane se vám nadšené reakce.

V kruzích datové vědy a strojového učení dosáhl Andrew Ng téměř božského postavení díky svému vynikajícímu kurzu na Coursera – Strojové učení.

Pokud máte pochybnosti o kvalifikaci Andrewa Nga, dovolte mi to nechat na následujícím:

Jedná se o placený kurz, protože je součástí cenového plánu Coursera. Avšak finanční investice není jediná podmínka. Je to dlouhý kurz, kde se Andrew noří hluboko do matematiky za ML a rozebírá oblíbené algoritmy. Naštěstí je to komplexní kurz a provedete vás krok za krokem do všech hlubin a pak zpět.

Vřele doporučuji, už jen proto, že certifikát o absolvování tohoto kurzu je dnes samozřejmostí!

Aplikovaná datová věda

Specializace na Coursera se skládají z několika kurzů, které vás provedou od naprostých začátků až ke zvládnutí konkrétních konceptů. Pokud hledáte kompletní a seriózní, ale zároveň přístupný kurz o datové vědě a strojovém učení s Pythonem, pak specializaci mohu jen doporučit.

Na konci kurzu obdržíte certifikát.

DataCamp

DataCamp nabízí mnoho kurzů datové vědy, které zahrnují různé dovednosti a kariérní cesty. Od zpracování dat až po strojové učení získáte potřebné dovednosti pro vybudování kariéry v Pythonu a R. Pomohou vám uspět v oboru datové vědy.

Obsah DataCampu je rozdělen do menších částí, takže se můžete učit svým vlastním tempem. Kurzy poskytují praktické zkušenosti, které vám pomohou rozvíjet vaše dovednosti v oblasti datové vědy.

Můžete začít s bezplatnou verzí a zhodnotit kurz po první kapitole.

edX

Učte se od MITx, Harvardx, IBM, RICEx, UCSanDiegox a GTx na platformě edX.

Všechny nabízejí komplexní kurzy, které vám pomohou získat dovednosti v oblasti datové vědy. Tyto programy jsou nejvhodnější pro ty, kteří mají základy statistiky nebo informatiky.

Pokud nehledáte celý program, můžete si vybrat kurzy jednotlivě. Na edX najdete více než 200 kurzů souvisejících s datovou vědou, které pokrývají Python, R, Excel, pravděpodobnost, statistiku, strojové učení, vizualizaci dat a mnoho dalšího.

Codecademy

Codecademy je další platforma, která patří mezi nejlepší pro výuku kódování. Věří v "učení se praxí" a na své platformě mají spoustu praktických projektů a testů.

Kurz datové vědy od Codecademy zahrnuje SQL, Python 3, NumPy, Pandas, Matplotlib, Scikit-learn a mnoho dalších knihoven.

Celá kariérní cesta zahrnuje 26 kurzů, které vám více než postačí pro úspěšnou kariéru datového vědce.

Tento datový kurz:

  • Poskytuje hluboké znalosti datové vědy
  • Nabízí snadno sledovatelný plán
  • Připraví vás na práci tím, že vám poskytne dostatek praktických zkušeností

Udemy

Udemy není potřeba představovat.

Bootcamp Python pro datovou vědu a strojové učení na Udemy patří mezi nejoblíbenější kurzy s hodnocením 4,6. Absolvovalo ho více než 370 000 studentů z celého světa.

Níže jsou uvedena témata, která kurz pokrývá:

Níže jsou uvedeny charakteristiky/výstupy tohoto kurzu:

  • 25 hodin video lekcí na vyžádání
  • Neomezený přístup
  • 13 článků a pět zdrojů ke stažení
  • Přístup na mobilu a TV
  • Certifikát o dokončení kurzu
  • 30denní garance vrácení peněz

Pokud preferujete cenově dostupný kurz, tento bude pro vás vhodný.

AI Google

Měli byste zájem učit se strojové učení od odborníků z Googlu?

Pak se musíte podívat na kurzy AI Google.

Tato platforma nabízí kurzy a obsah o strojovém učení a datové vědě pro studenty, softwarové inženýry, datové vědce i výzkumníky. Tyto kurzy jsou zdarma.

Pro začátek by měl být váš hlavní kurz Rychlokurz strojového učení na Google AI. Jedná se o rychlý kurz s praktickým úvodem pomocí TensorFlow API. Níže jsou uvedeny podrobnosti o tomto kurzu:

Tato platforma také nabízí specifické kurzy na důležitá témata strojového učení, jako je shlukování, systémy doporučení, testování a ladění ve strojovém učení, příprava dat a funkční inženýrství ve strojovém učení. V případě, že již máte základy strojového učení, tyto kurzy vám přinesou přidanou hodnotu.

Udacity

Udacity je další populární e-learningová platforma, která nabízí mnoho kurzů o trendových technologiích. Nabízí špičkové programy vytvořené a uznávané předními společnostmi po celém světě jako jsou AT&T, AWS, Google, IBM.

Jeden z programů na Udacity je Data Science - Škola datové vědy. Tento program vám pomůže získat práci jako datový analytik, datový vědec, datový inženýr nebo obchodní analytik. Klíčový je kurz Data Scientist, který pokrývá koncepty strojového učení, hlubokého učení a softwarového inženýrství. Pro absolvování tohoto kurzu je potřeba mít základní znalosti strojového učení.

Pokud znáte programování v Pythonu, ale ve strojovém učení jste nováčci, pak je na Udacity k dispozici Škola AI. Tento program má kurzy začínající od úplných základů strojového učení.

Hluboké učení

Tento kurz je výjimečný a je mým nejoblíbenějším doporučením, pokud jste programátor.

Zopakuji to znovu: pokud jste programátor.

Je to proto, že tento kurz se nezabývá výukou základů programování. V popisu kurzu to je jasně uvedeno:

Předpokládáme, že každý, kdo tento kurz absolvuje, má alespoň roční zkušenosti s programováním. Jako vyučovací jazyk je použit Python, takže pokud Python ještě neznáte, předpokládáme, že se mu budete věnovat. Pro zkušené programátory by neměl být Python obtížný jazyk.

Pokud tedy již Python znáte (pokud ne, můžete se ho naučit zde), nebo se rychle zorientujete, je to ideální kurz pro pragmatiky, kteří chtějí vytvářet skutečné a použitelné systémy, aniž by se příliš starali o teoretické základy algoritmů.

Řekl bych, že je ideální pro ty, kteří nemají trpělivost, jako já, a nemají rádi zbytečné obřady a monotónnost.

A ještě jedna věc, zmínil jsem se, že je 100% zdarma a má skvělou komunitu?!

Závěr

Uf!

Sestavit tento seznam bylo docela náročné. Ne proto, že by nebylo dost dobrých zdrojů, ale spíše proto, že jich bylo příliš mnoho!

Strojové učení je oblast, která doslova explodovala a elegantně řeší složité problémy. Proto existují stovky online kurzů, jak bezplatných, tak placených, z nichž většina je opravdu dobrá. To ale může být také matoucí. Proto jsem se pokusil vybrat jedenáct zdrojů pro různé typy studentů, a to dle jejich úrovně zkušeností.

Doufám, že vám to pomůže!

Tomáš Dvořák
Autor
Czechia

Píše o bezpečnosti, webu a chytrých službách s důrazem na srozumitelnost.

Předchozí článek
Jak začít se strojovým učením?
Další článek
10 platforem AI pro vytvoření vaší moderní aplikace