Data jsou nový olej. A strojové učení je oheň. Kdo ovládá tyto dva, bude ovládat svět.
Ne, výše uvedené není nějaká pompézní fráze převzatá z dystopického románu.
Je to realita.
Nový světový řád je o shromažďování obrovského množství relevantních dat a jejich zpracování do použitelných poznatků – něco, co lidská rasa v historii nedokázala. Je to druh technologie, která zemi umožňuje dostat se před ostatní a nakonec ovládnout svět.
V důsledku toho to pokrokové národy světa berou velmi, velmi vážně.
Table of Contents
Lukrativní kariérní volba
Pomineme-li mezinárodní intriky, datová věda a strojové učení jsou horkou novinkou s neuvěřitelnou příležitostí. Poptávka je mimo žebříčky (mírně řečeno) a kolem není dostatek datových vědců. Ani ty průměrné.
Jako bychom najednou objevili mnoho nových obyvatelných planet a nebylo dost lidí, kam bychom je mohli přesunout. Mohl bych pokračovat dál a dál a znít jako porouchaná deska, ale myslím, že tato infografika to dělá mnohem lépe:
Zdroj: insidebigdata.com
Vidíme tedy, že platy začínají na 50 000 $ a více a pro manažery mohou přesáhnout 250 000 $.
A nejen to, průměrný člověk na této planetě bude generovat 1,7 MB dat za sekundu. To je více než 3 500 TB dat za celou dobu životnosti – více dat, než v současné době umíme zpracovat, natož použít k analýze. Říct, že budoucnost je jasná, by této nádherné nové pastvině uškodilo.
Jsou datová věda a strojové učení těžké?
Dobrá otázka!
Z mé zkušenosti je odpověď „ano“ i „ne“.
Umělá inteligence (a potažmo strojové učení) je nejtěžší věc, kterou můžete udělat, pokud máte sklon pustit se do výzkumu a posunout hranice. Za takovou práci by i Ph.D. v informatice a matematice nestačí. Ale pak, průměrný člověk nemá ani ambice, ani čas na takovou snahu.
Na druhém konci je to, co bych nazval Applied Data Science a Machine Learning.
To znamená, že vezmete existující nástroje, techniky a algoritmy a použijete je k řešení některých problémů v reálném světě. Tato část vyžaduje obětavost, postřeh a kreativní myšlení (a znalost některých jednoduchých matematických pojmů, které se rychle naučí), ale pokud jde o skutečné „technické“ znalosti, je mnohem shovívavější, než tomu, čemu říká práce softwarového inženýra.
Jinými slovy, není to bábovka, ale jít podle poměru odměny k úsilí je jednou z nejlepších investic.
Nyní, když jste utvrdili své odhodlání stát se datovým vědcem a inženýrem strojového učení, začněme zkoumat nejlepší možnosti, které existují.
Strojové učení (Google)
Málokdo si toho uvědomuje, ale Google má rozsáhlé, vysoce praktické a bezplatný kurz strojového učení. Podle společnosti je to součást jejich závazku vyvíjet technologie AI/ML a udržovat znalosti na veřejnosti.
Nejlepší na tomto kurzu je, že neexistují žádné předpoklady, ale připravte se na to, abyste mohli věnovat více času zkoumání konceptů statistiky sami.
Myslím, že to není potřeba, ale pokud máte nulové znalosti pokročilých statistik, vysvětlení v tomto kurzu vám nemusí stačit. Dalším úlovkem je, že tento kurz představuje strojové učení prostřednictvím TensorFlow, což je implementace ML vyvinutá společností Google. Google se tedy svým způsobem snaží propagovat svá API pro strojové učení, ale vzhledem k hodnotě nabízené tímto kurzem nevidím, jak by to měl být kámen úrazu.
Pokud něco, TensorFlow je jedním ze snadných způsobů, jak se dostat do ML a těší se zuřivé popularitě (srovnání rámců AI viz toto).
Data Science
Název Harvard vzbuzuje úctu, stejně jako tento kurz.
Za prvé: nejde o rychlý kurz pojďme se zašpinit, kde se po špičkách pohybujete kolem strojového učení tím, že napíšete úryvek sem nebo skript sem. Tento kurz je tvrdým křestem ohněm, který vyžaduje tvrdou práci a značnou investici času.
Kurz přichází s bezplatnými videy, kódem (hostovaným na GitHubu) a řešeními laboratorních cvičení, takže prakticky nejste ničím omezováni, pokud si to chcete vzít.
Ideální publikum?
Ty… nedělám si srandu.
Řekl bych, že pracující profesionálové se slušným matematickým vzděláním, i když je už matematika možná nebaví (nejnutnější jsou návyky vyvozování a dokazování). Ale ještě jednou, buďte prosím varováni: můžete si myslet, že jste dobří, ale tento kurz vám bude připadat jako snídaní ztvrdlých nehtů – cvičební problémy jsou natolik náročné, že vás donutí brečet, ale pak to může být přesně to, co hledám!
Strojové učení
Vejděte do baru plného datových vědců a zeptejte se, kdo je Andrew Ng, a dostanete výprask o svůj život.
V kruzích datové vědy a strojového učení dosáhl Andrew Ng božského postavení díky svému výjimečnému kurzu na Coursera — Strojové učení.
A pokud pochybujete o pověření Andrewa Nga, nechám toto mluvit samo za sebe:
Je to placený kurz, protože je součástí cenového plánu Coursera, ale finanční závazek a odhodlání nejsou jedinými předpoklady. Toto je dlouhý kurz, protože se Andrew ponoří hluboko do matematiky za všemi věcmi ML a rozebírá oblíbené algoritmy. Ale naštěstí je to úplný kurz a budete krok za krokem vedeni do nejtemnějších hlubin a přivedeni zpět.
Vřele doporučuji, hlavně proto, že chlubit se certifikátem o absolvování tohoto kurzu se dnes stalo samozřejmostí!
Aplikovaná datová věda
Specializace na Coursera se skládají ze série kurzů, jejichž cílem je převést vás od nuly až po zvládnutí konkrétního konceptu. Pokud hledáte kompletní, seriózní, ale přátelský kurz o datové vědě a strojovém učení s Pythonem, nemohu to doporučit specializace dost.
Na konci kurzu získáte certifikát.
DataCamp
DataCamp nabízí spoustu kurzů datové vědy, které také zahrnují několik dovedností a kariérních drah. Od manipulace s daty až po strojové učení získáte dovednosti datových vědců pro budování kariéry v Pythonu a R, které vám pomohou uspět v oblasti datové vědy.
S obsahem DataCampu o velikosti bajtů se můžete učit svým vlastním tempem. Tyto kurzy vám poskytnou praktické zkušenosti, díky nimž budete rozvíjet své dovednosti v oblasti datové vědy.
Můžete začít s bezplatnou verzí a zhodnotit kurz podle první kapitoly.
edX
Učte se od MITx, Harvardx, IBM, RICEx, UCSanDiegox a GTx na platforma edX.
Všechny mají komplexní učební plán, který vám pomůže získat dovednosti datových vědců. Tyto programy jsou nejvhodnější pro ty, kteří mají statistiku nebo informatiku.
Pokud nehledáte program, můžete zvolit ala-carte. Na edX najdete více než 200 kurzů souvisejících s datovou vědou, které pokrývají Python, R, Excel, pravděpodobnost, statistiku, strojové učení, vizualizaci dat a mnoho dalších.
Codecademy
Codecademy je další platforma, která je jedním z nejlepších systémů, který vám pomůže naučit se kódovat. Věří v „Learn by doing“ a na své platformě mají spoustu cvičných projektů a testů.
The kurz datové vědy nabízené Codecademy zahrnuje SQL, Python 3, NumPy, Pandas, Matplotlib, Scikit-learn a mnoho dalších knihoven.
Celá kariérní cesta obsahuje 26 kurzů, které jsou více než dost, aby vám pomohly stát se úspěšným datovým vědcem.
Tento datový kurz:
- Poskytuje vám hluboké znalosti datové vědy
- Poskytuje snadno sledovatelný plán
- Připraví vás na práci tím, že vám pomůže získat dostatek praktických zkušeností
Udemy
Udemy netřeba představovat.
Bootcamp Python pro datovou vědu a strojové učení on Udemy je jedním z nejoblíbenějších kurzů s hodnocením 4,6 s více než 85 000+ a absolvovalo ho více než 370 000 studentů po celém světě.
Níže jsou uvedena témata obsažená v tomto kurzu:
Níže jsou uvedeny vlastnosti/výsledky tohoto kurzu:
- 25 hodin videí na vyžádání
- Plný doživotní přístup
- 13 článků a pět zdrojů ke stažení
- Přístup na mobilu a televizi
- Certifikát o ukončení
- 30denní záruka vrácení peněz
Pokud tedy dáváte přednost kurzu s rozpočtem, tento by byl pro vás nejvhodnější.
AI Google
Měli byste zájem učit se strojové učení od odborníků na ML ve společnosti Google?
Pak se musíte podívat na kurzy AI Google.
Tato platforma má kurzy a obsah Machine Learning a Data Science pro studenty, softwarové inženýry, datové vědce a dokonce i výzkumníky. Tyto kurzy jsou bezplatné.
Začít, Nárazový kurz strojového učení na Google AI by měl být váš hlavní kurz. Jedná se o rychlý kurz s praktickým úvodem pomocí TensorFlow API. Níže jsou uvedeny podrobnosti o tomto kurzu:
Tato platforma má také specifické kurzy na důležitá témata strojového učení, jako je shlukování, systémy doporučení, testování a ladění ve strojovém učení, oddělení dat a inženýrství funkcí ve strojovém učení. V případě, že již znáte základy strojového učení, budou tyto kurzy přidanou hodnotou.
Udacity
Udacity je také velmi populární e-learningová platforma, která má nepřeberné množství kurzů o trendových technologiích. Má několik špičkových programů vytvořených a uznávaných špičkovými společnostmi po celém světě, jako jsou AT&T, AWS, Google, IBM.
Jeden z programů v Udacity je pro Data Science – School of Data Science. Tento program vám pomůže získat práci analytika dat, datového vědce, datového inženýra a obchodního analytika. Kurz Data Scientist v tomto programu je klíčový, který pokrývá koncepty strojového učení, hlubokého učení a softwarového inženýrství. Abyste se mohli rozhodnout pro tento kurz, musíte mít základní znalosti strojového učení.
V případě, že znáte programování v pythonu, ale jste novým strojovým učením, existuje další program na Udacity – Škola AI. Tento program má kurzy začínající od základů strojového učení.
Hluboké učení
Tento kurz je požehnáním a je to moje nejoblíbenější doporučení na tomto seznamu, pokud jste kodér.
Řekl bych to znovu: pokud jste kodér.
To proto, že tento kurz nestráví čas výukou základů programování. Popis kurzu to říká velmi jasně (důraz je originální):
Předpokládáme, že každý, kdo absolvuje tento kurz, má alespoň roční zkušenost s kódováním. Kurz používá jako výukový jazyk python, takže pokud ještě python neznáte, předpokládáme, že strávíte čas učením – pro zkušeného kodéra byste měli zjistit, že python je celkem snadný jazyk na učení.
Pokud tedy Python již znáte (pokud ne učit se zde), nebo se rychle zorientují, je to perfektní kurz pro pragmatiky, kteří chtějí budovat skutečné, použitelné systémy, aniž by se příliš starali o teoretické základy algoritmů.
Dokonce bych řekl, že je to pro netrpělivé dráteníky (jako jsem já!), kteří nenávidí obřady a monotónnost.
A oh, zmínil jsem se, že je 100% zdarma a má skvělou komunitu?!
Závěr
Fuj!
Byl to jeden těžce sestavitelný seznam. Ne proto, že by nebylo dost dobrých zdrojů, ale proto, že jich bylo příliš mnoho!
Machine Learning je doména, která doslova explodovala a řeší těžké problémy opravdu elegantně, a tak existují stovky kurzů online, bezplatných i placených, z nichž většina je opravdu, ale opravdu dobrá. Ale to může být také zdrojem zmatku, a proto jsem se to pokusil srazit na jedenáct pro různé typy studentů podle úrovně jejich zkušeností.
Doufám, že to pomohlo!