Varga Dániel
Követelmények
Három számonkérés lesz:
Hadoop beadandó
Spark ZH
Adatelemzés (python) ZH
A három jegy átlaga megadja a gyakorlati jegyet.
Információk
A kurzus canvas oldalán megtalálható a Teams csoport kódja.
Gyakorlat közben a Teams csoportban kerülnek megosztásra kódok, linkek, segítségek.
Tematika
1. gyakorlat: Bevezetés, követelmények, hadoop környezet beállítása, tesztelése; WordCount feladat megoldása
2. gyakorlat: WordCount feladat befejezése (reducer, combiner elkészítése). Feladatok: grep, wordmean
3.gyakorlat: Hadoop feladatmegoldás: WordMean, MaxLength, Pí becslés; counter, cleanup, configuration
4. gyakorlat: MaxTemp feladat (saját writable osztály létrehozása), setup, cleanup, beadandó
5. gyakorlat: Spark környezet kialakítása, alacsony-szintű API
6. gyakorlat: Spark alacsony-szintű API folytatás
7. gyakorlat: Spark strukturált API
8. gyakorlat: Spark ZH
9. gyakorlat: Adatelemzés bevezetés: numpy, pandas, dataframe, matplotlib
10. gyakorlat: Adattisztítás, adatok átalakítása, modell készítése
11. gyakorlat: Osztályozási modellek: döntési van, SVM, Naive-Bayes; regresszió
12. gyakorlat: Klaszterezés
13. gyakorlat: Adatelemzés ZH
2-es csoport: december 14.
3-as csoport: december 14.
4-es csoport: december 15.