Egyedi megrendelés alapján vállaljuk adatelemző kurzusok tartását a következő témakörökben (üzleti és akadémiai ügyfeleknek egyaránt):
- Bevezetés az R használatába
- Adatfeldolgozás R-ben (data.table)
- Adatvizualizáció R-ben (ggplot2)
- Analitikai dashboard készítése R-ben (shiny)
A képzések tematikáját az ügyfél igényeinek megfelelően, az ügyféllel egyeztetve határozzuk meg. Az alábbi tematikák az egyes tanfolyamok jellemző menetrendjét tükrözik.
Ízelítő
Bevezetés az R használatába
Áttekintés
Az R olyan ingyenes, nyílt forráskódú programnyelv, amelyet kifejezetten statisztikai, adatfeldolgozási, -elemzési és -vizualizációs célra alkottak meg, és ezen a területen napjainkban is a legszélesebb eszköztárat kínálja valamennyi programnyelv és kereskedelmi statisztikai szoftver közül. Az 2x3 órás tanfolyam során az R statisztikai környezet általános ismertetésén túl rövid gyakorlati példákon keresztül és egy esettanulmány segítségével bemutatjuk, hogy a programnyelv hogyan használható a mindennapi munka során.
A képzés segédanyagát képezi egy részletes e-book, amelyhez a résztvevők hozzáférést kapnak, illetve a könyvet generáló forráskódot is szabadon letölthetik.
Kinek szól?
A képzést elsősorban azoknak ajánljuk, akik érdeklődnek az adatfeldolgozás, -elemzés és -vizualizáció iránt, és szeretnének kilépni a “dobozos” szoftverek korlátai közül. A kurzus a teljesen kezdő R felhasználók mellett azok számára is hasznos lehet, akik már rendelkeznek R-es tapasztalattal, de szeretnék stabilabb alapismeretekkel és gyakorlati tanácsokkal felvértezve folytatni az R tanulását.Tematika
Első alkalom (3x60 perc)
- Az R ökoszisztéma
- R, CRAN, RStudio IDE bemutatása
- Csomagok telepítése és betöltése
- Projektek készítése, strukturálása
- Hogyan segítsünk magunkon?
- R-súgó: csomagdokumentációk, tematikus keresések
- Hivatalos R levelező listák, internetes fórumok
- További források: ajánlott olvasmányok, dokumentációk
- R alapok
- Alapobjektumok (vektor, lista, data.frame…)
- Műveletek objektumokkal
- elemek elérése, módosítása
- egyszerű transzformációk
- Szintaktikai jellegzetességek
- Adatok beolvasása és mentése
- Munkakönyvtár, fájlműveletek
- Szöveg- és Excel- fájlok beolvasása
- Adatbázis-kapcsolatok
- Adatok kiírása
Második alkalom (esettanulmány, 3x60 perc)
- Adatfeldolgozás
- Leíró statisztikák
- A data.table csomag főbb jellegzetességei
- Példák a data.table alkalmazására:
- Adatok szűrése, összegzése, csoportonkénti elemzése
- Változók képzése, módosítása
- Táblák összekapcsolása
- Adatvizualizáció
- Egyszerű grafikonok készítése beépített R-függvényekkel
- A ggplot csomag főbb jellegzetességei
- Példák ggplot-ábrák készítésére
- Modellezés
- Prediktív modellezés lépései
- Példa: modellezés logisztikus regresszióval
Adatfeldolgozás R-ben (data.table)
Áttekintés
A tanfolyam célja, hogy az érdeklődő szakmai és üzleti felhasználóknak gyakorlati oktatás keretében bemutassa az adatelemzési, adatbányászati munka egyik legfontosabb lépésének, az adatok előfeldolgozásának rendkívül hatékony eszközét: az R statisztiai programnyelv data.table csomagját.
Legyen szó nyers adatok tisztításáról, transzformálásáról, egyesítéséről és aggregálásáról, vagy nagyméretű adattáblákon futtatott analitikákról, a data.table ismerete nagymértékben megkönnyíti az elemzési feladat elvégzését.
A képzés segédanyagát képezi egy-egy részletes e-book, amelyhez a résztvevők hozzáférést kapnak, illetve a könyvet generáló forráskódot is szabadon letölthetik.
Kinek szól?
A tanfolyamot azoknak ajánljuk, akik már rendelkeznek R-es alapismeretekkel (például elvégezték a bevezető R tanfolyamot), de még egyáltalán nem, vagy csak felületesen ismerik a data.table csomagot. A tanfolyam végére a résztvevők elsajátítják a data.table alapfilozófiáját, és számos példán keresztül begyakorolják az adattáblák szűrésének, transzformálásának, aggregálásának, egyesítésének mikéntjét.
Tematika
- Bevezetés
- Miért a data.table?
- A data.table alapfilozófiája
- Data.table objektum létrehozása
- Beolvasás szövegfájlból, illetve kiírás szövegfájlba (fread/fwrite)
- mátrix, data.frame, tibble stb. konvertálása data.table-é
- Adatfeldolgozási műveletek
- Sorok kiválasztása
- Oszlopok kiválasztása
- Aggregátumok számítása
- Csoportonkénti elemzések
- Kombinált műveletek
- Adattáblák összekapcsolása
- Új változók képzése
- Adattáblák transzformációja
- Sorok rendezése oszlopokba
- Oszlopok rendezése sorokba
- Pivot táblák készítése
Adatvizualizáció R-ben (ggplot2)
Áttekintés
A tanfolyam célja, hogy az adatvizualizáció iránt érdeklődő szakmai és üzleti felhasználóknak gyakorlati oktatás keretében bemutassa, hogyan készíthetők akár publikációs minőségű ábrák az R programnyelv legnépszerűbb adatvizualizációs csomagja, a ggplot2 segítségével. A tanfolyam végére a résztvevők elsajátítják a ggplot2 alapfilozófiáját (“grammar of graphics”), és számos példán keresztül begyakorolják a gyakorlatban előforduló adatelemzési feladatok jellemző ábratípusait.
A képzés segédanyagát képezi egy-egy részletes e-book, amelyhez a résztvevők hozzáférést kapnak, illetve a könyvet generáló forráskódot is szabadon letölthetik.
Kinek szól?
Az 1. szintű adatvizualizációs tanfolyamot azoknak ajánljuk, akik már rendelkeznek R-es alapismeretekkel (például elvégezték a bevezető R tanfolyamot), de még egyáltalán nem, vagy csak felületesen ismerik a ggplot2 csomagot.
Tematika
- Az adatvizualizáció szabályai
- A ggplot2 alapfilozófiája - a “grammar of graphics”
- Adatelőkészítés
- Főbb ábratípusok
- Mennyiségek
- oszlopdiagram
- pontdiagram
- Eloszlások
- hisztogram
- sűrűségfüggvény
- Q-Q ábra
- boxplot
- hőtérkép
- Arányok
- a hírhedt tortaábra
- Asszociáció
- pontfelhő
- korrelogram
- Idősorok
- vonaldiagram
- területdiagram
- Összetett ábrák
- alábrák csoportosító változók mentén
- layerek kombinálása
- annotációk
- Ábrák finomhangolása
- koordináta-rendszer
- színek
- skálák
- feliratok
- Ábrák fájlba írása
Haladó adatvizualizáció R-ben
Áttekintés
A tanfolyam célja annak bemutatása, hogyan használható az R összetett adatvizualizációs feladatok elvégzésére, illetve ezek automatizációjára. A kurzus résztvevői megismerkednek néhány modern, komplex ábratípussal, és az ezek készítését megkönnyítő ggplot2-kiegészítésekkel. Emellett sor kerül téri (térkép-alapú) ábrák és interaktív (böngészőben megjelenítendő) ábrák, továbbá önálló ábrázoló függvények készítésére.
A képzés segédanyagát képezi egy-egy részletes e-book, amelyhez a résztvevők hozzáférést kapnak, illetve a könyvet generáló forráskódot is szabadon letölthetik.
Kinek szól?
A haladó adatvizualizációs tanfolyam azoknak szól, akik már rendelkeznek R-es alapismeretekkel, és kiismerik magukat a ggplot2 csomagban.
Tematika
- Speciális ábratípusok
- mennyiségek: lollipop ábra
- arányok: mozaik ábra
- arányok változása: alluvial/sankey ábra
- asszociáció több változó között: pontfelhő-mátrix
- eloszlás változása: részben átfedő vonal-/területábrák
- térképes megjelenítés
- Ábrák statisztikai próbák eredményeivel annotálva
- Animált ábrák
- Több ábra együttes megjelenítése
- Interaktív ábrák (ggiraph, plotly)
- Ábrázoló függvények készítése, automatizáció
Dashboard készítése R-ben (Shiny)
Áttekintés
A tanfolyam célja, hogy adatelemzési területen dolgozó vagy az iránt érdeklődő szakmai és üzleti felhasználóknak gyakorlati oktatás keretében bemutassa, hogyan lehet az R statisztikai programnyelvben webfejlesztői ismeretek nélkül akár komplett interaktív analitikai dashboard-ot létrehozni a Shiny csomag segítségével. A tanfolyam végére a résztvevők elsajátítják a shiny működésének alapelveit, és készítenek egy működőképes analitikai webalkalmazást.
A képzés segédanyagát képezi egy részletes e-book és egy mintaalkalmazás, amelyhez a résztvevők hozzáférést kapnak, illetve a forráskódot is szabadon letölthetik.
Kinek szól?
A tanfolyam azoknak szól, akik már rendelkeznek R-es alapismeretekkel (például elvégezték a bevezető R tanfolyamot), de még egyáltalán nem, vagy csak felületesen ismerik a shiny csomagot.
Fontos: a kurzuson való részvétel nem igényel semmilyen web-programozói ismeretet.
Tematika
- Egy Shiny-alkalmazás főbb egységei
- A kliens-szerver architektúra
- Felhasználói felület
- Inputok és outputok
- Szerver-oldal
- A kimenetek renderelése az inputok alapján
- Reaktív kifejezések
- Az alkalmazás “publikálása”
- Saját dashboard építése
- Egyedi layout: a HTML-ről bővebben
- A reaktív kifejezésekről bővebben
- Perzisztens adatok, csomagfüggőségek, szkriptek
- Alternatívák
- htmlwidgets
- flexdashboard