Oktatás

Egyedi megrendelés alapján vállaljuk adatelemző kurzusok tartását a következő témakörökben (üzleti és akadémiai ügyfeleknek egyaránt):

  • Bevezetés az R használatába
  • Adatfeldolgozás R-ben (data.table)
  • Adatvizualizáció R-ben (ggplot2)
  • Analitikai dashboard készítése R-ben (shiny)

A képzések tematikáját az ügyfél igényeinek megfelelően, az ügyféllel egyeztetve határozzuk meg. Az alábbi tematikák az egyes tanfolyamok jellemző menetrendjét tükrözik.

Ízelítő

Bevezetés az R használatába

Áttekintés

Az R olyan ingyenes, nyílt forráskódú programnyelv, amelyet kifejezetten statisztikai, adatfeldolgozási, -elemzési és -vizualizációs célra alkottak meg, és ezen a területen napjainkban is a legszélesebb eszköztárat kínálja valamennyi programnyelv és kereskedelmi statisztikai szoftver közül. Az 2x3 órás tanfolyam során az R statisztikai környezet általános ismertetésén túl rövid gyakorlati példákon keresztül és egy esettanulmány segítségével bemutatjuk, hogy a programnyelv hogyan használható a mindennapi munka során.

A képzés segédanyagát képezi egy részletes e-book, amelyhez a résztvevők hozzáférést kapnak, illetve a könyvet generáló forráskódot is szabadon letölthetik.

Kinek szól?

A képzést elsősorban azoknak ajánljuk, akik érdeklődnek az adatfeldolgozás, -elemzés és -vizualizáció iránt, és szeretnének kilépni a “dobozos” szoftverek korlátai közül. A kurzus a teljesen kezdő R felhasználók mellett azok számára is hasznos lehet, akik már rendelkeznek R-es tapasztalattal, de szeretnék stabilabb alapismeretekkel és gyakorlati tanácsokkal felvértezve folytatni az R tanulását.

Tematika

Első alkalom (3x60 perc)
  • Az R ökoszisztéma
    • R, CRAN, RStudio IDE bemutatása
    • Csomagok telepítése és betöltése
    • Projektek készítése, strukturálása
  • Hogyan segítsünk magunkon?
    • R-súgó: csomagdokumentációk, tematikus keresések
    • Hivatalos R levelező listák, internetes fórumok
    • További források: ajánlott olvasmányok, dokumentációk
  • R alapok
    • Alapobjektumok (vektor, lista, data.frame…)
    • Műveletek objektumokkal
      • elemek elérése, módosítása
      • egyszerű transzformációk
    • Szintaktikai jellegzetességek
  • Adatok beolvasása és mentése
    • Munkakönyvtár, fájlműveletek
    • Szöveg- és Excel- fájlok beolvasása
    • Adatbázis-kapcsolatok
    • Adatok kiírása
Második alkalom (esettanulmány, 3x60 perc)
  • Adatfeldolgozás
    • Leíró statisztikák
    • A data.table csomag főbb jellegzetességei
    • Példák a data.table alkalmazására:
      • Adatok szűrése, összegzése, csoportonkénti elemzése
      • Változók képzése, módosítása
      • Táblák összekapcsolása
  • Adatvizualizáció
    • Egyszerű grafikonok készítése beépített R-függvényekkel
    • A ggplot csomag főbb jellegzetességei
    • Példák ggplot-ábrák készítésére
  • Modellezés
    • Prediktív modellezés lépései
    • Példa: modellezés logisztikus regresszióval

Adatfeldolgozás R-ben (data.table)

Áttekintés

A tanfolyam célja, hogy az érdeklődő szakmai és üzleti felhasználóknak gyakorlati oktatás keretében bemutassa az adatelemzési, adatbányászati munka egyik legfontosabb lépésének, az adatok előfeldolgozásának rendkívül hatékony eszközét: az R statisztiai programnyelv data.table csomagját.

Legyen szó nyers adatok tisztításáról, transzformálásáról, egyesítéséről és aggregálásáról, vagy nagyméretű adattáblákon futtatott analitikákról, a data.table ismerete nagymértékben megkönnyíti az elemzési feladat elvégzését.

A képzés segédanyagát képezi egy-egy részletes e-book, amelyhez a résztvevők hozzáférést kapnak, illetve a könyvet generáló forráskódot is szabadon letölthetik.

Kinek szól?

A tanfolyamot azoknak ajánljuk, akik már rendelkeznek R-es alapismeretekkel (például elvégezték a bevezető R tanfolyamot), de még egyáltalán nem, vagy csak felületesen ismerik a data.table csomagot. A tanfolyam végére a résztvevők elsajátítják a data.table alapfilozófiáját, és számos példán keresztül begyakorolják az adattáblák szűrésének, transzformálásának, aggregálásának, egyesítésének mikéntjét.

Tematika

  • Bevezetés
    • Miért a data.table?
    • A data.table alapfilozófiája
  • Data.table objektum létrehozása
    • Beolvasás szövegfájlból, illetve kiírás szövegfájlba (fread/fwrite)
    • mátrix, data.frame, tibble stb. konvertálása data.table-é
  • Adatfeldolgozási műveletek
    • Sorok kiválasztása
    • Oszlopok kiválasztása
    • Aggregátumok számítása
    • Csoportonkénti elemzések
    • Kombinált műveletek
    • Adattáblák összekapcsolása
    • Új változók képzése
  • Adattáblák transzformációja
    • Sorok rendezése oszlopokba
    • Oszlopok rendezése sorokba
    • Pivot táblák készítése

Adatvizualizáció R-ben (ggplot2)

Áttekintés

A tanfolyam célja, hogy az adatvizualizáció iránt érdeklődő szakmai és üzleti felhasználóknak gyakorlati oktatás keretében bemutassa, hogyan készíthetők akár publikációs minőségű ábrák az R programnyelv legnépszerűbb adatvizualizációs csomagja, a ggplot2 segítségével. A tanfolyam végére a résztvevők elsajátítják a ggplot2 alapfilozófiáját (“grammar of graphics”), és számos példán keresztül begyakorolják a gyakorlatban előforduló adatelemzési feladatok jellemző ábratípusait.

A képzés segédanyagát képezi egy-egy részletes e-book, amelyhez a résztvevők hozzáférést kapnak, illetve a könyvet generáló forráskódot is szabadon letölthetik.

Kinek szól?

Az 1. szintű adatvizualizációs tanfolyamot azoknak ajánljuk, akik már rendelkeznek R-es alapismeretekkel (például elvégezték a bevezető R tanfolyamot), de még egyáltalán nem, vagy csak felületesen ismerik a ggplot2 csomagot.

Tematika

  • Az adatvizualizáció szabályai
  • A ggplot2 alapfilozófiája - a “grammar of graphics”
  • Adatelőkészítés
  • Főbb ábratípusok
    • Mennyiségek
      • oszlopdiagram
      • pontdiagram
    • Eloszlások
      • hisztogram
      • sűrűségfüggvény
      • Q-Q ábra
      • boxplot
      • hőtérkép
    • Arányok
      • a hírhedt tortaábra
    • Asszociáció
      • pontfelhő
      • korrelogram
    • Idősorok
      • vonaldiagram
      • területdiagram
  • Összetett ábrák
    • alábrák csoportosító változók mentén
    • layerek kombinálása
    • annotációk
  • Ábrák finomhangolása
    • koordináta-rendszer
    • színek
    • skálák
    • feliratok
  • Ábrák fájlba írása

Haladó adatvizualizáció R-ben

Áttekintés

A tanfolyam célja annak bemutatása, hogyan használható az R összetett adatvizualizációs feladatok elvégzésére, illetve ezek automatizációjára. A kurzus résztvevői megismerkednek néhány modern, komplex ábratípussal, és az ezek készítését megkönnyítő ggplot2-kiegészítésekkel. Emellett sor kerül téri (térkép-alapú) ábrák és interaktív (böngészőben megjelenítendő) ábrák, továbbá önálló ábrázoló függvények készítésére.

A képzés segédanyagát képezi egy-egy részletes e-book, amelyhez a résztvevők hozzáférést kapnak, illetve a könyvet generáló forráskódot is szabadon letölthetik.

Kinek szól?

A haladó adatvizualizációs tanfolyam azoknak szól, akik már rendelkeznek R-es alapismeretekkel, és kiismerik magukat a ggplot2 csomagban.

Tematika

  • Speciális ábratípusok
    • mennyiségek: lollipop ábra
    • arányok: mozaik ábra
    • arányok változása: alluvial/sankey ábra
    • asszociáció több változó között: pontfelhő-mátrix
    • eloszlás változása: részben átfedő vonal-/területábrák
    • térképes megjelenítés
  • Ábrák statisztikai próbák eredményeivel annotálva
  • Animált ábrák
  • Több ábra együttes megjelenítése
  • Interaktív ábrák (ggiraph, plotly)
  • Ábrázoló függvények készítése, automatizáció

Dashboard készítése R-ben (Shiny)

Áttekintés

A tanfolyam célja, hogy adatelemzési területen dolgozó vagy az iránt érdeklődő szakmai és üzleti felhasználóknak gyakorlati oktatás keretében bemutassa, hogyan lehet az R statisztikai programnyelvben webfejlesztői ismeretek nélkül akár komplett interaktív analitikai dashboard-ot létrehozni a Shiny csomag segítségével. A tanfolyam végére a résztvevők elsajátítják a shiny működésének alapelveit, és készítenek egy működőképes analitikai webalkalmazást.

A képzés segédanyagát képezi egy részletes e-book és egy mintaalkalmazás, amelyhez a résztvevők hozzáférést kapnak, illetve a forráskódot is szabadon letölthetik.

Kinek szól?

A tanfolyam azoknak szól, akik már rendelkeznek R-es alapismeretekkel (például elvégezték a bevezető R tanfolyamot), de még egyáltalán nem, vagy csak felületesen ismerik a shiny csomagot.

Fontos: a kurzuson való részvétel nem igényel semmilyen web-programozói ismeretet.

Tematika

  • Egy Shiny-alkalmazás főbb egységei
    • A kliens-szerver architektúra
    • Felhasználói felület
      • Inputok és outputok
    • Szerver-oldal
      • A kimenetek renderelése az inputok alapján
      • Reaktív kifejezések
    • Az alkalmazás “publikálása”
  • Saját dashboard építése
    • Egyedi layout: a HTML-ről bővebben
    • A reaktív kifejezésekről bővebben
    • Perzisztens adatok, csomagfüggőségek, szkriptek
  • Alternatívák
    • htmlwidgets
    • flexdashboard
Go to top