Oktatás

Egyedi megrendelés alapján vállaljuk adatelemző kurzusok tartását a következő témakörökben (üzleti és akadémiai ügyfeleknek egyaránt):

 • Bevezetés az R használatába
 • Adatfeldolgozás R-ben (data.table)
 • Adatvizualizáció R-ben (ggplot2)
 • Analitikai dashboard készítése R-ben (shiny)

A képzések tematikáját az ügyfél igényeinek megfelelően, az ügyféllel egyeztetve határozzuk meg. Az alábbi tematikák az egyes tanfolyamok jellemző menetrendjét tükrözik.

Ízelítő

Bevezetés az R használatába

Áttekintés

Az R olyan ingyenes, nyílt forráskódú programnyelv, amelyet kifejezetten statisztikai, adatfeldolgozási, -elemzési és -vizualizációs célra alkottak meg, és ezen a területen napjainkban is a legszélesebb eszköztárat kínálja valamennyi programnyelv és kereskedelmi statisztikai szoftver közül. Az 2x3 órás tanfolyam során az R statisztikai környezet általános ismertetésén túl rövid gyakorlati példákon keresztül és egy esettanulmány segítségével bemutatjuk, hogy a programnyelv hogyan használható a mindennapi munka során.

A képzés segédanyagát képezi egy részletes e-book, amelyhez a résztvevők hozzáférést kapnak, illetve a könyvet generáló forráskódot is szabadon letölthetik.

Kinek szól?

A képzést elsősorban azoknak ajánljuk, akik érdeklődnek az adatfeldolgozás, -elemzés és -vizualizáció iránt, és szeretnének kilépni a “dobozos” szoftverek korlátai közül. A kurzus a teljesen kezdő R felhasználók mellett azok számára is hasznos lehet, akik már rendelkeznek R-es tapasztalattal, de szeretnék stabilabb alapismeretekkel és gyakorlati tanácsokkal felvértezve folytatni az R tanulását.

Tematika

Első alkalom (3x60 perc)
 • Az R ökoszisztéma
  • R, CRAN, RStudio IDE bemutatása
  • Csomagok telepítése és betöltése
  • Projektek készítése, strukturálása
 • Hogyan segítsünk magunkon?
  • R-súgó: csomagdokumentációk, tematikus keresések
  • Hivatalos R levelező listák, internetes fórumok
  • További források: ajánlott olvasmányok, dokumentációk
 • R alapok
  • Alapobjektumok (vektor, lista, data.frame…)
  • Műveletek objektumokkal
   • elemek elérése, módosítása
   • egyszerű transzformációk
  • Szintaktikai jellegzetességek
 • Adatok beolvasása és mentése
  • Munkakönyvtár, fájlműveletek
  • Szöveg- és Excel- fájlok beolvasása
  • Adatbázis-kapcsolatok
  • Adatok kiírása
Második alkalom (esettanulmány, 3x60 perc)
 • Adatfeldolgozás
  • Leíró statisztikák
  • A data.table csomag főbb jellegzetességei
  • Példák a data.table alkalmazására:
   • Adatok szűrése, összegzése, csoportonkénti elemzése
   • Változók képzése, módosítása
   • Táblák összekapcsolása
 • Adatvizualizáció
  • Egyszerű grafikonok készítése beépített R-függvényekkel
  • A ggplot csomag főbb jellegzetességei
  • Példák ggplot-ábrák készítésére
 • Modellezés
  • Prediktív modellezés lépései
  • Példa: modellezés logisztikus regresszióval

Adatfeldolgozás R-ben (data.table)

Áttekintés

A tanfolyam célja, hogy az érdeklődő szakmai és üzleti felhasználóknak gyakorlati oktatás keretében bemutassa az adatelemzési, adatbányászati munka egyik legfontosabb lépésének, az adatok előfeldolgozásának rendkívül hatékony eszközét: az R statisztiai programnyelv data.table csomagját.

Legyen szó nyers adatok tisztításáról, transzformálásáról, egyesítéséről és aggregálásáról, vagy nagyméretű adattáblákon futtatott analitikákról, a data.table ismerete nagymértékben megkönnyíti az elemzési feladat elvégzését.

A képzés segédanyagát képezi egy-egy részletes e-book, amelyhez a résztvevők hozzáférést kapnak, illetve a könyvet generáló forráskódot is szabadon letölthetik.

Kinek szól?

A tanfolyamot azoknak ajánljuk, akik már rendelkeznek R-es alapismeretekkel (például elvégezték a bevezető R tanfolyamot), de még egyáltalán nem, vagy csak felületesen ismerik a data.table csomagot. A tanfolyam végére a résztvevők elsajátítják a data.table alapfilozófiáját, és számos példán keresztül begyakorolják az adattáblák szűrésének, transzformálásának, aggregálásának, egyesítésének mikéntjét.

Tematika

 • Bevezetés
  • Miért a data.table?
  • A data.table alapfilozófiája
 • Data.table objektum létrehozása
  • Beolvasás szövegfájlból, illetve kiírás szövegfájlba (fread/fwrite)
  • mátrix, data.frame, tibble stb. konvertálása data.table-é
 • Adatfeldolgozási műveletek
  • Sorok kiválasztása
  • Oszlopok kiválasztása
  • Aggregátumok számítása
  • Csoportonkénti elemzések
  • Kombinált műveletek
  • Adattáblák összekapcsolása
  • Új változók képzése
 • Adattáblák transzformációja
  • Sorok rendezése oszlopokba
  • Oszlopok rendezése sorokba
  • Pivot táblák készítése

Adatvizualizáció R-ben (ggplot2)

Áttekintés

A tanfolyam célja, hogy az adatvizualizáció iránt érdeklődő szakmai és üzleti felhasználóknak gyakorlati oktatás keretében bemutassa, hogyan készíthetők akár publikációs minőségű ábrák az R programnyelv legnépszerűbb adatvizualizációs csomagja, a ggplot2 segítségével. A tanfolyam végére a résztvevők elsajátítják a ggplot2 alapfilozófiáját (“grammar of graphics”), és számos példán keresztül begyakorolják a gyakorlatban előforduló adatelemzési feladatok jellemző ábratípusait.

A képzés segédanyagát képezi egy-egy részletes e-book, amelyhez a résztvevők hozzáférést kapnak, illetve a könyvet generáló forráskódot is szabadon letölthetik.

Kinek szól?

Az 1. szintű adatvizualizációs tanfolyamot azoknak ajánljuk, akik már rendelkeznek R-es alapismeretekkel (például elvégezték a bevezető R tanfolyamot), de még egyáltalán nem, vagy csak felületesen ismerik a ggplot2 csomagot.

Tematika

 • Az adatvizualizáció szabályai
 • A ggplot2 alapfilozófiája - a “grammar of graphics”
 • Adatelőkészítés
 • Főbb ábratípusok
  • Mennyiségek
   • oszlopdiagram
   • pontdiagram
  • Eloszlások
   • hisztogram
   • sűrűségfüggvény
   • Q-Q ábra
   • boxplot
   • hőtérkép
  • Arányok
   • a hírhedt tortaábra
  • Asszociáció
   • pontfelhő
   • korrelogram
  • Idősorok
   • vonaldiagram
   • területdiagram
 • Összetett ábrák
  • alábrák csoportosító változók mentén
  • layerek kombinálása
  • annotációk
 • Ábrák finomhangolása
  • koordináta-rendszer
  • színek
  • skálák
  • feliratok
 • Ábrák fájlba írása

Haladó adatvizualizáció R-ben

Áttekintés

A tanfolyam célja annak bemutatása, hogyan használható az R összetett adatvizualizációs feladatok elvégzésére, illetve ezek automatizációjára. A kurzus résztvevői megismerkednek néhány modern, komplex ábratípussal, és az ezek készítését megkönnyítő ggplot2-kiegészítésekkel. Emellett sor kerül téri (térkép-alapú) ábrák és interaktív (böngészőben megjelenítendő) ábrák, továbbá önálló ábrázoló függvények készítésére.

A képzés segédanyagát képezi egy-egy részletes e-book, amelyhez a résztvevők hozzáférést kapnak, illetve a könyvet generáló forráskódot is szabadon letölthetik.

Kinek szól?

A haladó adatvizualizációs tanfolyam azoknak szól, akik már rendelkeznek R-es alapismeretekkel, és kiismerik magukat a ggplot2 csomagban.

Tematika

 • Speciális ábratípusok
  • mennyiségek: lollipop ábra
  • arányok: mozaik ábra
  • arányok változása: alluvial/sankey ábra
  • asszociáció több változó között: pontfelhő-mátrix
  • eloszlás változása: részben átfedő vonal-/területábrák
  • térképes megjelenítés
 • Ábrák statisztikai próbák eredményeivel annotálva
 • Animált ábrák
 • Több ábra együttes megjelenítése
 • Interaktív ábrák (ggiraph, plotly)
 • Ábrázoló függvények készítése, automatizáció

Dashboard készítése R-ben (Shiny)

Áttekintés

A tanfolyam célja, hogy adatelemzési területen dolgozó vagy az iránt érdeklődő szakmai és üzleti felhasználóknak gyakorlati oktatás keretében bemutassa, hogyan lehet az R statisztikai programnyelvben webfejlesztői ismeretek nélkül akár komplett interaktív analitikai dashboard-ot létrehozni a Shiny csomag segítségével. A tanfolyam végére a résztvevők elsajátítják a shiny működésének alapelveit, és készítenek egy működőképes analitikai webalkalmazást.

A képzés segédanyagát képezi egy részletes e-book és egy mintaalkalmazás, amelyhez a résztvevők hozzáférést kapnak, illetve a forráskódot is szabadon letölthetik.

Kinek szól?

A tanfolyam azoknak szól, akik már rendelkeznek R-es alapismeretekkel (például elvégezték a bevezető R tanfolyamot), de még egyáltalán nem, vagy csak felületesen ismerik a shiny csomagot.

Fontos: a kurzuson való részvétel nem igényel semmilyen web-programozói ismeretet.

Tematika

 • Egy Shiny-alkalmazás főbb egységei
  • A kliens-szerver architektúra
  • Felhasználói felület
   • Inputok és outputok
  • Szerver-oldal
   • A kimenetek renderelése az inputok alapján
   • Reaktív kifejezések
  • Az alkalmazás “publikálása”
 • Saját dashboard építése
  • Egyedi layout: a HTML-ről bővebben
  • A reaktív kifejezésekről bővebben
  • Perzisztens adatok, csomagfüggőségek, szkriptek
 • Alternatívák
  • htmlwidgets
  • flexdashboard
Go to top