Kurs: Predstavljanje i analiza podataka

Uvodna sekcija (tematski format)

О предмету
Предметни наставник: Маринко Тимотијевић
Сарадник: Бранко Арсић

Циљ предмета
Оспособљавање студената за:
- разумевање значаја визуелизације података
- стицање знања и овладавање теоријском подлогом граматике, интерактивне и динамичке, web оријентисане графике
- програмирање ефектне визуелизације података на модерним софтверским платформама за Data Science квалитетно комуницирање резултатима.
Исход предмета
Савладанo градиво оспособиће студента: за решавање комплексних изазова везаних за претакање података у ефективну визуелизацију високог нивоа и смислена тумачења података, за програмирање статичких и интерактивних дијаграма као и динамичких, web оријентисаних решења, графичке визуелизације података
Садржај предмета

Теоријска настава

Увод. Визуелизација података. Примери. Значај. Трендови. Интерактивна грaфика. Web оријентисана графика. Граматика графике. Графички пакети софтверских платформи из Data Science домена. R графика. ggplot2. Кључне компоненте. Дијаграми. Боје, Величине. Облици. Естетски атрибути (aesthetic attributes). Фасети (Facetting, facet wrap, facet grid). Координатни системи. Скалирање. Нелинеарни координатни системи. Врсте дијаграма: line and path plots, Хистограми и дијаграми фреквенција, Bar charts, Scatter plots, Boxplots, Violin plot. Визуелизација категоријских података. Mosaic plot. Визуелизација временских серија. Дистрибуције. Модификовање оса. Легенде. Колективна геометрија. Слојевита граматика дијаграма. Естетика и графички објекти. Теме. Истраживачка aнализа података. Неуредни подаци, чишћење, спајање, дељење података ... Елементи трансформација података. Филтери. Креирање нових варијабли. Груписање података. Трансформисање помоћу цеви (pipelines). Елементи фитовања /моделовања података. Регресиони модели. Ефекти глачања. Локализоване регресије (Loess). Предикциони интервали. Уклањање трендова. Површински дијаграми. Цртачке мапе. Рад са overplotting-ом. Мониторинг података. Програмирање са ggplot2. Plot функције. Функционално програмирање. Интерактивна графика. Lattice пакет. Rattle пакет. 3D графика. Ggviz, plotly – интерактивна web графика. Пакет Shiny – креирање интерактивних web апликација директно из R-a. R markdown и knitr – израда HTML докумената и извештаја. Презентација података. Комуникација резултатима.

Практична настава:
Примена софтверских алата за визуелизацију података у R окружењу (base packet, ggplot2, tidyr, dplyr, ggvis, rattle, shiny…). Рад на вежбама подразумева примену стеченог знања на решавање конкретних задатака у домену визуелизације и тумачења података.
Начин полагања испита:

Литература
1. Wickham, Hadley, and Garrett Grolemund, R za statističku obradu podataka, Mikro knjiga, 2017.
2. Wickham, Hadley, Еlegant Graphics for Data Analysis, Springer, 2015.
3. Williams, G. J. (2011). Data Mining with Rattle and R: The Art of Excavating Data for Knowledge Discovery. Use R! series. Springer. http://www.amazon.com/gp/product/1441998896.
4. Ford, N., McCullough, M., & Schutta, N., Presentation patterns: techniques for crafting better presentations. Addison-Wesley, 2012.
Материјали
- Увод у R програмски језик
- Вежбе 01 Datoteka
- Вежбе 02 Datoteka
- Вежбе 03 Datoteka
- Вежбе 04 Datoteka
- countries.csv Datoteka
- stanovnistvo.csv Datoteka
- Вежбе 05 Datoteka
- Вежбе 06 Datoteka
- Exploratory data analysis (EDA)
- Vizuelizacija podataka Datoteka
- Transformacija podataka Datoteka
- Eksploratorna analiza podataka Datoteka
- EDA primeri Datoteka
- Feature engineering Datoteka
Скрипте
- R скрипта Datoteka
Tema 3
Nije dostupno

Uvodna sekcija (tematski format)

О предмету

Материјали

Скрипте

Tema 3