О предмету
Предметни наставник: Маринко Тимотијевић
Сарадник: Бранко Арсић
Циљ предмета
Оспособљавање студената за:
- разумевање значаја визуелизације података
- стицање знања и овладавање теоријском подлогом граматике, интерактивне и динамичке, web оријентисане графике
- програмирање ефектне визуелизације података на модерним софтверским платформама за Data Science квалитетно комуницирање резултатима.
Исход предмета
Савладанo градиво оспособиће студента: за решавање комплексних изазова везаних за претакање података у ефективну визуелизацију високог нивоа и смислена тумачења података, за програмирање статичких и интерактивних дијаграма као и динамичких, web оријентисаних решења, графичке визуелизације податакаСадржај предмета
Теоријска настава
Увод. Визуелизација података. Примери. Значај. Трендови. Интерактивна грaфика. Web оријентисана графика. Граматика графике. Графички пакети софтверских платформи из Data Science домена. R графика. ggplot2. Кључне компоненте. Дијаграми. Боје, Величине. Облици. Естетски атрибути (aesthetic attributes). Фасети (Facetting, facet wrap, facet grid). Координатни системи. Скалирање. Нелинеарни координатни системи. Врсте дијаграма: line and path plots, Хистограми и дијаграми фреквенција, Bar charts, Scatter plots, Boxplots, Violin plot. Визуелизација категоријских података. Mosaic plot. Визуелизација временских серија. Дистрибуције. Модификовање оса. Легенде. Колективна геометрија. Слојевита граматика дијаграма. Естетика и графички објекти. Теме. Истраживачка aнализа података. Неуредни подаци, чишћење, спајање, дељење података ... Елементи трансформација података. Филтери. Креирање нових варијабли. Груписање података. Трансформисање помоћу цеви (pipelines). Елементи фитовања /моделовања података. Регресиони модели. Ефекти глачања. Локализоване регресије (Loess). Предикциони интервали. Уклањање трендова. Површински дијаграми. Цртачке мапе. Рад са overplotting-ом. Мониторинг података. Програмирање са ggplot2. Plot функције. Функционално програмирање. Интерактивна графика. Lattice пакет. Rattle пакет. 3D графика. Ggviz, plotly – интерактивна web графика. Пакет Shiny – креирање интерактивних web апликација директно из R-a. R markdown и knitr – израда HTML докумената и извештаја. Презентација података. Комуникација резултатима.
Практична настава:
Примена софтверских алата за визуелизацију података у R окружењу (base packet, ggplot2, tidyr, dplyr, ggvis, rattle, shiny…). Рад на вежбама подразумева примену стеченог знања на решавање конкретних задатака у домену визуелизације и тумачења података.Начин полагања испита:
- Wickham, Hadley, and Garrett Grolemund, R za statističku obradu podataka, Mikro knjiga, 2017.
- Wickham, Hadley, Еlegant Graphics for Data Analysis, Springer, 2015.
- Williams, G. J. (2011). Data Mining with Rattle and R: The Art of Excavating Data for Knowledge Discovery. Use R! series. Springer. http://www.amazon.com/gp/product/1441998896.
- Ford, N., McCullough, M., & Schutta, N., Presentation patterns: techniques for crafting better presentations. Addison-Wesley, 2012.