CWL radni tok

Zadatak je kreirati CWL radni tok (workflow), koji kao ulaz prima 

  1. podatke u oblilku CSV fajla https://www.kaggle.com/datasets/altavish/boston-housing-dataset
  2. naziv kolone koja se modeluje i
  3. procenat podataka koji se uzima za trening.

Kao izlaz treba da da performanse regresionog modela (RMSE, PRMSE, isl) na test setu. Radni tok se sastoji iz dva koraka (step):

  1. Uklanjanje outlier-a i popunjavanje nedostajućih vrednosti prosečnom za tu kolonu.
  2. Treniranje modela bilo kojom tehnikom mašinskog učenja i izračunavanje performansi.
Oba koraka radnog toka treba obaviti u Docker okruženju, pri čemu Docker slike treba postaviti na DockerHub i odatle ih povlačiti.