Big Data

Apache Spark – Deo II

U prethodnom članku opisan je proces instalacije i konfiguracije Apache Spark-a. U ovom članku upoznaćemo se sa načinom korišćenja Spark Shell preko primera. Takođe, biće opisani i moduli Spark SQL, Spark Streaming, Machine Learning i GraphX.

Big Data

Apache Spark – Deo I

Apache Spark je open-source platforma za obradu velikih podataka. Spark je napisan u Scala programskom jeziku i pokreće se na Java virutelnoj mašini. Postoje dodatni moduli za mašinsko učenje, SQL, graf obradu i streaming. Razvijen je na Univerzitetu u Kaliforniji, da bi Apache Software Foundation nastavio njegov ravoj. Nastao je zbog ograničenja MapReduce paradigme. Nedostatak MapReduce-a je što se ulazni…

Pročitaj