Big Data

Apache CouchDB – Deo I

Imate problem koji je teško definisati pomoću standardne relacione sheme? Za razliku od relacionih baza podataka, ni ranije opisani MongoDB ni CouchDB ne koriste tabele za čuvanje podataka i relacija između njih, već kolekcije nezavisnih dokumenata. Obe ove baze se kategorišu kao document oriented NoSQL. Fiksna shema podataka ne postoji, već svaki dokument sadrži sopstvenu, samoopisujuću shemu. CouchDB koristi JSON…

Pročitaj

Big Data

Apache Ignite – Deo I

Ukoliko želite da skladištite i keširate ogromne količine podataka na efikasan način Apache Ignite je pravi izbor za vas. Ignite je platforma otvorenog koda koja svojim korisnicima nudi distribuiranu SQL bazu podataka kao i rad sa key-value vrednostima preko data grida. Neki od zadovoljnih korisnika Ignite-a su ING, Sberbank, HomeAway, Wellington, FSB, The Glue, 24 Hour Fitness, JacTravel i mnogi…

Pročitaj

Big Data

Apache Spark – Deo II

U prethodnom članku opisan je proces instalacije i konfiguracije Apache Spark-a. U ovom članku upoznaćemo se sa načinom korišćenja Spark Shell preko primera. Takođe, biće opisani i moduli Spark SQL, Spark Streaming, Machine Learning i GraphX.

Big Data

Apache Spark – Deo I

Apache Spark je open-source platforma za obradu velikih podataka. Spark je napisan u Scala programskom jeziku i pokreće se na Java virutelnoj mašini. Postoje dodatni moduli za mašinsko učenje, SQL, graf obradu i streaming. Razvijen je na Univerzitetu u Kaliforniji, da bi Apache Software Foundation nastavio njegov ravoj. Nastao je zbog ograničenja MapReduce paradigme. Nedostatak MapReduce-a je što se ulazni…

Pročitaj