Big Data

Grafovske baze podataka – Neo4j

Iako su relacione baze podataka i dalje najpopularnija vrsta baza podataka, poslednjih godina se pojavilo nekoliko „alternativnih“, takozvanih NoSQL baza podataka. To su baze podataka koje nisu bazirane na relacinom modelu podataka. NoSQL sistemi nastali su iz novih zahteva za većom fleksibilnošću i boljim performansama za smeštanje velike količine podataka. Razlog tome je uglavnom zbog popularnost Interneta i informacionih tehnologija…

Pročitaj

Big Data, Data Science

MultiValue Databases na primeru ArrayDB Deo II

U prvom delu smo mogli da pročitamo o nekim karakteristikama MultiValue modela kao i o pojedinim prednostima u odnosu na MultiValue model. U ovom delu ćemo se baviti primerima upotrebe MultiValue modela kao i određenim pogodnostima koje MultiValue model pruža svojim korisnicimia. Preduslovi Praktičnu primenu MultiValue modela pokazacemo na primeru ArrayDB-a. ArrayDB nam dozvoljava da nizove u našem programu posmatramo…

Pročitaj

Big Data, Data Science

Multivalue Databases na primeru ArrayDB Deo I

Model podataka MultiValue je alternativa standardnom relacionom pristupu koja sa sobom nosi mnoge prednosti. Sa rastućim NoSQL pokretom koji podstiče odstupanje od relacionih baza podataka, MultiValue model postaje izbor sve većeg broja kako developera tako i analitičara koji se bave obradom velike količine podataka. Ključne prednosti koje MultiValue model daje svojim korisnicima su veća sloboda prilikom definisanja modela podataka kao…

Pročitaj

Big Data

Apache Ignite – Deo II

U prvom delu smo mogli pročitati o tome šta je zapravo Apache Ignite kao i o nekim njegovim karakteristikama. U ovom delu ćemo na praktičnim primerima pokazati neke od mogućnosti koje Ignite pruža svojim korisnicima. Preduslovi Apache ignite je zvanično testiran na: JDK-u: Oracle JDK 7 i više Open JDK 7 i više IBM JDK 7 i više Sledećim operativnim…

Pročitaj

Big Data

Apache Ignite – Deo I

Ukoliko želite da skladištite i keširate ogromne količine podataka na efikasan način Apache Ignite je pravi izbor za vas. Ignite je platforma otvorenog koda koja svojim korisnicima nudi distribuiranu SQL bazu podataka kao i rad sa key-value vrednostima preko data grida. Neki od zadovoljnih korisnika Ignite-a su ING, Sberbank, HomeAway, Wellington, FSB, The Glue, 24 Hour Fitness, JacTravel i mnogi…

Pročitaj

Big Data, Operativni sistemi

Cloudera Impala

Cloudera Impala čini jedan moćan SQL engine za paralelnu obradu ogromnih količina podataka na klasteru. Da bi smo što približnije objasnili šta je Cloudera Impala i kako ona radi, osvrnimo se na Apache Hadoop sistem. Cloudera je jedna od platformi koja pruža usluge korišćena Apache Impale kao i drugih projekata vezanih za Hadoop tako da ćemo u nastavku dokumenta poistovetiti…

Pročitaj

Big Data

Elasticsearch

Elastcsearch je server koji služi za pretragu i analizu podataka. Napisan je u Java programskom jeziku što omogućava pokretanje na svim platformama. Baziran je na Lucene indeksima o kojima smo govorili u prethodnom članku (link) i omogućava korisnicima da pretraže veliku količinu podataka vrlo brzo. Može se koristiti i za čuvanje podataka ali je njegova glavna uloga indeksiranje i pretraga…

Pročitaj

Big Data

Apache Lucene

Apache Lucene je biblioteka napisana u Java programskom jeziku koja omogućava pretragu visokih performansi velike količine podataka. Besplatna je i pogodna za skoro svaku aplikaciju kojoj je potrebna ovakva vrsta pretrage. Najpre ćemo objasniti odakle potreba za ovakvom bibliotekom kao i način na koji radi. Nakon toga ćemo videti kako se instalira i koristi. Lucene indeksi Vrlo često je potrebno…

Pročitaj

Big Data

Apache Spark – Deo II

U prethodnom članku opisan je proces instalacije i konfiguracije Apache Spark-a. U ovom članku upoznaćemo se sa načinom korišćenja Spark Shell preko primera. Takođe, biće opisani i moduli Spark SQL, Spark Streaming, Machine Learning i GraphX.

Big Data

Apache Spark – Deo I

Apache Spark je open-source platforma za obradu velikih podataka. Spark je napisan u Scala programskom jeziku i pokreće se na Java virutelnoj mašini. Postoje dodatni moduli za mašinsko učenje, SQL, graf obradu i streaming. Razvijen je na Univerzitetu u Kaliforniji, da bi Apache Software Foundation nastavio njegov ravoj. Nastao je zbog ograničenja MapReduce paradigme. Nedostatak MapReduce-a je što se ulazni…

Pročitaj