Analiza ogromnych zbiorów danych nie musi być wolna!
Apache Spark to darmowy, zaawansowany szkielet i silnik pozwalający na szybkie przetwarzanie oraz analizę ogromnych zbiorów danych. Prace nad tym projektem rozpoczęły się w 2009 roku, a już rok później Spark został udostępniony użytkownikom. Jeżeli potrzebujesz najwyższej wydajności w przetwarzaniu informacji, jeżeli chcesz uzyskiwać odpowiedź na trudne pytania niemalże w czasie rzeczywistym, Spark może być odpowiedzią na Twoje oczekiwania.
Sięgnij po tę książkę i przekonaj się, czy tak jest w rzeczywistości. Autor porusza tu zaawansowane kwestie związane z
analizą statystyczną danych, wykrywaniem anomalii oraz analizą obrazów. Jednak zanim przejdziesz do tych tematów, zapoznasz się z podstawami — wprowadzeniem do analizy danych za pomocą
języka Scala oraz
Apache Spark. Nauczysz się też przeprowadzać
analizę semantyczną i zobaczysz, jak w praktyce przeprowadzić analizę sieci współwystępowań za pomocą
biblioteki GraphX. Na koniec dowiesz się, jak przet
warzać dane geoprzestrzenne i genomiczne, a także oszacujesz ryzyko metodą
symulacji Monte Carlo. Książka ta pozwoli Ci na wykorzystanie potencjału Apache Spark i zaprzęgnięcie go do najtrudniejszych zadań!
Przykłady prezetnowane w książce obejmują:
Rekomendowanie muzyki i dane
Audioscrobbler
Prognozowanie zalesienia za pomocą
drzewa decyzyjnego
Wykrywanie anomalii w ruchu sieciowym metodą grupowania według k-średnich
Wikipedia i ukryta analiza semantyczna
Analiza sieci współwystępowań za pomocą biblioteki
GraphX
Geoprzestrzenna i
temporalna analiza tras nowojorskich taksówek
Szacowanie ryzyka finansowego metodą symulacji Monte Carlo
Analiza danych genomicznych i projekt
BDG
Analiza danych neuroobrazowych za pomocą pakietów
PySpark i
Thunder
Poznaj potencjał i wydajność Apache Spark!
Informacje dodatkowe o Spark. Zaawansowana analiza danych:
Wydawnictwo: Helion
Data wydania: 2015-11-24
Kategoria: Poradniki
ISBN:
9788328314610
Liczba stron: 257
Sprawdzam ceny dla ciebie ...
Chcę przeczytać,