Apache Sparkビッグデータ性能検証
ビッグデータ向けの処理基盤として「Apache Spark」が注目を集めています。
Sparkにはストリームデータを処理する「Spark Streaming」というコンポーネントがあります。
本書では、Spark Streamingとその他のOSSを組み合わせたストリームデータ処理システムを構築し、その性能検証結果を紹介していきます。
第1章 Spark Streamingの概要と検証シナリオ第2章 Kafka、Spark、Elasticsearchによるシステム構築と検証の進め方第3章 Kafka、Spark、Elasticsearch のパラメータチューニング第4章 マシン台数の調整とシステム全体のボトルネックについての考察第5章 Spark 2.0を活用した配電設備の負荷集計システムの性能検証第6章 Spark 2.0の性能検証の結果とボトルネックの考察第7章 Sparkのデータ処理プロセスと処理性能のボトルネック第8章 Sparkの性能向上のためのパラメータチューニングとバッチ処理向けの推奨構成※本書は紙書籍はモノクロ、電子書籍はカラーでの提供となります。
※本書は、インプレスが運営するWebメディア「Think IT」で、「ユースケースで徹底検証! Sparkのビッグデータ処理機能を試す」として連載された技術解説記事を書籍用に再編集したものです。
※本書の内容は、執筆時点(2016年7月?2017年1月)までの情報を基に執筆されています。
更新中です。しばらくお待ちください。