ビッグデータ分析基盤の構築事例集 Hadoopクラスター構築実践ガイド
※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。
また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。
Apach Hadoop 3/MapR 6.0とエコシステムによるビッグデータ分析基盤の構築の実践ガイド Hadoop基盤の方向性の検討や戦略の立案、および、意思決定を行う企画部門や、実際に基盤構築を行う技術者が、導入前の検討を実践できる内容を盛り込みました。
具体的には、ビッグデータ処理システムの経緯、目的、Hadoopとその周辺ソフトウェアの特徴、導入時の検討項目、注意点、システム構成例などの要点を知ることができます。
また、大規模なデータ処理基盤の構築の経験がない技術者でも、Hadoopをインストールし、使用できるように、一連の手順をステップバイステップで具体的に記載しています。
エコシステムとしては、日本の企業においても導入が積極的に行われているインメモリ型の分析、および、機械学習のフレームワークを提供するSpark、機械学習エンジンのMahout、従来のRDBMSのSQL文のようなデータ操作を実現するHive、Impala、列指向の分散データベースであるHBase、データの加工や抽出を行うPig、RDBMSとHadoop間でのデータ転送を実現するSqoop、SNSやログなどのさまざまな種類データをHadoopに取り込むFlumeといった、利用頻度の高いHadoop周辺ソフトウェアの具体的な構築手順と使用例を網羅しました。
これらの多くの事例により、最新のビッグデータ処理基盤で提供される機能や基本的な使用法を理解できます。
更新中です。しばらくお待ちください。