Pythonと実データで遊んで学ぶ データ分析講座
本書では理論と実践のどちらにもフォーカスを当てAIや機械学習について「ある程度、中身を知って使える」を目指す入門書です。
Twitter APIや国の統計データなど、生のデータを使い、遊んでいるような感覚で理解が進む1冊です。
■「はじめに」より抜粋本書は、AIや機械学習について、「何だかよくわからないけどすごいもの」という理解から、「ある程度、中身を知っていて使える」にアップデートしたい人(もしくは、アップデートしなければいけなくなってしまった人)に向けた、導入となる最初の1冊になることを目指しています。
本書では、理論と実践、両方を抑えています。
まず、なるべく数式を使わずに、直感的な理解ができるように機械学習の理論について解説します。
「遊んで学ぶ」というタイトルの通り、理論の勉強も楽しめるように、具体例や図を多く使っています。
しかし、だからといって不正確にならないように繊細な注意を払いながら、ギリギリまで噛み砕いて説明を行っています。
その後、よく使われるデータセットではなく、「APIで自由に取得できる、さまざまな企業が提供しているデータ」「国が提供している統計データ」などの生のデータを使い、実際に分析を行います。
本書は、実際にデータを取得するところからスタートすることで、「データの量を増やしたら結果はどうなるのだろう?」「このデータを可視化してみたらどうなるのだろう?」「変数を変えてみたらどうなるのだろう?」と、まるでデータを使って遊んでいるような感覚で理解が進むことを狙っています。
なお、データ分析を行うにあたり、多くの人は、RもしくはPythonというプログラミング言語を使います。
どちらも、データ分析やデータ整形、そして可視化を行うのに有効なライブラリが多数存在しているため、非常に人気です。
本書では、Pythonを用いて実装コードを記述しています。
ただし、Rを使いたい人も進められるように、RとPython両方のコードを、Github上にて公開しています。
ぜひ、参考にしてください。
更新中です。しばらくお待ちください。