COMIC
GAME
G動画
G写真
ラノベ
通販
いいね
Rank

実践 Webスクレイピング&クローリング

※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。
また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。
欲しいデータを手に入れる。
―インターネットを1つの巨大なデータベースとして使おう。
本書の目的は、インターネットを「1つの巨大なデータベース」として扱い、「Webデータ」として活用できるようになることです。
Web上のデータを使用する上での基礎知識を解説し、インターネットを1つの巨大なデータベースとして扱うための技術を紹介します。
Webスクレイピングはその代表的な技術ですが、より簡単な方法もありますのでそちらも紹介します。
データの基礎知識やプログラミング技術について、代表的なライセンスや著作権を交えながら語り尽くします。
「Part 1: Webスクレイピングを試す」でLibraHack 事件の概要と論点、Webデータ活用の注意点を紹介。
Pythonを使ったWebスクレイピングを実際に試します。
「Part 2:データの基礎知識を理解する」で、データの定義や標準的なデータ形式、保存方法を紹介。
データの入手・整形にはプログラミング技術が少なからず必要ですので、Pythonの書き方も簡単に記載します。
「Part 3:Webデータを入手する」で、Webデータの種類別に入手方法や注意事項を紹介。
オープンデータ・LOD・WebAPI・Webスクレイピング代行サービス・Webスクレイピングの5つのデータの技術的と法律的な事に触れていきます。
「Part 4:Webデータを整形する」で、入手したWebデータを整形する方法を紹介。
文字コード変換、データ形式を整え、欠測値やはずれ値に対応します。
「Part 5:Webデータの入手・整形を実践する」で、Webデータ収集の実例を紹介。
気温・株価・評価(商品評価)の3つの事例を紹介しています。




ユーザレビュー
  • 0
  • 0
  • 0



実用書
©LOQUY 2018-2024 AllRight Reserve.