カルチャロミクス:文化をビッグデータで計測する
本をビッグデータとして扱い、研究に使う、新しい学問の登場人文科学が「定量化」の時代に突入。
‘文系’こそが大フロンティアだ!Googleがスキャンした大量の書籍(過去、数世紀ぶん!)から、各年に発行された本に使われている単語・フレーズの使用頻度をグラフに示す「グーグル・Nグラム・ビューワー」。
この技術の登場で、文献をビッグデータとして活用するまったく新しい人文科学が誕生した。
Nグラム・ビューワーを実現に導いたふたりの科学者が、その誕生の経緯と、どのように活用され、何がわかるようになったか、その意義を解説。
彼らが「カルチャロミクス」と名づけた、文献をビッグデータとして利用するこの新しい研究を紹介する。
●内容より不規則変化動詞だった「burnt」はいつから「burned」になったか使われている単語のうち、辞書にあるのはどのくらいの割合か有名人になる人はだいたい何歳から有名になり始めるのか「天安門」「トロツキー」などの言葉が検閲により本から消えた証拠を示す「ジーンズ」「携帯電話」など発明品の普及のピークは発明から何年後?クリスマスのあいさつ「Merry Christmas」はいつから使われるようになったかビッグデータの文化研究・人文科学への応用は何を引き起こすか◎グーグル・ Nグラム・ビューワーとは16世紀から今世紀初頭までに刊行された合計数百万タイトルの書籍をサンプルに、その中に登場する任意の単語・フレーズの出現頻度を年ごとにプロットする仕組みで、ウェブ上のサービスとして誰でも無料で利用できる(日本語には対応していない)。
Google Ngram Viewerで検索すれば、すぐに見つかる。
更新中です。しばらくお待ちください。