2012-05-05
■[nlp]テキストマイニング技術の活用に向けて読んでおきたい12のプレゼン資料 
タイトルからも分かるように、@hamadakoichiさんによる「大規模データマイニング・機械学習 Mahout活用に向けて読んでおきたい12のプレゼン資料」のパクリです(笑) そして、「テキストマイニング」という語をslideshareで検索したら、意外と自分の資料が引っ掛かったので、やや手前味噌な感じになっています。
まずは、「テキストマイニングって何?」という初心者向けの資料を3つ。
- 「さくさくテキストマイニング入門セッション」(@AntiBayesianさん)
- テキストマイニングに関する概論、基本的な用語の説明など
- 「コピー&ペーストのみで始めるテキストマイニング超入門」(@langstat)
- 「言語研究における統計の活用」(@langstat)
次に、テキストマイニングをするためのプログラミングの入門資料を3つ。
- 「Pythonによる日本語自然言語処理」(@nokunoさん)
- 「R言語によるテキストマイニング入門」(@langstat)
- R (RMeCab) でテキストマイニングをする方法
- 「Perlで入門テキストマイニング」(たつをさん)
そして、テキストマイニングをするためのデータ収集や解析手法に関する資料を3つ。
- 「テキストマイニングの前のコーパス収集」(@gepuroさん)
- ウェブ上の言語データの収集とゴミ取りに関する方法
- 「今日から使える! みんなのクラスタリング超入門」(@toilet_lunchさん)
- クラスタリング (k-means) に関する入門資料
- 「初めての機械学習〜機械が学習するって何?〜」(@gepuroさん)
- 機械学習に関する入門資料
最後に、テキストマイニングの活用事例を紹介した資料を3つ。
以上、ワタクシの記憶と趣味に基づいて、12のプレゼン資料を紹介しました。当然、これ以外にも素晴らしい資料はたくさんありますし、ワタクシの知らない資料も存在するはずです。何かオススメの資料がありましたら是非ご教示くださいませ。
コメントを書く