2012-05-05

■[nlp]テキストマイニング技術の活用に向けて読んでおきたい12のプレゼン資料

　タイトルからも分かるように、@hamadakoichiさんによる「大規模データマイニング・機械学習 Mahout活用に向けて読んでおきたい12のプレゼン資料」のパクリです（笑）そして、「テキストマイニング」という語をslideshareで検索したら、意外と自分の資料が引っ掛かったので、やや手前味噌な感じになっています。

　まずは、「テキストマイニングって何？」という初心者向けの資料を3つ。

「さくさくテキストマイニング入門セッション」（@AntiBayesianさん）

テキストマイニングに関する概論、基本的な用語の説明など

「コピー＆ペーストのみで始めるテキストマイニング超入門」（@langstat）

プログラミングなし、なおかつ無料でテキストマイニングをする方法

「言語研究における統計の活用」（@langstat）

テキストマイニングと密接に関連する統計的言語研究に関する概論

　次に、テキストマイニングをするためのプログラミングの入門資料を3つ。

「Pythonによる日本語自然言語処理」（@nokunoさん）

Python (NLTK) でテキストマイニングをする方法

「R言語によるテキストマイニング入門」（@langstat）

R (RMeCab) でテキストマイニングをする方法

「Perlで入門テキストマイニング」（たつをさん）

Perlでテキストマイニングをする方法

　そして、テキストマイニングをするためのデータ収集や解析手法に関する資料を3つ。

「テキストマイニングの前のコーパス収集」（@gepuroさん）

ウェブ上の言語データの収集とゴミ取りに関する方法

「今日から使える！みんなのクラスタリング超入門」（@toilet_lunchさん）

クラスタリング (k-means) に関する入門資料

「初めての機械学習～機械が学習するって何？～」（@gepuroさん）

機械学習に関する入門資料

　最後に、テキストマイニングの活用事例を紹介した資料を3つ。

「SakuSakuSVMでさくさくツイートマイニング！」（@AntiBayesianさん）

SVMを使ったtweet分類

「テキストマイニングで見る『機動戦士ガンダム』」（@langstat）

『機動戦士ガンダム』に登場するキャラクターのネットワーク分析など

「マーケティングリサーチへのテキストマイニングの活用」（@saynoway66さん）

ビジネスへの活用事例

　以上、ワタクシの記憶と趣味に基づいて、12のプレゼン資料を紹介しました。当然、これ以外にも素晴らしい資料はたくさんありますし、ワタクシの知らない資料も存在するはずです。何かオススメの資料がありましたら是非ご教示くださいませ。

コメントを書く

		2012/05
日	月	火	水	木	金	土
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

コーパスいぢり ～langstatの研究日誌～

2012-05-05

■[nlp]テキストマイニング技術の活用に向けて読んでおきたい12のプレゼン資料

コーパスいぢり～langstatの研究日誌～