(cache) TTC: TinyTweetCrawler β version
ツイート
このエントリーをはてなブックマークに追加

TTC: TinyTweetCrawler β version

Last update: 2012-01-21
Naohiro Matsumura

はじめに

TTCはTwitterから検索キーワードを含む呟き (Tweets) を収集するフリーウェアです。収集した呟きは

検索クエリ,ID,日付,ユーザ名,呟き

の形式のCSVファイル(サンプル)として保存しますので、TTMを利用すればテキストマイニングを行うことができます。Windows版とMac OSX版があり、最新バージョンは 0.13 です。

インストール for Win

インストール for Mac

Mac版TTCを起動すると

のエラーメッセージが出ますが無視してください。

使い方

TTCはをダブルクリックすると起動します。使い方は非常に簡単なので起動すれば分かると思います。

検索オプションのうち、OR - # @ from: to: は利用可能です。また、検索キーワードを半角スペースで区切れば AND 検索になります。

界王拳を使えば1500件以上のツイートを取得できますが、時間もかかるので注意してください。界王拳1倍あたり取得時間が10分かかります。また界王拳n倍を使っても取得ツイート数はn倍にはなりません(ちょっと実験したところ、界王拳45倍で11179件取得できました)。Twitter APIの利用制限にひっかかるので、同一IPからのTTTとの併用はお勧めしません(たぶん途中から弾かれます)。

なお、Mac版TTCに日本語キーワードを入力するときは、コピー(Ctrl+c)&ペースト(Ctrl+y)で貼りつけてください。

その他

TTCが利用しているTwitter APIは1時間当たり150回の利用制限(Rate limiting)があります。TTCでは100ツイート取得するのにAPIを1回利用しますので、1時間あたり最大15,000ツイートまでしか取得することはできません。それ以上のペースでツイートを取得したい場合は Request whiltelisting から要望を出せば利用制限が緩和されると思います(が、今は要望を受け付けていないと思います)。

スクリーンショット


(左がWindows版、右がMac OSX版)

履歴