(cache) TTC: TinyTweetCrawler β version
TTC: TinyTweetCrawler β version
Last update: 2012-01-21
Naohiro Matsumura
はじめに
TTCはTwitterから検索キーワードを含む呟き (Tweets) を収集するフリーウェアです。収集した呟きは
検索クエリ,ID,日付,ユーザ名,呟き
の形式のCSVファイル(サンプル)として保存しますので、TTMを利用すればテキストマイニングを行うことができます。Windows版とMac OSX版があり、最新バージョンは 0.13 です。
インストール for Win
インストール for Mac
Mac版TTCを起動すると
Use of uninitialized value in concatenation (.) or string at ... Tcl.pm line 394, <DATA> line 855.
のエラーメッセージが出ますが無視してください。
使い方
TTCは
をダブルクリックすると起動します。使い方は非常に簡単なので起動すれば分かると思います。
検索オプションのうち、OR - # @ from: to: は利用可能です。また、検索キーワードを半角スペースで区切れば AND 検索になります。
界王拳を使えば1500件以上のツイートを取得できますが、時間もかかるので注意してください。界王拳1倍あたり取得時間が10分かかります。また界王拳n倍を使っても取得ツイート数はn倍にはなりません(ちょっと実験したところ、界王拳45倍で11179件取得できました)。Twitter APIの利用制限にひっかかるので、同一IPからのTTTとの併用はお勧めしません(たぶん途中から弾かれます)。
なお、Mac版TTCに日本語キーワードを入力するときは、コピー(Ctrl+c)&ペースト(Ctrl+y)で貼りつけてください。
その他
TTCが利用しているTwitter APIは1時間当たり150回の利用制限(Rate limiting)があります。TTCでは100ツイート取得するのにAPIを1回利用しますので、1時間あたり最大15,000ツイートまでしか取得することはできません。それ以上のペースでツイートを取得したい場合は Request whiltelisting から要望を出せば利用制限が緩和されると思います(が、今は要望を受け付けていないと思います)。
スクリーンショット

(左がWindows版、右がMac OSX版)
履歴
- 2012-01-21 v0.13 ツイート内の改行コードを削除するように修正
- 2011-12-20 アイコンを変更(リンク不要&商用利用OKのこれを使いました)
- 2011-08-18 v0.12 Win版のみGUIのモジュールをPerl/Tkに変更(検索キーワードを入力すようとすると落ちるため)。
- 2011-08-02 v0.12 Twitter APIの仕様変更による修正。収集終了時にダイアログを出力するように修正。
- 2011-07-01 v0.11 GUIのモジュールをPerl/TkからTkxに変更
- 2011-03-18 v0.10 ツイート取得に失敗しても終了しないように修正
- 2011-03-17 v0.09 界王拳を追加
- 2010-12-15 v0.08 日本語以外のツイートも検索できるように修正
- 2010-09-13 v0.07 Win版のアップデート。Mac OSX版のインストール方法を修正
- 2010-09-11 v0.07 検索オプションのbug fix。Mac OSX版のみアップデート
- 2010-09-04 Mac OSX版を復活
- 2010-08-03 v0.06 XAuth認証対応。Mac OSX版を廃止
- 2009-12-16 v0.05 Mac OSX版を公開
- 2009-12-15 v0.05 HTTPプロキシの設定欄を削除(Net::Twitter::Liteでproxyを設定する方法が不明なため)
- 2009-12-15 v0.04 「呟き収集」ボタンが一度使うと「ブログ収集」ボタンになる不具合を修正
- 2009-12-14 v0.03 公開。GUIを追加
- 2009-12-10 v0.02 exe化しても動くようになった(Net::TwitterからNet::Twitter::Liteを使うように変更)
- 2009-12-04 v0.01 とりあえず完成(exe化すると動かない)