大家好(みなさま、ごきげんいかがですか?)、新米診断員の XC です。入社以来、先輩診断員から診断のいろはを教わる毎日です。
さて、前回は「情報収集、していますか?」と題して、私がセキュリティ業界に就職するにあたって参考にさせていただいた情報を紹介しました。
今回は 収集した情報をどうしようか というお話です。
まずは、私が興味をもっている情報とそれを集めるきっかけとなったできごとから書いてみたいと思います。
かれこれ 10 年以上前になりますが、なけなしのお金をはたいてチベットを旅したことがあります。当時ラサにはすでにインターネットカフェがあって、日本にいる友人にメールを送ろうと足しげく通っていました。[注1]
利用料金もさほど高くなく店員さんもじつにまめまめしく世話してくれるのですが、ひとつだけこまったことがありました。それは 日本語 IME が利用できない ということでした。
これでは日本語でメールを書くにはすこし不便です。そこで店員さんに相談して IME をインストールしはじめたのですが、画面に「估计剩余时间 8 天」(推定残り時間 8 日)と表示されたきり、いっこうにダウンロードが進む気配がありません。転送率もかぎりなく 0 にちかいあたりをふらふらしていてじつに頼りなげです。
くわえて、ひまつぶしに日本のニュースサイトなどをながめていると、ふとしたことで接続が切れてしまい、そのたびにダイヤラーというソフトウェアをたち上げてダイヤルアップしなければなりません。気ばかりあせってどうにももどかしいありさまでした。
結局そのときは「Ogenki-desu-ka?」とローマ字で打ってしのいだのですが、同時に
どうしてこんなに回線が遅いんだろう?
どうしてこんなに接続が不安定なんだろう?
というささやかな疑問が頭をもたげてきました。
そうしてちまちまと原因を調べていくうちに、中国にはパケットの検閲や接続の遮断をおこなう「Great Firewall」[注2]というしくみがあることを知り、気がつけば中国のネットワークに対して興味(と、ひとつまみの不満)をもつようになっていたのでした。
最初はそうした情報の載っている記事をさがして目をとおすだけだったのですが、2007年ごろ「はてなブックマーク」というウェブサービスを知ってからは、読んだものにコメントやタグをつけて管理するようになりました。
Twitter はこのころまだ今ほど一般的ではなく、利用する意味もなかなか見いだせずにいました。後年「セキュリティ業界に入る」という目標を立ててからは情報収集の手段のひとつとして積極的に利用するようになり、今では SNS も充分に発達して、それまで苦労してさがしてきたいろいろな情報がほぼリアルタイムで手もとに届くまでになりました。このことは自分の情報収集のしかたにも大きな変化をもたらしてくれたように思います。
(閑話休題)
だいぶ前置きが長くなってしまいましたが、前回も引用した
私のセキュリティ情報収集術 - セキュリティは楽しいかね?
私のセキュリティ情報共有術を整理してみた。 - piyolog
にならって、情報の インプット・アウトプット という視点から自分の情報収集のながれを整理してみようと思います。
インプット
情報の入力(検索・抽出)には以下のサービスを利用しています。
・Feedly
・微博
・中国のブログや掲示板と転載サイト
・Google や百度などの検索エンジン
・Internet Archive や検索エンジンのキャッシュ
・メールマガジン
・YouTube や中国の動画系サイト
・GitHub
「情報セキュリティ」や「中国」といったリストを作成して、その方面に強い方々を追加しています。情報セキュリティ関連は前回紹介した方法で、中国関連は Great Firewall による遮断を迂回して情報を発信しているアカウントを登録しています。
経験上、情報伝達の速度(事象発生時から情報が伝わってくるまでのタイムラグ)は
中国在住のユーザー(数時間~翌日) > 欧米・中国のメディア(翌日~三日後) >>> (越えられないなにか) >>> 日本のメディア(三日後~二週間)
の順に速いので、おのずと中国語か英語の記事に目をとおすことが多いです。
タイムラインを追うときは、自宅では TweetDeck を、移動中は Tweetbot for iPhone を利用しています。
Feedly
RSS フィードの一元管理には Google Reader を愛用していたのですが、2013年 7月 1日をもってサービスが終了してしまったため、今は Feedly の無料版を利用しています。 RSS フィードを配信していないサイトは「はてなアンテナ」というサービスを利用して間接的に管理するようにしています。
Twitter と合わせて「情報セキュリティ」や「中国」といったコレクションを作成して、その方面に強いサイトを追加しています。現時点で情報セキュリティ関連のフィードは 350 個、中国関連は 100 個ほどです。
フィードを追うときは、自宅では Feedly を、移動中は Reeder for iOS を利用しています。
微博
「新浪微博」(Weibo)は主に中国国内に向けて運営している Twitter のようなサイトです。中国では「敏感词」(ミンガンツー)[注3]と呼ばれる特定の語句は検閲対象としてフィルタリングされる可能性が高いので、一定期間ごとにツイートのスナップショットを取得している「自由微博」(FreeWeibo)を補助的に利用しています。
中国のブログや掲示板と転載サイト
前述の Weibo と同様に、一般のサイトでも「敏感词」を含む記事や書き込みはフィルタリングされます。中国では当局の検閲に対抗するため転載サイトが発達しているので、検閲対象となって読めなくなった情報でも別のサイトでは複製されたものを読める場合があります。
また、毎年 9月18日[注4]など特定の日が近づくと中国からのサイバー攻撃が増加する傾向にあるので、「红客」(ホンクー)のような愛国的なハッカー組織のサイトを見たりもします。ただ、近年は攻撃準備のやりとりが「腾讯 QQ」(Tencent QQ)や「人人网」(Renren)といったチャットサービスに移行してきているので、そうしたものも追う必要があると考えています。
Google や百度などの検索エンジン
関連記事や資料をさがすときに利用します。特に Google は検索対象をしぼりこむ上で便利な検索演算子[注5]が利用できるので重宝しています。
Internet Archive や検索エンジンのキャッシュ
検閲対象となって数年経過していたり、転載サイトにも見当たらない情報をさがす場合などに最後の手段として利用します。海外の情報は「ウェブ魚拓」のような日本のウェブサービスよりも Internet Archive のほうが見つかる可能性は高いです。
メールマガジン
中国関連のセキュリティインシデントやネットワークを扱っているものを選んで読んでいます。比較的、言論の自由や人権を求めるグループが発行しているものが多い気がします。ただ、たいてい内容が RSS フィードと重複するので、あくまで補助的な利用という位置づけです。
YouTube や中国の動画系サイト
動画や音声で状況を確認できる場合は、 YouTube や土豆などで補助的に見ることもあります。
GitHub
ちょっと意外に思われるかもしれませんが、 GitHub 上で Great Firewall による遮断を回避したり、ネットワーク状況を調査するツールを開発している方々の動向を見ています。
アウトプット
情報の出力(保存・共有)には以下のサービスを利用しています。
・はてなブックマーク
・FC2
リツイートするときは、検索機能を利用してなるべく最初のツイートをたどるようにしています。ニュース記事のタイトルと URL だけのツイートはリツイートしませんが、自分が見逃していた内容であれば(拝みながら)はてなブックマークに登録しています。なかでも、技術的に参考になるツイートはお気に入りに追加して、一定期間ごとに整理するようにしています。
自分のコメントをくわえたいときは「コメント QT タイトル(出典) URL」という書式でツイートするようにしています。コメントをくわえたくないときは公式リツイートを利用しますが、中国語のツイートのようにぱっと見わかりにくいものは日本語に翻訳したり要約したうえでツイートすることもあります。[注6]
ツイートの記録・管理は Twitter Analytics よりも Twilog を利用する機会が多いです。また、「むかしツイートした気がするけど、どんな内容だったかな?」というとき、検索したりもします。
はてなブックマーク
通勤電車にゆられながら iPhone で RSS やツイートをチェックするのですが、気になるものは URL だけコピーしてぽんぽんブックマークしていきます。ブックマークした記事は会社に着いてからゆっくり読み、気づいたことなどを「はてなブックマーク」のコメント機能を利用して書きとめておきます。コメントに書ける文字数は 100 字という制限があるのですが、要約の練習とわりきって利用しています。
Twitter や Feedly などで情報をインプットしているとき気になった情報は、自宅では「はてなブックマーク Google Chrome 拡張」を、移動中は「はてなブックマーク for iPhone」を利用して登録しています。
あとですぐに検索・参照できるよう「中国」や「ネットワーク」といったタグをつけ、毎日 10 サイトくらいずつブックマークしています。不要になったものは一定期間ごとに わーっ と整理してしまうので、現在のブックマーク数は 19,000 ほどです。[注7]
「はてなブックマーク」はもっぱら Twitter や Feedly で収集した情報をストックしておくために利用しています。同じような情報を集めている方がなかなか見当たらないということもあり、お気に入りに登録しているはてなユーザーはほとんどいません。ちなみに Evernote はアカウントはもっているのですが…(活用できていません)
FC2
ツイートのように短い文章の翻訳は Twitter に投稿しますが、ウェブサイトや PDF 形式の資料のように長い文章を翻訳したものは FC2 のホームページにまとめています。もともとは Facebook のノート機能で管理していたのですが、使いにくさと機能のものたりなさを感じて今は利用していません。
まとめ
だんだんとりとめがなくなってきたので、このへんでまとめようと思います。
今回こうして棚おろししてみて、あらためて以下の点に気づかされました。
・情報のインプットにくらべ、アウトプットが足りていない
・情報収集の効率がわるい
これまで情報収集にいそしむ反面、集めた情報を積極的に共有することはしてきませんでした。しかし、ただ漫然と情報をためこむだけでは意味がありませんし、この業界で中国語で書かれた情報を判読できるひともまだまだ不足しているように思います。そのため、次の目標として「中国語で書かれた情報の共有」を掲げてみようかと思います。
そして、情報収集のながれも改善していきたいと思います。今のしくみでも特に不便は感じていないのですが、数年来「Feedly & Twitter → はてなブックマーク」というながれに固執してきたので、正月やすみを利用してちょっと情報収集・整理のしくみを見なおしてみようかと考えています(Evernote ももっと有効活用できるようになりたいのです :-))
今回はだらだらと書いてしまいましたが、ここまでおつきあいいただき、ありがとうございました(ではまた!)
[1]インターネットカフェといっても、コンクリート打ちっぱなしの店内に中国製のチープなデスクトップが 10 台ほどならぶこぢんまりしたつくりでした。ラサはチベット族と漢民族の明確な住みわけがあって、前者は旧市街、後者は新市街に居住しているのですが、香港のブランド店などが進出している新市街ならいざ知らず、舗道すら整備されていない旧市街にもインターネット接続環境があったのは意外でした。
[2]正式なプロジェクト名は「金盾」ですが、一般的には「防火墙」(防火壁)とか、略称で「GFW」と呼ばれることが多いように思います。
中国独自のネットワーク検閲システム - Wikipedia[3]中国ではネット上で一時的または恒久的に利用が禁止されている語句があります。「六四」(天安門事件の起きた日)のように政治的にデリケートな語句はその最たるものです。一般的にそうした語句を使用するときは、発音の似た語句やその語句を連想させる別の語句に置換するなどして検閲を回避することが多いです。「敏感詞」に指定される語句は時期によって変動するので、その動向を公開するサイトも存在します。
敏感词库 - 中国数字时代[4]満州事変のきっかけとなった柳条湖事件が起きた日です。中国では国辱記念日とされ、この日が近づくと反日運動の機運が高まります。
柳条湖事件 - Wikipedia[5]すこしまえ以下のようなエントリもありましたが、コメントを寄せた人のなかにはブックマーク数が 19 万とか 53 万という方もいるようなので、それにくらべれば自分はまだまだです。
はてブ1万以上してる人って現実の友達いないんだと思ってる - はてな匿名ダイアリー[6]この記事を書いているあいだに Twitter で過去のすべての公開ツイートが検索できるようになったようなので、しばらくは Twilog と併用してみるかもしれません。
Building a complete Tweet index - Twitter Blogs[7]たとえば「site:」で特定のドメインで検索したり、「filetype:」でファイルの種類を指定したりといった感じで利用しています。
検索での句読点、記号、演算子 - Google