ネットを使った大規模共同作業 (TEDTalks)

Luis von Ahn / 青木靖訳
2011年4月

(CAPTCHAの画像)こんな風にゆがんだ文字を読んでフォームに入力しなければならず、煩わしく思ったことはありませんか？きっと皆さんそうでしょう。考案したのは私です。(笑) まあ、考案者の1人ですね。

これはCAPTCHAと呼ばれています。これの目的は、入力しているのが確かに人間で、何百万回もフォームを送信するように作られたプログラムではないと確認するためです。どうしてこれがうまくいくのかというと、目の見える人であれば、こんなゆがんだ文字でも問題なく読み取れますが、コンピュータにはそれができないからです。たとえばticketmaster.comがユーザにゆがんだ文字を読ませるのは、一度に何百万枚もチケットを注文するプログラムをダフ屋に作らせないためです。

CAPTCHAはネット上で広く使われ、あまりに多く使われているので、表示されるランダムな文字の並びが不運な結果になることがあります。これはYahoo!のユーザ登録ページの例ですが、ランダムな文字列がたまたま “WAIT” (待て)という意味ある単語になっています。傑作なのはYahoo!のヘルプデスクが20分後に受け取ったメッセージです(「20分待ったけど何も起きません。どうすればいいのでしょう？」——笑)。この人は待たなきゃいけないと思ったようです。しかしそれも、この人ほど不運ではないでしょう(“RESTART”(やり直せ)と表示された画面——笑)。

CAPTCHAは、私たちが10年以上前に、ここカーネギーメロン大学で開発し、広く使われるようになりました。次に、その何年か後に作ったCAPTCHAの進化形の話をしましょう。これはreCAPTCHAと呼んでいるもので、ここカーネギーメロン大学でやり始めて、それからベンチャー企業を立ち上げました。そして1年半ほど前にGoogleがその会社を買収しました。

そのプロジェクトがどう始まったかですが、きっかけはある気づきです。CAPTCHAは世界中の人によって毎日２億回も入力されています。最初このことを知って、自分の研究成果のインパクトの大きさに強い満足を覚えましたが、それから申し訳ない気持ちになりました。CAPTCHAの入力をするため、みんな10秒ほど時間を無駄にすることになりますが、これを２億回と掛け合わせると、人類はこの煩わしいCAPTCHAへの入力のため、全体として毎日50万時間も無駄にしているわけです。申し訳ない気にもなります。(笑)

Webの安全を保つ上でCAPTCHAは単になくすわけにいかないのですが、この労力を何か人類の役に立つことに利用できないかと考えました。どういうことかと言うと、CAPTCHAに入力する10秒間で人の脳は実はものすごいことをしています。コンピュータにはできないことです。その10秒間に何か有用なことをしてはもらえないか？言い換えると、現在のコンピュータでは解けない巨大な問題を10秒分の断片に分割して、CAPTCHAを入力する人に解かせられないかと考えたのです。答えはイエスで、それが私たちの今していることです。

実はCAPTCHAを入力するとき、皆さんは人間だという確認をするだけでなく、本のデジタル化への貢献もしているのです。その仕掛けを説明しましょう。本をデジタル化するプロジェクトがいろいろあります。Googleもやっていますし、Internet Archiveでもやっています。AmazonはKindleで本のデジタル化を試みています。それにはまず古い本を取り上げて･･･物理的なやつですが･･･見たことありますよね？本っていうんですけど？ (笑) まず本を選んで、それをスキャンします。

本のスキャンでは、各ページのデジタル写真を撮ります。すべてのページについてテキストの画像を作るわけです。次にその画像の中の語をコンピュータで解読する必要があります。そのためにOCR(光学式文字認識)という技術を使います。テキストの写真を撮って、その中の文字を読み取ろうとするわけです。問題はOCRが完璧ではないということで、とくに文字がかすれたりページが黄色くなっているような古い本では、OCRで読めない語がたくさん出てきます。50年以上前に出版されたような本では、語の３割はコンピュータで読み取れません。それで私たちがやっているのは、コンピュータで認識できなかった語をCAPTCHAの入力をする人に読んでもらうということです。

皆さんがCAPTCHAの入力をするときに表示される文字は、デジタル化している本でコンピュータが認識できなかった部分なのです。最近は語が１つでなく２つ出てくるようになっていますが、１つはシステムが本から取ってきたもので、中身が分からないものを出しています。答えを知らないので、ユーザの答えが合っているか分かりません。それでもう１つ答えの分かっている問題を出します。どっちがどっちかは言わず、両方答えてもらいます。答えの分かっている方の問題に正しい答えが返って来たら相手は人間で、もう一方の答えも正しいと当てにできます。これを違う人で10回ほど繰り返して、答えがすべて一致したら、新たに1つの語がデジタル化されるわけです。

それがこのシステムの仕組みです。このシステムを公開したのは３、４年前ですが、すでに多くのWebサイトが、時間を無駄にする古いCAPTCHAから、本をデジタル化する新しいCAPTCHAに切替えています。だからticketmaster.comでチケットを買うときも、皆さんは本のデジタル化に貢献しているのです。Facebookで友達の追加や挨拶をするときも、本のデジタル化に貢献しているのです。Twitterをはじめとする35万のサイトがreCAPTCHAを使っています。reCAPTCHAを使っているサイトは非常に多く、１日にデジタル化される語の数は相当なものになります。１日に１億語、１年では本にして２５０万冊分にもなります。それがすべて、１度に１語ずつCPAPTCHAへの入力で行われているのです。(拍手)

毎日それほど多くの語を扱っているので変なことも起こります。今はランダムに選ばれた２つの英単語を出しているので、余計変なことが起きやすくなっています。たとえばある時「クリスチャン」という語が出ました。これ自体おかしいことは何もありませんが、別のランダムに選ばれた語と組み合わせるとまずいことになり得ます。こんな風に(“悪いクリスチャン”というCAPTCHA)。さらに不運なことに、これの表示されたのがたまたま「神の国の大使館」というWebサイトでした。やべっ。(笑) もう１つまずかった例はJohnEdwards.comです(民主党ジョン・エドワーズ議員のサイトで「くそリベラル」と表示されている——笑)。だから私たちは辺り構わず人を侮辱しているわけです。

もちろん侮辱ばかりというわけではありません。ランダムに選んだ２つの語を出しているので、何か面白いものになることもあります。実際これはインターネット上で大きなミームになっていて、何万という人がこの「CAPTCHAアート」で遊んでいます。お聞きになったことのある人もいるでしょう。どんなことをするかというと、インターネットを使っていてCAPTCHAで何か変なものが出たとします。たとえば、｢見えないトースター｣とか。とりあえず画面コピーを取って、それからもちろんCAPTCHAの入力をします。本のデジタル化に貢献するためです。それからCAPTCHAの画像に関連する絵を描き加えます(宙に浮いているトーストの絵)。これが遊び方です。こういう作品が何十万とあります。中には可愛らしいのもあります(拳を握りしめた赤ん坊の写真と“それを握りしめた”というCAPTCHA)。もっと可笑しいのもあります(赤ら顔のワシントンやフランクリンと“ラリってる建国者たち”というCAPTCHA)。この「古生物学的シャベル」みたいに、ラッパーが登場するやつもあります(化石発掘現場前に立つラッパーの写真 [訳注シャベルの綴りがラッパーの使う-izzleスピークになっているのでラッパーで出てきている])。

この数字(750,000,000)はreCAPTCHAについて私がとても嬉しく思っている点で、reCAPTCHAを通して本のデジタル化に多少とも貢献している人の数は７億５千万人に上ります。世界人口の10%以上が人類の知識のデジタル化に貢献しているのです。このような数字が私の研究計画の起点になっていて、こんな疑問を持ったのです。人類が達成した偉業、人々の協力によって為された歴史的大事業に目を向けてみると、エジプトのピラミッドにしても、パナマ運河にしても、月に人を送ることにしても、興味深い共通点があります。いずれも携わった人の数が同じで、不思議なことにどれも10万人によって成し遂げられているのです。その理由は、インターネット以前の時代には10万より多くの人を協調させるのは、資金の問題もありますが、そもそも不可能だったのです。しかしインターネットのおかげで、人類の知識のデジタル化には７億５千万もの人が参加しているわけです。私の研究の契機となった疑問は、10万人で月に人を送れるのなら１億人では何ができるだろう、ということです。

この疑問から出発して、いろんなプロジェクトに取り組みました。中でも特にワクワクしているものについてお話ししましょう。１年半ほど密かに取り組んできてまだ公開していませんが、Duolingoという名前で、公開前なのでどうか内密に。(笑) みなさん信頼していますから。このプロジェクトが始まったのは、院生のセベリン・ハッカーにある問いを投げかけたときでした。これがセベリン・ハッカーです(フクロウの面をかぶっている男の写真)。私の所の院生で、彼の名字は本当に「ハッカー」なんです。私は彼に聞きました。「１億人を使ってWebを無料で各主要言語に翻訳しようと思ったら、どうすればいいか？」

この質問にはいろいろ考えるべきことがあります。まずWebを翻訳するということ。現在Webでは様々な言語が使われていますが、大きな部分を英語が占めています。英語を知らなければその情報にアクセスはできません。しかし他の言語の部分もたくさんあって、その言語を知らなければそれにアクセスすることはできません。だからWebの全体、少なくともその大部分を主要なすべての言語に翻訳したい。それが私のやりたいことです。

コンピュータで翻訳したらいいと思うかもしれません。機械翻訳でいいのでは？今では機械翻訳が方々で使われています。Web全体をそれで訳してしまったら？問題は精度が不十分なことで、この先15〜20年は駄目でしょう。たくさんの間違いをします。間違っていないときでも、いつも間違ってばかりいるので信頼していいのか分かりません。

機械で翻訳されたものがどんなものか例をお見せしましょう。これはあるフォーラムの投稿で、JavaScriptについての質問をしています。日本語から英語に機械翻訳されています。読んで頂ければと思いますが、この人は最初に機械翻訳であることを謝っています。次の文は質問の前置きで、何かの説明をしています。JavaScriptの質問だということをお忘れなく(「よくヤギ時にインストールするエラーがゲロになります」)。それから質問の最初の部分が来ます(「風や竿やドラゴンのようになるのは何回ですか？」)。次は私のお気に入りの部分です(「これは父の石への侮辱でしょうか？」)。そして最後が極めつけです(「あなたの愚かさを謝ってください。ありがとうがいっぱいです」)。機械翻訳は、まだ不十分だということです。元の話に戻りましょう。

Web全体の翻訳をしてくれる人が必要です。次のアイデアはたぶん「お金を出してやってもらえば？」ということでしょう。Web全体をプロの翻訳家にお金を払って翻訳してもらえばいい。そうしてもいいかもしれませんが、あいにくとものすごくお金がかかります。たとえばWeb全体のほんの小さな部分、Wikipediaの英語版をスペイン語に訳すとしましょう。Wikipediaにはスペイン語版もありますが、英語版にくらべたらずっと小さく、サイズにして20%くらいしかありません。残りの80%をスペイン語に翻訳しようと思ったら、少なくとも5千万ドルはかかります。甚だしく搾取された国にアウトソースした場合でそうなんです。翻訳というのは高くつくのです。それで私たちがやろうとしているのは、Webの各言語への翻訳を１億人の人にタダでやってもらうということです。

そうしたときにすぐ直面する大きな壁が２つあります。1つはバイリンガルの不足です。インターネット利用者に翻訳ができるほどのバイリンガルがそもそも１億人もいるのか分かりません。これは大きな問題です。もう１つの問題は動機付けの欠如です。どうすればWebをタダで翻訳するよう動機づけられるのか？通常はお金を出して翻訳してもらいます。どうすればタダでやりたくさせられるのか？私たちがアイデアを追いかけ始めてすぐこの２つの問題にぶつかりました。それから２つの問題を同時に解決できる方法があることに気づきました。一石二鳥の方法があるのです。翻訳を何億という人がやりたがることに変え、それがバイリンガル不足の問題の解決にもなるということ。それは言語教育です。

今日外国語を学習している人は１2億人以上います。みんな本当に外国語を学びたがっているのです。学校で勉強させられるからというばかりではありません。たとえばアメリカだけでも外国語学習ソフトに500ドル以上使う人が5百万人以上います。みんな本当に外国語を習いたがっているのです。それで私たちがこの１年半取り組んできたのはDuolingoというWebサイトで、その基本的なアイデアは、みんなが外国語をタダで学び、同時にWebの翻訳もするということです。つまり実践を通して学ぶわけです。

初心者に対してはごく単純な文を提示します。もちろん単純な文ならWebにたくさんあります。すごく単純な文と、それぞれの単語の意味が提示されます。翻訳しながら、他の人はどう訳しているか見て、言葉を学んでいきます。上達するにつれ、より複雑な文が提示されるようになります。しかし実践して学ぶという点はいつも変わりません。

この方法の何がすごいかというと、実際非常によく機能するということです。何より、みんな本当に外国語を学びたがっています。システム構築が済んでテスト中ですが、本当に外国語を学ぶことができます。優れた外国語学習ソフトを使った場合に劣らず上達し、本当に外国語を身に付けているのです。しかもうまく学べるだけでなく、ずっと面白く学んでいます。Duolingoでは本物のコンテンツを使って学ぶからです。作り物の文章で学ぶのではなく本物のコンテンツで学ぶ方が、本質的に面白いし、本当に外国語を学ぶことができます。

さらに驚くべきことは、このサイトから得られる翻訳は、彼らが初心者であるにもかかわらず、プロの翻訳者に劣らず正確だということで、驚くほどです。例をお見せしましょう。これはドイツ語から英語に翻訳された文章です。一番上がドイツ語で、真ん中がプロの翻訳家による英訳で、１語につき20セント払っています。一番下がDuolingoユーザによる英訳で、彼らは元々ドイツ語は全く知りませんでした。ほとんど完璧なことがお分かりになると思います。プロの翻訳家並の翻訳にするためちょっとした仕掛けをしてあります。複数の初心者の翻訳から良い所を取って、組み合わせているのです。

組み合わせているにも関わらず、このサイトでは翻訳を非常に早く行えます。それでWikipediaを英語からスペイン語に翻訳するのにかかる時間を見積もってみました。これは５千万ドルに値する仕事だということを思い出してください、Wikipediaをスペイン語に訳すには、アクティブユーザ10万人なら５週間でできます。アクティブユーザ百万人なら80時間です。これまで私のプロジェクトはどれも数百万のユーザを得ていたので、このプロジェクトでも非常に早い翻訳ができるようになると期待しています。

Duolingoの最も刺激的な点は言語教育に公平さをもたらすビジネスだということです。何が問題だったかというと、今までの言語教育のビジネスモデルは学習者にお金を払わせるということです。つまりロゼッタストーンに500ドル払うわけです。(笑) それが現在のビジネスモデルです。このモデルが問題なのは、世界の人口の95%は500ドル払うことができないからです。貧しい人たちにとって不公平な、お金持ち向けのものなのです。一方Duolingoでは学びながら翻訳をして価値を生み出すので、たとえばどこかに翻訳料を払ってもらうこともでき、それが収益を得る方法になります。学習しながら価値を生み出す人たちは時間を費やしているわけで、お金を出す必要はありません。そして時間というのは、いずれにせよ外国語を学ぶ時には費やす必要のあるものです。貧しい人の不利にならないフェアなモデルというのがDuolingoの優れたところです。

これがDuolingoのアドレスです。(拍手) ここにサイトがあるのですが、まだ正式公開前で、このサイトに来てもらうと非公開ベータへの参加申し込みができます。たぶん３、４週間以内に開始できると思います。まだサービスを開始していません。

ここでお話ししているのは私ですが、Duolingoの開発は、ここに出ている優れたチームによって行われています。どうもありがとうございました。(拍手)

home rss

オリジナル: Luis von Ahn: Massive-scale online collaboration