初代iPhoneで英単語の「自動修正」機能を開発した男、その舞台裏と限界を語る

タッチスクリーンキーボードで文字を自動修正する「オートコレクト」機能。初代iPhoneのために開発が進んでいた当初は、タッチ式の小さなガラス板にタイピングすることが技術的に可能なのかどうかすら、わかっていなかったという。開発の舞台裏と同機能の課題と限界、そして未来について、当時の開発者が語った。

TEXT BY KEN KOCIENDA
TRANSLATION BY KAORI YONEI/GALILEO

WIRED(US)

IMAGEA BY CASEY CHIN

わたしは、つくりたい菓子(confection)がある。間違えた! 決してケーキを焼きたいわけではない。もう一度タイプし直そう。告白(confession)したいことがあるのだ。

これまで長年、わたしはソフトウェア開発者としてアップルで働いていた。そして初代iPhoneのために、タッチスクリーンキーボードで単語のスペリングを自動修正する「オートコレクト」機能を開発した。

ソフトウェアに支援されたタイピングの世界をスマートフォンにもたらしたことを、わたしは誇りに思っているもしiPhoneのキーボードがソフトウェアベースでなければ、アップルはスティーブ・ジョブズのヴィジョンを実現できなかっただろう。ジョブズは固定されたボタンが限りなく少ない、画期的なタッチスクリーン式のコンピューターをつくりたいと考えていたのだ。

iPhoneは成功したが、iPhoneのオートコレクト機能には限界があることをわたしは知っている。オートコレクト機能の“間違い”に関しては、誰もが語るべきエピソードをもっているはずだ。

自動修正が生み出したジョーク

ただし、間違いが面白ければ面白いほど、つくり話である可能性が高くなる。わたしはスマートフォン時代の駄ジャレ的なユーモア、新しいかたちの低級ユーモアを世界にもたらしたことについては、それほど誇りに思っているわけではない。

こんなエピソードを聞いたことがあるだろうか?

妻が新しい服を着た自分の写真を撮り、電子メールで夫に質問した。「このドレスだと、太って見えるかな?」。尋ねられた夫は、慎重に言葉を選ばなければならないことを承知している。しかし、夫の親指は違った。次のように返信してしまったのだ。

「モーー!(Mooooo!)」

一体どういうことだろう? これは、オートコレクト機能にまつわる悲劇的な結果だ。キーボード上で「M」と「N」が隣に並んでいて、辞書には、牛の鳴き声が単語として登録されていた。オートコレクト機能は、この単純な(しかし危険な)質疑応答がもつ微妙なニュアンスには関心がない。夫はすかさず次のメールを送った。「待ってくれ! そういうつもりじゃなかったんだよ!」

わたしたちは、こうしたエピソードを面白いと感じる。なぜなら身に覚えがあるからだ。わたしたちの誰もが、意図に反する修正が行われたメッセージを送ってしまったことがある。スマートフォンのユーザーになるには、小さなタッチスクリーンキーボードの人間工学とソフトウェアを受け入れなければならない。

アップルの秘密プロジェクト「Purple」

わたしは2005年後半、アップルでコードネーム「Purple」と呼ばれた製品のタッチスクリーン対応OSを開発するため、エンジニアやデザイナーからなる小さなチームで働き始めた。Purpleは極秘の革新技術開発プロジェクトで、これがのちに「iPhone」と呼ばれるようになったものだ。

わたしたちは当時、タッチセンサー式の小さなガラス板にタイピングすることが技術的に実現可能か、あるいは無駄骨になるか、わかっていなかった。「Purple」開発の初期のころ、こうしたキーボードの成功可能性は、気持ちがひるんでしまうほど低かった。われわれは、しばしば不安な表情を浮かべながら、これを「科学研究プロジェクト」と表現していた。

ソフトウェアはどのように助け船を出せばいいか。アルゴリズムはどのくらい提案を行い、タイプミスの修正に介入すべきか。これらの答えを出すのは容易ではなかった。

わたしは結局、自分たちがよく入力する単語、単語の相対的な使用頻度、タッチスクリーンキーボードで起こりやすいと思われる入力ミスを分析し、オートコレクト機能のコードを書いた。

文意を理解できないソフトウェアの限界

iPhoneの発売から10年以上が経ったが、現在の技術は当時とほとんど変わっていない。近年は人工知能(AI)や機械学習が進歩しているものの、中核的な問題点は以前と同じである。つまり、ソフトウェアは人のコミュニケーションのニュアンスを理解できない、ということだ。

もちろん、機械学習の主要原理はトレーニングの概念である。つまり、学習アルゴリズムに大量のテキストを見せ、Nグラム(一緒に使われることが多い単語の並び)を認識するよう教え込む。

単語数が多いほどアルゴリズムは賢くなり、「bacon and effs」と入力しても、「bacon and eggs(ベーコンエッグ)」の間違いではないかと教えてくれるようになる。また、いいかげんなタイピングで「havom」と入力してしまっても、「bacon(ベーコン)」の間違いだと推測してくれるだろう。

オートコレクト機能がこのように機能してくれたら、子供のランチのために「peanut gutter and Kelly sandwich(peanut butter and jelly sandwich=ピーナッツバターとジャムのサンドイッチの間違い)」をつくったと書くような、笑ってしまうようなミスはなくなる。キーボードがわたしたちのためにこうした修正をしてくれたら、ソフトウェアは頼りになると感じるはずだ。

オートコレクト機能をここからさらに改良していくとしても、程度の問題に終わるだろう。アルゴリズムにもっと多くのデータを学習させ、推測の精度を上げ、もっと長い語句を考えるようコンピューターに指示するだけだ。

ソフトウェアが生んだ「平凡な瞬間」

何をどう修正するかについて、ソフトウェアによりよい選択をさせるには、わたしたちの意図をもっとよく知る必要がある。しかし、わたしたちは本当に、ソフトウェアがいま以上に介入することを望んでいるのだろうか? ソフトウェアはどの程度の判断と書き換えを許されるべきなのだろう?

スマートフォンを日常的に使用している人はおそらく、タイピングソフトの利点と限界を受け入れている。もちろん、わたしもそうだ。スマートフォンのタイピングソフトは、わたしたちの日常生活において一定の役割を果たすようになったと考えているからである。

わたしにはお気に入りの風景がある。航空機が着陸後、ゲートに向かって地上を滑走している時間だ。

携帯電話の電源を入れてもいいというアナウンスが流れると、乗客たちはまず何をするだろう? 多くの人がメッセージアプリを開き、仲間や友人、愛する人へのメッセージを入力し始める。「到着したよ」、「着陸した。もうすぐ会えるね」といった内容だ。

こうした平凡だが人間らしい瞬間は、テクノロジーが可能にしたものであり、その一部にオートコレクトのソフトウェアを搭載したキーボードが貢献している。

わたしはいま、音声認識技術やAIの世界で次なる革新が起き、タイピングやコミュニケーションの手段が改善されることを心待ちにしている。それまでは、オートコレクト機能を備えたキーボードが、最も優れたスマートフォンの入力ソリューションとして君臨し続けるだろう。lobe it or gate it(love it or hate it=「あなたが好きか嫌いかは別として」の入力間違い)。

RELATED

SHARE