こんにちは。ひろきです。
先日なんと代官山で日本語の手書き認識ソフトウェアの開発に成功した外国人グループがいる。それもたった2か月で。という記事にあたりました。
気になりすぎたので、早速取材にいってみたところ、Reactive Inc.のデータサイエンティストのDavid MalkinさんとコアエンジニアのPhilip Irriさんにお話しを聞くことができたので、まとめてみました!
非エンジニアにもわかるようにと噛み砕いて、システムの内容や今後の拡張計画ディープラーニングの可能性についてまでいろいろ話してくださいました。
実際に開発に携わったのは、全部で4人。なんと日本語の読み書きはほとんどできないそう。
まず、なぜそもそも日本語を対象にしたのかってところをストレートに聞いてみました。
なるほど。テクノロジー的なチャレンジと、市場のニーズが交差するところをうまく狙って行ったんですね。
確かに日本って、例えば義務教育の間は情報系の授業がほとんどないですし、文化的にも「手書き」を大切にしているところってありますよね。
どんな感じで文字を認識するのか、実際にデモを見せていただきました。
文章の文字をひとつずつ分析・認識しています。横に信頼値が表示されていますが、これは絶対的な数値でなく相対的なものだそう。
総合的な認識率は脅威の98.66%なんだとか。
開発当初は、やはり日本語特有の『似てるけど違う文字』に悩まされたそう。
例えばひらがなの「う」をカタカナの「ラ」と誤認してしまったり…といった問題ですね。そこで彼らが取った施策は以下のようなもの
そうして完成した現在のモデルは、これまでの『間違えないように解析精度をあげよう』と進化を続けてきたOCRとは似て非なるもの。
『間違えやすいものを文脈から自動修復する』という進化を遂げたシロモノなんだそうです。…すごいですね。
普通に考えてこれを『2か月でほぼ完成させる』というのは不可能に思えてしまいますが、そのへんどうやったのか。気になったので聞いてみました。
だから文字の認識機能が簡単に作れちゃう…というか、今はもうそういう時代なんだよ。
なるほど…。
そもそも開発者が『全てのご認識修正アルゴリズムの解』を考えだす必要などなく、プラットフォーム(≒ここではニューラルネットワークの輪の中。みたいなイメージ)が上手いことやってくれる時代…ということでしょうか。
確かにアレは人類のブラックボックスみたいなもんですしね。
実は一番大変だった作業は『日本語の意味理解』などではなく『日本語文字の情報を集めること』。日本人スタッフの助けが必要だったのは実際ここだけだったそう。
これらがしっかりしていれば既に様々な特価型進化を遂げたAIとの掛け合わせで、無限に近い応用が可能になっていく。ということなんでしょうね。
例えば教育。小学生のためには文字単体の認識機能だったり、高校生であれば文法などのもっと難易度の高い言語理解の機能が必要だったりするだろう?それに合わせた機能の追加を行って、各企業への提供、そしてその後のサポートをやっていくよ。
なので、(ちょっと残念ですが)APIとしての開放などの予定はないそうです。
他にも現在はこんなサービスの開発もやってるそう。全部超気になります。さすが。。
一見脈絡の無いこれら多岐にわたる事業展開を支えるのも『プラットフォームの力』ってことなんでしょうね。
実際、「どうやってるんですか?」と聞いた所「どうやるもこうやるもない。全部一緒なんだ。入れるだけだよ」とか言われてしまいました。
むぅ。。
だんだんと機械学習や人工知能を使ったサービスの開発の敷居が下がっている、という話もよく聞きますが、最先端の技術を使っている人たちの肌感はどうなんでしょう?
ということで、『今後一般人にもこんなクールなものが作れるようになると思いますか?』と質問してみました。
だそうで。
確かにほんの数年前はディープラーニングを活用することは難しかったはずですが、そろそろそんな現状も変わってきています。
もちろん基本的なエンジニアの知識は必須ですが、段違いで簡単になってきているのが実情ですし、なるほど確かに。。。
ただ、その上でDavidから言われた言葉はなかなかグサっときました。
ですよね…。オープンイノベーション、もっと加速させないと。ですね。
やはり今後の発展には情報の集積と統合した管理が必要。それが実現すればディープラーニングとAIの幅広い活用が可能。ってことはもうひしひしと感じました。
デジタルマーケティングな観点で見ても、マーケティングの一連の流れを統括して情報の集積と管理したもん勝ちですしね。
「日本はもっとデジタルだと思ってたけど、アナログなとこ結構あるよね」とPhilipも言っていましたが、確かにそうなんですよね。
Reactive Inc.の開発スタイルでもある『アナログを否定せず、尊重しながら新しい技術で利便性をより高める』にも現れてますが、僕らはもっと彼らから多くを学ぶべきかもしれない。なんて偉そうなことを考えてしまいました。
紹介したサービスの公開時期、規模等の情報はまだわかりませんが、実装されればきっと新しい体験をさせてくれると思います。
期待ですね。