「エンジニアは3年で転職する」は本当？ AI技術で進む転職サービスの新しいカタチ

2018年03月20日

村山早央里

日本では近年、毎年約300万人が転職をしている。実際に行動に移さなくても、転職を考えながら二の足を踏んでしまう転職希望者も多いだろう。一方で、企業も社風や条件にマッチする人材を待ちわびているもの。なかなか企業側のニーズに合致する求職者が集まらず、人事担当者が頭を抱えているケースも珍しくない。

このような悩みを解決するために誕生したのが、AIヘッドハンティングサービス「scouty」だ。運営企業である株式会社scoutyは、TechCrunchTokyo2017のスタートアップバトルのファイナリスト。日本マイクロソフト賞、IBM BlueHub全力サポート賞などを受賞した、今注目のスタートアップ企業だ。「AIがヘッドハンティングする」とは、どういうことなのか。サービスの開発背景から、マッチングの仕組み、そしてAIが採用に与える影響について、同社代表の島田さんに話を伺った。

株式会社scouty　代表取締役　島田寛基さん
京都大学で人工知能・マルチエージェントシステムを専攻。2016年エディンバラ大学院で人工知能修士(MSc in Artificial Intelligence)を修了。Google,Incubate Fundで新規事業立ち上げを経験し、2016年株式会社scoutyを創業。

「働くことのミスマッチをなくす」

──scoutyとはどんなサービスですか？
働くことのミスマッチをなくすためのHRサービス【※1】です。インターネット上の人材の情報を自動収集し、機械学習【※2】と統計的自然言語処理などにより各人の履歴書に代わるものを自動的に作成します。それを見た企業は、自社の採用要件にマッチする候補者を検索し、ヘッドハントができる、という仕組みです。現段階では、アウトプットがネット上に可視化されやすいウェブエンジニアを対象にしています。
※1 Human Resourcesサービス。主に採用・人事関連のサービスを指す。
※2サンプルとなるデータをもとに、ルールや知識を自ら学習するもの。 AIを支える主要な技術の1つ。

そもそも、求職者にとっては、自分に合っている企業を見つけること自体が大変な作業。一番理想的なのは、何もしなくても自分の希望条件とマッチする企業からスカウトが来る状態でしょう。現代社会で似たような仕組みを提供しているのが、エージェント型の転職サービスですね。一人ひとりにエージェントがつき、ヒアリングをした上でオススメの企業候補を教えてもらえます。

しかし、世界中の全員がエージェントから紹介を受けるのは、現実的ではありません。専門職でもジェネラリストでも、相手の仕事と職能を理解したエージェントはごくわずか。そもそも、人が相手を完全に理解することはできないのではないかという問題もあります。そこで、エージェントがしているように求職者と企業候補を事前に評価し、AIが相性次第でマッチングするものだと考えれば、「ヘッドハント」の自動化のモデルを描けます。

今後、エージェントは求職者の転職意欲を高めたり、キャリアプランの相談に乗ったりするなどのコミュニケーションが必要な仕事を行い、単純な作業である「求職者にマッチした企業の提案」部分はAIに代替されるべきだと考えています。

scoutyのビジネスモデル

ユーザの関心を自動収集し解析

──scoutyではAI技術で、どのようにマッチングさせているのですか？

scoutyで使っているのは、機械学習や統計的なデータ解析、自然言語処理といった分野の技術です。たとえば退職時期を予測する場合、個人と所属企業の特徴（勤続年数など）から独自のスコアリングをしています。本人の退職確率分布を機械学習で予測し、その人の退職する時期を算出するのです。

現在、scoutyでは主にスキルでのマッチングをしています。求職者がウェブエンジニアの場合は、その人がどういう種類のコードを書いているか、ブログの投稿内容はどうか、どのくらい「いいね！」がついているかといったデータを収集・解析し、スコア化します。そこから個人が特定できない形に成型し、企業とマッチングするポイントがわかるレポートにまとめる作業まで、システムで自動的に行います。

ユーザー企業に渡るエンドユーザーの情報。実名が紐付かない形式にまとめられている。自然言語処理や統計処理をした結果、エンドユーザーのスキルや興味分野、キーワードが表示される

具体的に使用しているのは、TF-IDF【※3】という方法の応用技術で、頻出単語を仕分けしています。TF-IDF自体は自然言語処理の中ではメジャーな手法です。たとえば、SNSの投稿を収集していると、上位になる単語は「私」や「今日」といった一般名詞となりますが、このような単語は、本人を特徴づけることには役立ちません。そこで、「この人はよく使うが、一般的には使われにくい単語」を抽出します。

加えて、「機械学習」というスキルを持つ人にたどり着きやすくなるよう、検索精度を上げるために、それを英語にした「Machine Learning」という同等・関連するスキルが自動付与されるようにします。英語圏の人がMachine Learning と検索をかける時はつまり「機械学習」ができる人を求めているわけですから。

さらに、自動収集された「Python」「R」「情報検索」といった近い領域のスキルが見えるようにします。キーワードとの類似度を計算したり、それでも入ってくるノイズを取り除くための辞書を作ったりと、幅広い検索キーワードの表記揺れや表現の違いに対応できるようにしています。自然言語処理としてはレガシーな手法も組み合わせて解析しているのです。
※3 文書中に含まれる単語の重要度を評価する手法の1つ。

scoutyのサービスブログ「scouty AI LAB」で公開している自然言語処理の基礎の説明（画像提供：scouty AI LAB）

ユーザーのスキルをスコア化

ユーザーのスキルはスコア化されます。スコアはまず、エンドユーザーのスキルを3つにカテゴライズし、計測しています。観点は「E（技術力）」「B（ビジネス力）」「I（インフルエンス力）」です。

E：SNSやGitHubで公開しているコードの量やOSSへのコミット経験、参加した勉強会といったイベント参加率
B：職歴（経験年数、マネージャークラスのポジション経験）
I：フォロワー数、フォロー数と被フォロー数の比

自社とのマッチング度合いや退職予想時期といった情報を教えてくれる。スコアは正規分布に当てはめる形で相対評価を行う

現在は機能改善として、SNSに上がっているコードの質を測定する仕組みを開発中です。たとえば、コードにはReadmeと呼ばれるコードの設計書を添付しますが、これを機械学習で解析したところ、Eスコアの高低でその内容には明らかな差がありました。低い人はほとんど何も書いていないか、書いていたとしても1行程度。Eスコアの高い人はまず分量が多い。そういった特徴が如実に表れる指標を見つけました。

あとは、コードのワーニング（間違っているか否か）を自動で出してくれる「Linter」というツールを適用すると、コードのミスの数を拾うことができます。コードスメル（関数の長さ、変数の命名方法、コードの繰り返し構造の深さといった個性）をたくさん集めると、コードの質を表す特徴になるはずです。良いコードを識別する分類器をつくり、書き手のEスコアに反映させることも考えています。

退職時期をAIで推測

──先ほど、AIで退職時期まで予想できるとおっしゃっていましたね。

退職の時期は、職種と会社の成長ステージごとに異なります。これは、オープンデータを解析することでわかりました。

一般的に「エンジニアは3年で転職する」といわれています。恐らく各HRサービスで培われた経験からいわれるようになった言葉でしょう。私たちは退職時期を、インターネットでオープンになっている情報から解析。AI分野の技術的に言えば「ビッグデータ活用して特徴を学習させ、予測した」というところです。

「scouty」のアルゴリズムで割り出した職種ごとの勤続年数分布（画像提供：scouty AI LAB）

上の図のように、実は、エンジニアだけでなく人事・採用職とマーケター職も、3年目までに7割以上が辞めています。一方でCEOやCOO、CTOといった経営層の流動性は低いです。

会社のステージ別で解析すると、設立20年以上の会社では1年未満でで辞める人が15％、2年が10％です。一方、アーリーステージやスタートアップの会社では2年程で半分の人が辞めています。ほかにも、会社の規模（従業員数）でも違うデータが取れました。

このように個人・所属企業によって変わる退職年数を解析することで、予測対象の個人の退職確率を統計的な手法で解析しています。さらにSNSなどのつぶやきから取得した「辞めたい」や「つらい」などの転職しそうなワードの頻出度などを統合することで、退職時期を総合的に予測しているのです。

課題は、SNSを使わないエンジニアの発掘

──かなりSNSを重視されていますが、SNSを使わない優秀なエンジニアを見つけることはできますか？

その点は、scoutyで現在取り組んでいる課題の1つです。隠れたエンジニアでも、大学を卒業するときに論文を書いたり、イベントに参加したりしていれば、イベントページの参加履歴に記録が残ったりしているので、クロールで発見するところまでは容易です。課題は、そういった情報を構造化することにあります。

日頃のアウトプットでスキルを評価する

――転職サービスは数多く存在します。何が強みでしょうか？

従来の転職サービスとの違いは主に2点。1つは自己評価ではなく、どれだけアウトプットを出してきたかで評価する点です。

たとえば、求職者が企業にアピールするためには、履歴書に「Python経験3年」「3社目」と書くだけでなく、本当にスキルがあるどうかを面接や試験でアピールする必要がありました。しかし、企業としても、求職者のスキルを自分たちで評価するのは労力がかかります。一方、scoutyでは、ウェブエンジニアの日頃のアウトプットをもとに評価します。企業にとっては、年齢や社歴によらず、優秀な人を幅広く集めることが可能です。

2つめは、非登録型であるところ。従来の転職サービスは転職したい人が登録しますが、scoutyは違います。SNSなどでアウトプットを出している人ならば、自動的にデータベースに入ります。なので、一般的な転職サイトのように自分自身で職務経歴や履歴書を登録するエントリーという概念がありません。

サービス制作のきっかけは、友人の就職ミスマッチ

──画期的なサービスだと感じました。なぜ作ろうと思ったのでしょう。

きっかけは、友人が新卒で入社した企業と本人とが、僕から見るとミスマッチだったことです。優秀でデザインのセンスもあり、記事を書けばバズる才能を持つ彼が、大手広告代理店に就職し、深夜までExcelをいじる社会人生活を送っていました。日本の企業は、本人が中堅社員に通用する能力を持っていようとそうでなかろうと、新卒で就職すると雑用をさせる慣例があるようですね。もし就職活動中に、デザインをしたりブログを書いたりするような企業からのスカウトがあれば、彼はそちらを選んでいただろうと思います。

人は自分が知っている選択肢の中で選択します。選択肢を増やす作業は体力がいるもの。ここが原因で、就職先とミスマッチになっている人は割と多いのではないかと疑問を抱きました。そこで、インターネット上にあるデータを使えば、人手に頼らずにスケーラブルな形でミスマッチを解消するシステムが作れるのではないか。より良い環境や職場に関する未知の情報を届けられるのではないか、と着想しました。

また、scoutyでスカウトを受けても、最終的な決断は各個人に委ねられます。今の職場でがんばりたいなら続ければいいし、不満があるなら次に行けばいい。そういう良い選択肢をどんどん提供し続ければ、企業側も自社に合う人材の採用が簡単になります。さらに、今いるメンバーに残ってもらうために、人を大事にする環境をつくろうとするカンフル剤にもなり得ると考えています。

自分の情報を知られることに抵抗感のある人もいる

──サービスとして展開する中で失敗したことはありますか？

一般的な転職サイトと比べて、scoutyはエンドユーザーからの返信率が圧倒的に高いことが特徴です。スカウトメールを送ると約30％から返信があります。サービスにもよりますが、一般的な転職サイトの返信率は数％であるともいわれています。

そして、返信内容の多くは、自分のコードを見てもらえたことを喜んでいたり、スカウトメールを初めてもらって驚きつつも、人事との面談を楽しみにしていたりといった好意的なもの。ただし、中にはどうして自分の情報を知っているのかと戸惑い、連絡してこられる方もいます。我々はインターネットで公開されている情報を合法的に取得し、ユーザー企業へデータを渡すときも個人情報保護法を守っています。それでも、謎の名簿業者と思われてしまうことがあるようですね（苦笑）。

──オープンな情報から連絡しているのに、戸惑われる方もいるのですね。

そういった方も、違法なサービスだと主張しているわけではありません。自分の情報を知らないうちに取得されていることへの抵抗感があるのです。そこはAI技術の会社としてもHRサービスの会社としても、向き合わなければいけない問題だと捉えています。なので可能な限り、情報のソースやエンジニアとしての技術的なところ、HRサービスとして得た知見、scoutyの想いといったものをオープンにすることで、エンドユーザーからの信頼を得られるように努力しています。

ユーザー企業に対しても手厚くサポートをしています。スカウトメールは1通1通を候補者に合わせて執筆し、テンプレートで送らないようにお願いしています。送信前に弊社ですべての内容をチェックし、もしテンプレートのままなら送信をキャンセル。ここまでしているので、1日で送れるメールには限りがあります。ユーザー企業としても弊社としても工数がかかっているわけですが、scoutyの返信率が約30％と高いため、その分をカバーできます。

scoutyを導入したてのユーザー企業に対しては、最初の1カ月間は毎週必ず訪問することにしています。ユーザー企業の担当者と一緒にスカウトメールを書き、内容を見せてもらって直してフィードバックするのを毎回繰り返します。そうして慣れてもらい、チャットベースでのリモートのやりとりに移ります。

将来的にはユーザー企業とのナレッジの共有もシステムで効率化、自動化したいです。scoutyのプロダクトとしてのレベルはまだまだ成長途中なので、社内にカスタマーサポートを行うチームを作り、こちらも人の力で対応しています。良いメールがエンドユーザーに届けば、きっと喜んでくれる。そうして、良い転職ができたという体験をユーザーにしてもらいたいです。

──今後の展望を教えてください。サービスとしてはいかがでしょうか？

やりたいことは2つあります。1つ目は候補者に対してその人のスコアと情報を公開すること。たとえば「技術力の高い会社からのスカウトが欲しければ、○点以上じゃないと難しい」と言える裏付けはもう取れているので、何をがんばればその人の価値観にあった求人が来るのか、年収に結びつくのかを提案できるサービスにしたいです。

2つ目は、人柄や社風といった能力以外の部分でのマッチングもできるようにすること。今はキーワードでマッチングすることができます。たとえば、ある企業の社員と共通の友人が多い傾向があれば、カルチャーという1つのマッチングポイントになる。社員と共通の友人がいなかったとしても、たとえば人々が大手SIerを2社経験した後で中小ウェブ企業へ行く傾向があるとわかれば、隠れた相関性が発見できるかもしれません。そうしてユーザー企業のカルチャーを解析し、どんどん定量化れきればな、と。

──今流行りのAIでウェブサービスを作り、実際に運営してみて気づいたことはありましたか？

顧客に価値を届けるには、必ずしも最新の手法である必要はない、ということが一番の気づきでした。価値を提供できればAIである必要もありません。実はAIを使うと、大量のデータ収集や特徴の設計といった地道な努力が必要になるので、既存の手法で結果を出せれば一番楽です。しかし、どうしても既存の手法では解決できない問題もあるので、そういうときはAIのような新しい手法を使う、という程度に考えています。

──AI技術開発を牽引する立場としてはいかがでしょうか？

課題は、オープンなところにある情報が使われることに対する世間の心理的な壁をなくすことです。5～6年前、SNSで実名を出すことへの抵抗感は今よりもっと強かった。今ではFaceBookに実名で登録している人も増えました。そう考えると、今から5～6年先はオープンデータを使ったサービスがもっと当たり前になっていると思います。

でも、急進的な変化に感じる人もいるでしょう。そうした方から批判が出るのは仕方ないと思っています。私たちがエンドユーザーである転職候補者に対して、今より年収の上がる環境、好きなことを仕事にできる環境、自分の隠れた才能が活かせる環境を提案し続けることで、世間から受け入れてもらえるようになったらいいなと思っています。

編集：ノオト