AIやデータ分析の分野では、毎日のように新しい技術やサービスが登場している。その中にはビジネスに役立つものも、根底をひっくり返すほどのものも存在する。本連載では、ITサービス企業・日本TCSの「AIラボ」で所長を務める三澤瑠花氏が、データ分析や生成AIの分野で注目されている最新論文や企業発表をビジネス視点から紹介する。
大規模言語モデル(LLM)の「忠実さ」を向上させるために、AIを用いて多様で複雑なインストラクションデータを自動生成するアルゴリズム「Evol-Instruct」(エボルインストラクト)が注目を集めています。2023年に発表された論文ですが、2024年5月の1カ月だけでも本論文を参考文献として取り上げた25本の論文(プレプリントを含む)が世界中の研究者によって新たに投稿されたことからも、注目の高さがうかがえます。
Evol-Instructは、人手を介さずに高品質なインストラクションデータを効率的に生成することでLLMの高度化に貢献します。本稿では、Evol-Instructの仕組みと意義について解説します。
LLMの命令に従う能力の向上が課題に
LLMは大量のテキストデータから言語の特徴を学習することで、自然言語処理のタスクで高い性能を発揮します。しかし、実際のアプリケーションへの適用においては、ユーザーから与えられる多様な命令(インストラクション)に正しく従うことが求められます。この命令に従う能力を高めるために、インストラクションデータを用いたLLMの学習(ファインチューニング)が盛んに行われています。
インストラクションデータは人手で作成されてきました。初期の研究では、機械翻訳や文書要約など特定のタスクに特化した「クローズドドメイン」のインストラクションデータが使われていました。しかし、クローズドドメインのインストラクションデータは多様性に乏しく、実際のユーザーからの指示への対応が難しいという問題がありました。
その後、OpenAIが人手で作成した多様な「オープンドメイン」のインストラクションデータを用いることで、GPT-3などの高性能モデルが開発されました。しかし、高品質なインストラクションデータを人手で大量に作成するのはコストと手間がかかるため、よりスケーラブルなデータ生成手法が求められていました。
Evol-Instructではこれをどのようにして解決したのでしょうか。
Evol-Instructの仕組み
Evol-Instructは、AIを用いて多様で複雑なインストラクションデータを自動生成するアルゴリズムです。このアルゴリズムは、既存のインストラクションデータを基に新たなデータを生成することで、多様性と品質を両立させています。具体的には、以下のステップで動作します。
- データ収集: 既存のインストラクションデータを収集し、これを基に新たなデータ生成のためのベースラインを構築します。
- データ変換: 収集したデータを多様な形式に変換し、異なるタスクやドメインに対応できるようにします。
- データ生成: 変換されたデータを基に、新たなインストラクションデータを生成します。この際、AIが自動的にデータの品質を評価し、最適なデータを選別します。
- データ評価: 生成されたデータを評価し、必要に応じて修正や再生成を行います。
このプロセスにより、Evol-Instructは高品質で多様なインストラクションデータを効率的に生成することができます。
Evol-Instructの意義
Evol-Instructの最大の意義は、LLMの忠実さを向上させる点にあります。従来の手法では、人手でインストラクションデータを作成するため、コストと時間がかかる上に、多様性に乏しいデータしか得られませんでした。しかし、Evol-Instructを用いることで、これらの課題を解決し、よりスケーラブルで効率的なデータ生成が可能となります。
また、Evol-Instructはビジネスにおいても大きな影響を与える可能性があります。例えば、カスタマーサポートや自動応答システムにおいて、より正確で多様な応答が可能となり、顧客満足度の向上が期待されます。さらに、教育や医療などの分野でも、より高度なAIアシスタントの開発が進むことで、サービスの質が向上するでしょう。
結論
Evol-Instructは、LLMの忠実さを向上させるための革新的なアルゴリズムです。多様で高品質なインストラクションデータを自動生成することで、LLMの性能を大幅に向上させることができます。これにより、ビジネスや社会におけるAIの応用範囲が広がり、より高度なサービスが提供されることが期待されます。今後もEvol-Instructの進化とその応用に注目が集まることでしょう。