AIに関わる膨大な調査データを網羅した「AI Index」2019年版が公開

スタンフォード大の研究者らが、AI関連の研究開発や経済、教育、各国の動向など多様なデータをまとめた「AI Index」の2019年版を発表している。

The AI Index 2019 annual report(外部サイト)

AI Indexとは?

AI Indexは毎年発行されている、以下9つのチャプターからなるレポートだ。

研究開発

ジャーナル、会議、特許の出版物の量や世界地域による引用の影響など、計量書誌学のデータ。主要なAIソフトウェアライブラリに付けられたGithubのスター数や、arXiv上のAI研究者の性別の多様性についても紹介している。

カンファレンス

AI関連のカンファレンスに関するさまざまなソースからデータの概要を示す。具体的には、イベントへの参加、会議のトピックの概要、および達成されたポリシーマイルストーンについて説明されている。

技術的パフォーマンス

計算能力の向上による、コンピュータービジョン(画像、ビデオ、画像+言語)、自然言語、潜在的な制限(Omniglot Challengeなど)、などのタスクの技術的な進歩を追う。

経済

仕事、投資、企業活動の3つのトピックを扱う。AI関連の仕事、求人、およびスキルのレベルに関連するグローバルおよびアメリカのデータや、世界、国、セクターごとのスタートアップ投資動向を分析する。最後のセクションには、業界でのAI機能の採用に関するデータや、各国のロボット導入状況の世界的な傾向なども含まれる。

教育

教育とAIの動向を調査する。具体的にはAI・機械学習関連の教育でのグローバルデータの分析と、AIのPhDを持つ人材の性別、多様性の傾向なども含んでいる。また、倫理をコンピューターサイエンスのカリキュラムに組み込む取り組みや、入門的なAI・機械学習コースにおける学部入学者の世界的な傾向なども調査している。

自律システム

自律型車両(AV)および自律型兵器(AW)のデータを分析している。AVをテストしている国と都市や、自律兵器の展開も紹介。

社会的認識

中央銀行、政府、企業などの機関のAIに対する認識についてカバー。中央銀行がAIについてどのような情報発信を行っているのか、アメリカ、カナダ、英国議会でのAIへの言及回数の調査、アメリカの業績発表で言及されたAI関連の用語、AI関連のフレーズのアメリカの検索データなどを調査している。

社会課題

AIと倫理に関するグローバルニュースや、サステナブルな開発のためのAIアプリケーションを検証。AIの倫理ガイドラインに着目し、倫理的な課題におけるデータを提示、AIの倫理的な使用に関するニュース報道も調査している。AIのユースケースをSDGsにもマップしている。

国家戦略とAIの活気

各国が発行したAIに関する戦略文書を調査している。

レポート内で注目のデータ

この記事でレポートを詳細に読み解くことはしないが、リリース文で紹介されている、レポートのなかで注目すべきデータを紹介する。

  • 1998年から2018年の間に査読済みのAI論文の量は300%以上増加し、査読済みのすべてのジャーナル出版物の3%、および発表された会議論文の9%を占めている。
  • 中国は現在、2006年にアメリカで通過した同数のヨーロッパのAIジャーナルと会議論文を毎年発行している。アメリカのFWCI(Field Weighted Citation Impact…一文献あたりの被引用数を同出版年、同分野、同文献タイプの文献の世界平均で割ったもの)は中国の出版物よりも約50%高くなっている。
  • 国際会議への出席者は大幅に増え続けている。2019年には、NeurIPSの参加者は13,500人を数え、2018年に比べて41%、2012年に比べて800%以上増加。AAAIやCVPRなどの会議でも年間参加者は約30%増加している。
  • WiMLワークショップの参加者は2014年の8倍、AI4ALLの同窓生は2015年の20倍。これらの増加は、AI分野の女性や少数グループを包摂するための継続的な努力を反映している。
  • 1年半で、クラウドインフラで大規模な画像分類システムを学習させるのに必要な時間が、2017年10月の約3時間から2019年7月の約88秒に短縮された。また、そのようなシステムを学習させるコストも同様に下がった。
  • SuperGLUEおよびSQuAD2.0ベンチマークで捕捉されたように、いくつかの自然言語処理(NLP)分類タスクの進歩は非常に急速だった。AI2 Reasoning Challengeなどの推論を必要とする一部のNLPタスク、またはOmniglot Challengeなどの人間レベルの概念学習タスクでは、パフォーマンスは低いままだった。
  • アメリカでは、AI関連の仕事の割合は2012年の0.3%から2019年の総仕事の0.8%に増加した。AIの労働需要は特にハイテクサービスと製造部門で増加している。
  • AIスタートアップへの投資は世界的に着実な上昇を続けている。2010年に集められた合計13億ドルから、2018年には404億ドルを超えた(2019年11月4日現在は374億ドル)。
  • 自律走行車(AV)は昨年、世界全体の投資で77億ドル(全体の9.9%)で最大のシェアを獲得。続いて薬物、がん、セラピー(47億ドル、6.1%)、顔認識(47億ドル、6.0% )、ビデオコンテンツ(36億ドル、4.5%)、および不正検出と金融(31億ドル、3.9%)。
  • 少なくとも1つの機能、または事業単位でAIを活用していると回答した大企業は、2018年の47%から2019年には58%に増加した。
  • AIは、大学院レベルでは急速に北米のコンピューターサイエンス博士課程の学生の間でもっとも人気のある専門分野となり、2番目に人気のある専門分野(セキュリティ / 情報保証)の2倍以上の学生がいる。2018年に卒業したコンピューターサイエンスの博士号を持つ人材の21%以上がAI・機械学習に特化している。
  • ジェンダーラインに沿ったAI関連の教育者の多様化は大きな進展を見せておらず、2018年の新規採用者において、女性の割合は20%未満だった。同様に、アメリカでは2010年以降、女性のAI関連の博士過程取得者の割合はほぼ一定だ。
  • 世界中の議会の記録、委員会の報告書、および立法記録において、AI関連の法律が大幅に増加している。
  • 公平性、解釈可能性、説明可能性は、59のAIと倫理の原則に関する文書の中で、もっとも頻繁に言及されている倫理的課題だ。

より簡単にレポートを読み解くためのツールも公開

2019年版の本レポートの情報量は、2018年版の3倍にものぼるという。すべてのデータに目を通すのは至難の業のため、よりレポートを簡単に読み解ける各種ツールも公開された。

各国のAI動向を比較できる「Global AI Vibrancy Tool」

Global AI Vibrancy Tool(外部サイト)」は、3つのディメンション(研究開発、経済、包括)にグループ化された34のメトリクスで比較でき、28か国を対象としている。各国がどれだけAIの活動を行っているかを可視化できるほか、特定の国と各国平均の比較なども可能だ。

サイトより編集部キャプチャ

ArXiv上のAI論文検索エンジン「ArXiv Monitor」

ArXiv Monitor(外部サイト)」は、arXivで公開されている論文の検索エンジンだ。著者やArXivのカテゴリー、データセットなどの項目で論文を絞り込める。

サイトより編集部キャプチャ

ダッシュボード機能では、Metricsからプルダウンでデータセットを選択することで、そのデータセットが利用された論文の出版時期、ArXivのカテゴリー、論文を出している組織、著者などのデータを参照できる。

ImageNetを選択した例。サイトより編集部キャプチャ

Datasets機能では、プルダウンでデータセットを選択することで、データセットごとの総論文出版数、すべての論文における割合、データセット利用の初出時期などのデータを見ることができる。

MNISTを選択した例。サイトより編集部キャプチャ

世界のAI動向を理解する助けに

2018年の3倍と、とてつもない情報量だが、なんとなく眺めているだけでも示唆に富むデータが多い。

もともと政策立案者や研究者、ジャーナリストや経営幹部などに向け、AIに関わる包括的なデータを提供するために立ち上がったプロジェクトだ。メディアはもとより、研究者が論文にデータを引用する際や、企業内で参照するデータとしても有用だろう。レポートに使用されているすべての生データは、Googleドライブ(外部サイト)で公開されている。グラフィックスフォルダには、すべてのグラフ・チャートで高解像度の画像も用意されている。

AI関連の仕事に携わる人なら、一度は目を通してみるといいかもしれない。

Source:
Introducing the AI Index 2019 Report
The 2019 AI Index report

なぜデータ活用・AI導入がうまくいかなかったのか レッジとDefinedCrowdが無料セミナーを2月19日に開催

株式会社レッジとDefinedCrowd Japan 株式会社は2月19日(水)に、データ活用やAI活用に取り組んだことのある企業を対象としたセミナーを開催します。

セミナー概要

  • 日時:2020年2月19日(水) 14:00~17:00(13:45 受付開始)
  • 会場:〒141- 0031 東京都品川区西五反田1-17-3 plaza square五反田 4階
  • 対象:データ活用やAI活用に取り組んだことのある企業(同業者様はお断りさせていただく可能性がございます)
  • 定員:30名
  • 参加費:無料
  • お持ち物:お名刺2枚
タイムスケジュール

  • 13:45~14:00:受付
  • 14:00~14:50:<講演1>データ活用/AI導入 やってみたけどうまくいかないのはなぜ?
  • 14:50~15:40:<講演2>AIの品質が決まる!教師データ作成の最前線
  • 15:40~16:00:質疑応答
  • 16:00~17:00:懇親会、相談会

精度が上がらず成果が出ない、そんな課題はありませんか?

2015年頃から、多くの企業がデータ活用に向けたさまざまな実証実験を進めています。

最近では、企業による成功例の発表も増加傾向にあり、データ活用はさらなる盛り上がりを見せています。その反面、公表されることは少ないですが、成功事例よりも多くの失敗事例が生まれているのが現状です。

「他社が成功させているプロジェクトを自社でも実施した結果、失敗に終わってしまった」といった相談が増加していることから、セミナー開催に至りました。

セミナー終了後には懇親会の時間を設けておりますので、課題をお持ちのご担当者様がおられましたら、お気軽に懇親の場でご相談いただけますと幸いです。

失敗事例を交えつつ正しいアプローチの仕方を紹介

講演1では、「データ活用/AI導入 やってみたけどうまくいかないのはなぜ?」がテーマです。

AI導入やデータ活用に取り組むも、なかなか精度が上がらず成果が出ない。そんな課題をお持ちではありませんか? 本当に成果がでないケースもありますが、残念ながら正しいアプローチができていないために、うまくいかないケースも多いようです。データの準備の仕方や分析手順といった基本的なステップを理解することで解決することも多く、非常にもったいないと思います。

そんな課題について、よく陥りがちな失敗事例を交えつつ、正しいアプローチの仕方をお伝えします。

>> セミナー参加申し込みはこちら

教師データ作成における世界の最新動向とは?

今、世界の先進的なAI企業では、AIの基礎栄養素でもあり、 かつ高度で実用的で役立つAI開発に必要な入力要素でもある、「データ」に着目しています。そこで「AIの品質が決まる!教師データ作成の最前線」を講演2のテーマとして、世界の動向とともに自社サービスを実例とともに紹介いたします。講演するのはDefinedCrowd Japan 株式会社 General Manager of Asia-Pacific アヤ・ズーク氏。

データの在り方で、AIの開発期間や 結果に大きな違いがあることが認識されています。日本企業にヒアリングを重ね、社内に眠っている宝の山(データ)の活用が大きな課題であると理解されている一方、 手がけていくための準備はこれからという企業が多くを占めていることがわかりました。

企業が抱える宝の山を掘り起こしブラッシュアップしていくことで、機械学習の質を高め、AIの発展への貢献をDefinedCrowdは目指しています。今後のAI産業の発展を支える、 データの質の重要性に気づいていただきたいと思い今回のセッションを開催いたします。

>> セミナー参加申し込みはこちら

講演者紹介

株式会社レッジData Strategy dept. Data Scientist
吉永辰哉


パッケージソフトウェアベンダーでセールスを4年経験した後、データサイエンスをイチから学び、データ分析専門のコンサルティング会社へ転職。
アナリストとして、ビッグデータの解析業務を経験。その後、富士通コミュニケーションサービスにて、カスタマーエクスペリエンス(CX)向上をテーマとしたデータ分析やAIチャットボットの導入支援を経験。レッジ参画後はAIコンサルやデータ分析など幅広く担当する傍ら、AIエンジニアリングスクールの講師としても活動。

DefinedCrowd Japan 株式会社 General Manager of Asia-Pacific
アヤ・ズーク


2006-2016 マイクロソフト本社でMSN・サーチ事業プログラムマネージャー後にスタートアップ支援プログラム立ち上げメンバー。2017 DefinedCrowdで事業開発総合責任者、CMOを担当。2018同社でアジアパシフィック、ジェネラルマネージャーに就任。

セミナー概要とタイムスケジュール

セミナー概要

  • 日時:2020年2月19日(水) 14:00~17:00(13:45 受付開始)
  • 会場:〒141- 0031 東京都品川区西五反田1-17-3 plaza square五反田 4階
  • 対象:データ活用やAI活用に取り組んだことのある企業(同業者様はお断りさせていただく可能性がございます)
  • 定員:30名
  • 参加費:無料
  • お持ち物:お名刺2枚

タイムスケジュール

  • 13:45~14:00:受付
  • 14:00~14:50:<講演1>データ活用/AI導入 やってみたけどうまくいかないのはなぜ?
  • 14:50~15:40:<講演2>AIの品質が決まる!教師データ作成の最前線
  • 15:40~16:00:質疑応答
  • 16:00~17:00:懇親会、相談会

注意事項

※定員を超過した場合は抽選とさせていただきます
※セミナー開始後の途中入場は出来ませんので、ご注意ください
※法人様対象のセミナーのため、個人でのお申し込みは受け付けておりません
※主催企業と事業が競合する企業からのお申し込みは、お断りする場合がございます
※プログラム及び登壇者は事前予告無しに変更する場合がございます

AIによって「高糖度トマト」の生産に成功、低負担かつ安定栽培へ

株式会社Happy Qualityは2月5日、静岡大学との共同研究である、AI(人工知能)の判断に基づく灌水(かんすい)制御によって糖度トマトを高い可販果率での生産成功を発表した。

プレスリリース(PR TIMES)

高品質・高機能な農作物を誰でも安定的に栽培へ

トマトは栽培過程で適度な水分ストレスを与えることで高糖度な果実を栽培できることが知られているそうだ。

そこで2017年度に植物の水分ストレスは植物のしおれ具合から把握できると仮定。低解像度の草姿画像や温度、湿度、明るさといった比較的収集の容易なデータを使用して、植物の茎の太さ(茎径)の変化量を高精度に予測するAIの研究開発に成功した。

2018年度の共同栽培実験では、AIの判断に基づく灌水制御によって高糖度な中玉トマトを低負担かつ大量安定生産できることを実証した。

そして研究開発と実証実験の結果、AIの判断に基づいた灌水制御では平均糖度9.46の高糖度トマトを、バラつきを抑えて容易に栽培できることを示した。さらに、急な天候変化に追従した適切な灌水制御によって、従来の日射比例方式による灌水制御に比べ果実の裂果を大幅に減らし、高糖度トマトを高い可販果率(95%)で生産できることも確認している。

中玉トマト低段密植養液栽培実験の結果

中玉トマト低段密植養液栽培実験の結果

Happy Quality社では、AIなどのテクノロジーを活用することにより高品質・高機能な農作物を誰でも安定的に栽培できる栽培技術の確立を目指している。これには高齢化に伴う農家の減少、新規就農者が技術の未熟さゆえに低所得を脱却できないといった農業界における社会課題を実感していたからだそうだ。

ちなみに、Happy Quality社が販売するトマト「Hapitoma」は、光センサー選果機によって一粒ずつ糖度・形・リコピンを計測、選別し、厳しい基準をクリアしたトマトという。リコピンは通常のトマトの2倍以上のもののみを採用し、糖度別に6度から10度のラインナップを用意。お好みに合わせて選べるとのこと。

>>株式会社Happy Quality

ドローンを使って畑の見回りと農薬散布

2018年にLedge.aiはキャベツ収量予測の実証実験を進めるスカイマティクスに対して取材している。同社が実施しているのはドローンで上空からキャベツを撮影し、膨大な量の画像をつなぎ合わせてAIで解析。将来的にはキャベツの育成状況から収量の予測を目指すプロジェクトだ。

上空から撮影した写真をつなぎ合わせ、圃場全体を1枚の高解像画像にまとめる。キャベツを1個ずつ分析できるほど解像度に仕上がるので、育成状態が悪いエリアなどの判別も容易。しかも圃場巡回の時間も削減される。

育成状況を把握したことで、これまで「勘頼み」だった収穫予測などにも役立てられるそうだ。

コロナウイルスの感染状況をツイッターなどで監視し人工知能が分析

※画像はイメージです。出典:ぱくたそ

株式会社Spectee(スペクティ)は2月6日、TwitterやFacebookなどのSNS情報をもとに新型コロナウイルスによる肺炎の広がりを解析するシステムを開発したと発表。あわせて、関係機関に納入したことを明かした。

SNSで新型肺炎の広がりまでを検知

プレスリリースには

新型コロナウイルスの感染の拡大をうけ、複数のSNSから情報をリアルタイムに収集・解析し、発生場所を特定、また中国語など複数の外国語の投稿も日本語に自動翻訳し、関係機関に情報提供するシステムを開発しました。現在、同システムは、関係機関と協力し、より精度を上げるため日々アップデートを進めています
>>プレスリリース(外部サイト)

と記されている。

スペクティでは、SNSをリアルタイムに解析し、災害情報・危機管理情報を抽出、配信するサービスを展開している。すでに官公庁や地方自治体、民間企業など国内約300社以上に提供しているという。

また、同システムの利用を希望する法人企業、自治体、官公庁、公共機関からの問い合わせ窓口は以下となっている。
※個人向けの提供はしていない

お問い合わせ受付(外部サイト)
https://spectee.co.jp/contact/

スペクティは、「AI防災協議会」への参画や東京都の「先進的防災技術実用化支援事業」に選ばれている。同プレスリリースによれば、AIを活用した防災・危機管理情報解析ベンチャーとして、技術開発を進め、多くの企業・自治体の危機管理をサポートしていくとのこと。

>> 株式会社Spectee

SNS投稿を解析して「香り」を作る取り組み

2019年6月に株式会社コードミーは、テキストマイニングでキーワードを抽出し、自分専用のアロマを作れるサービスを発表した。

これはTwitterの投稿200件ぶんの内容から、深層心理をあぶりだすことで「香り」に反映させるというもの。

SNS投稿からキーワードなどを抽出するのは、もはや一般的な言語処理技術だ。そこにコードミーが独自に開発したアルゴリズムを組み合わせ、SNS投稿やユーザーの基本情報から香りを作り出しているそうだ。

「収集もするし整備もする」AIプロジェクトにおける影の立役者・データエンジニアの仕事に迫る

昨今、自社のデータを活用して、分析やAI開発に取り組もうとしている企業は多い。しかし、それらの試みが一足飛びに上手く行くケースはほとんど見ない。データ活用プロジェクトにおいては、さまざまな観点から用途に合わせた事前準備が必要となるためだ。

事前準備におけるエンジニアリング業務を担うのが「データエンジニア」という職種だ。データサイエンティストがAI開発を行う際や、データアナリストがデータ分析を行う際に、すぐに作業に取り掛かれるような環境を整備することがデータエンジニアの役割となる。

そこで今回は、株式会社富士通クラウドテクノロジーズのデータエンジニアである尾崎健太氏に、データ活用プロジェクトにおける必要な事前のプロセスについて、同氏による実際の案件での経験も踏まえて寄稿してもらった。

適切なデータ活用のためには「用途に応じた整形」が必要

Photo by Markus Spiske on Unsplash

AI開発やデータ分析を行う際には、利用するデータがきれいに整った状態であることが必須条件となります。データエンジニアの業務において、データの整形は、必ずどのような案件でも求められる重要なタスクと言えます。

たとえばAI開発案件の場合、利用するデータのなかに欠損している値や、表記揺れしている文字列が存在している場合、整形を施さなければ、AIの精度が著しく低くなってしまいます。

また、データ可視化のためのダッシュボードを開発するような案件では、表示を高速化するために、元のデータをそのまま使うのではなく、情報を集約した必要最小限なデータテーブルを作成する必要があります。このように、用途に適した形でデータを事前に整形することが、データ活用プロジェクトのプロセスにおいては大切になります。

データの整形を完了するためには、このようなエンジニアリング業務だけではなく、関係者とのコミュニケーションによる調整も必要となります。

ほとんどの案件においてよくあるケースは、お客様からお預かりしたデータの一部において意味が不明瞭であり、確認のためのやり取りが発生することです。AI開発やデータ分析においては、利用するデータの取捨選択が非常に重要となるため、不明な点は担当者に都度確認を取りながら進めていきます。

また、データ可視化の案件においては、担当者が確認したい指標やディメンションを作成するために、どのデータを利用する必要があるか事前に確認することが、認識の相違が生じたまま開発が進行することを防ぐためにも、大切なプロセスとなります。

事前に多くのデータを収集できることがプロジェクト成功の鍵

Photo by NASA on Unsplash

より効果的なアウトプットを行うために、新しくデータを収集して追加する作業もデータエンジニアリングにおける重要な作業です。

具体的には、オープンデータを活用し、AIや分析の精度向上を図ることが多いです。APIが公開されている情報であれば、比較的容易にそれらのデータをプロジェクトに取り込むことができます。そうでない場合はWeb上に公開されているページやファイルをスクレイピングして情報を収集します。しかし、それらの作業には大変多くの工数が必要となります。

そのような課題を解決するため、富士通クラウドテクノロジーズでは取得に手間がかかる情報を、すぐにデータ分析が可能な形式で提供するサービスを行っています。

コスト最適化のためには、データ基盤に関する知識も重要

Photo by Annie Spratt on Unsplash

データそのものを扱う業務だけではなく、データ基盤の選定や構築も、データエンジニアの重要な仕事です。

たとえば、分析や可視化のプロジェクトにおいては、データ集約基盤としてデータウェアハウスを構築する事が多いです。このようなケースでは、プロジェクトの初期段階で、今後予想される利用状況に適したサービスを選択することが非常に重要となります。「いつも使っているクラウドサービスだから」などの安易な理由で選択をしてしまうと、後々、利用数が増えてきた際に負荷に耐えられなくなり、プロジェクト全体のボトルネックとなるケースがあります。

一方、AI開発や、AIアプリケーションを稼働させるプロジェクトにおいては、演算を行うためのコンピューティング基盤の選定が必要となります。直近で私が携わった案件では、AIモデルの定期的な更新や、アプリケーションの無停止メンテナンス、コンピューティングリソースのコスト最適化など、多くの要件が求められました。

さまざまなサービスを実際に利用しながら検討をしましたが、最終的にはKubernetesというインフラ運用を効率的に実現する技術を活用したクラウドインフラ基盤を選定しました。

社内でデータエンジニアを育成することが大切

さまざまな案件に携わるなかで思うことは、社内にデータエンジニアをひとりでも育成した方が良いということです。「試してみたい」と思ったことを、簡易的な形であれ、すぐに実行できる人が存在しているか否かで、データ活用プロジェクトを推進するスピード感やコストが大幅に変わってくると思います。

たとえば「簡単なデータ可視化を行いたい」と思った場合にも、開発会社に依頼をする場合、要件定義、見積もり、発注など多くの手順を踏む必要があり、すぐに結果を確認することはできません。また、実際にダッシュボードを作ったはいいものの、数週間使ってみたところで、ほかの指標も確認する必要があることがわかり、さらに追加発注が必要になるという事態も往々にして発生します。

このような無駄なコストを抑えるためにも、アイデアを速やかにプロトタイプとして形にできるデータエンジニアが在籍しているかどうかが、大きな違いになると思います。

そうは言っても、すぐにデータエンジニアを採用したり、育成したりするのはなかなか難しいかと思います。弊社はエンジニアリングの提供だけでなく、コンサル支援も行っていますので、計画の初期段階からお手伝いをさせていただくことができるかと思います。データ活用プロジェクトでお悩みの方はぜひご相談ください。

>>富士通クラウドテクノロジーズ データデザイン事業

イヤホン型脳波計で深層心理をAIが解析、耳から心地よい状態に誘導

VIE STYLE株式会社(ヴィースタイル)は2月4日、北陸先端科学技術大学院大学とヴィースタイルが開発するイヤホン・ヘッドホン型簡易脳波計から測定された脳波および生体情報により、ユーザーの深層心理を解析しAIを構築する共同研究の開始を発表した。

ブレインテック市場は2024年には5兆円規模に

イヤホン型簡易脳波計「VIE ZONE(ヴィーゾーン)」

ヴィースタイルは、次世代のプロダクトとして心と体を整えるI.o.H.デバイス(生体情報を取得するデバイス)および生体情報を活用してサービスを提供するI.o.H.ウェルネスプラットフォームを開発している。

I.o.H.ウェルネスプラットフォームとは、音楽や映像コンテンツを視聴中のユーザーからヘッドホンやイヤホンにより生体情報を取得。AIが解析してユーザーの深層心理を推定する。レコメンデーション機能等に反映することで、ユーザーに個別最適なコンテンツを提供し、ユーザーを心地よい状態(ウェルビーイング)に誘導サポートする機能を備えたプラットフォームだ。

脳波などを活かす、ブレインテック市場は三菱総合研究所の米国調査会社レポート(外部サイト)によれば2024年には5兆円規模になると試算されている。さらにビッグデータと人工知能(AI)の台頭により、脳科学を利用する意義が一層問われるようになっているとプレスリリースではコメントされている。

>>VIE STYLE株式会社

AIが「年収を上げる食事」を提案、仕事内容や生活習慣などを分析

株式会社シグナルトークは1月29日、AIが年収を上げる食事をアドバイスするサービス 「WorkUp AI(ワークアップAI)」の正式スタートを発表した。

ワークアップAIは、専用アプリをPCにインストールするだけで、カメラやキーボードタッチなどを通して、PC業務のワークパフォーマンスを自動計測。AIが独自のメソッドにより、パフォーマンス向上に必要な栄養素を含む食生活をアドバイスするというものだ。

>>WorkUp AI

生涯収入に与える影響を金額で「見える化」

特徴は大きく分けて3つある。

生涯収入をシミュレーション

食生活や仕事内容、仕事に影響する身体の症状などを、「はい」「いいえ」で回答する形式でカウンセリングすることで、現在の仕事のパフォーマンスや食生活、生活習慣を把握し、生涯収入、健康偏差値や余命、健康労働年数などをAIがシミュレーション。健康労働年数とは、健康で働く事が可能な残り年数を意味する。

ワークパフォーマンスと健康の度合いを見える化

シミュレーションの際は、ワークパフォーマンスと健康の度合いを「W-Score(ダブルスコア)」という総合スコアでサービス内に表示。改善状況を「見える化」したことで、実感できるようにしている。W-ScoreとはWork&Wellnessを表す。

具体的な金額で影響具合を可視化

5000名以上のデータと、食事と生活習慣についての50万通りの組み合わせデータを用い、ディープラーニングと統計学的解析手法を駆使して、生涯収入の向上につながる食生活や生活習慣の改善方法である「メソッド」をAIが提案する。さらに各メソッドを取り入れた場合、生涯収入にどの程度影響するのかを具体的な金額で算出する。

健康は個人だけで管理するものではない

シグナルトークのプレスリリースによれば、従業員の健康管理を経営的な課題とする「健康経営」は、昨今ますます注目を集めているそうだ。しかし、2019年に経済産業省は発表した「中小企業への健康経営の普及(外部サイト)」によると、中小企業のうち約半数は健康経営を認知しておらず、「健康管理は個人で行うもの」という考えが根深いことが見受けられているという。

PCにダウンロードした専用アプリでワークパフォーマンスを自動測定

このワークアップAIでは、ビジネスパーソンの個々の健康管理、ワークパフォーマンス向上をサポート。さらには、企業の経営向上、健康経営の促進に貢献するという。

なお、月額料金は9800円(税別)。今後、健康経営を目指す企業様向けの法人サービスも続けて開始予定とのことだ。

>>WorkUp AI

健康管理とAIは注目されている分野

AIで健康を管理するというプロダクトはいくつか発表されている。それこそ、健康のための食事提案などは最たる例だ。

そんななか、1月にファミリーイナダ株式会社が発表した「AI.Inada.Mirror」はなかなかに興味深い製品だった。55インチのディスプレイを搭載していて、「ミラー」でありながら、ホームフィットネスから、バーチャル試着、さらには病気の諸症状にともなうアドバイスなどもしてくれるそう。

健康のための運動もこのミラーでできるという

AIに管理される……というのは聞こえはよくないかもしれないが、健康状態など目で見えづらいものを逐一サポートしてくれるようになるのは非常に便利そうだ。

AIがSNSインフルエンサーの影響力を判定:人工知能ニュースまとめ5選

※写真はイメージです

日々、目まぐるしく進化、発展を遂げるAI(人工知能)業界。さまざまな企業が新しいサービスを開始したり、実験に取り組んだりしている。

そこで本稿ではLedge.aiで取り上げた、これだけは知っておくべきAIに関する最新ニュースをお届けする。AIの活用事例はもちろん、新たな実証実験にまつわる話など、本稿を読んでおけばAIの動向が見えてくるはずだ。

岐阜県大垣市役所がAI導入、担当課の案内や申請書の書き方を説明

タケロボ株式会社は1月24日に、岐阜県の大垣市役所にAIを搭載したロボットが導入されたことを発表した。すでに本番稼働中とのことだ。

来庁した目的を伝える(話し掛ける)と担当課を案内したり、日本語、中国語、英語、ポルトガル語に対応したりする。さらに、住民票等の写しや印鑑証明書など、各種申請書の書き方を説明する。

インフルエンサーの信用度をAIがスコア化、いいねに代わる指標に

株式会社A(エース)は1月27日、インフルエンサーの信用度をスコア化したマーケティングプラットフォーム「A stream」の提供を開始すると発表した。

エース社では、延べ5万人以上のインフルエンサーを運用するなかで、過去の施策やPR効果、さらに各投稿に対するエンゲージメント率などの膨大なデータをすべて蓄積。これらのデータをもとに、インフルエンサーの信用性を数値化し、いいね数にとらわれない新たな指標で評価するそうだ。

内視鏡検査中に大腸ポリープ検出を支援するAI、薬機法を承認取得

サイバネットシステム株式会社は1月29日、人工知能(AI)を用いて大腸内視鏡診断におけるポリープなどの病変の検出を支援するソフトウェア「EndoBRAIN-EYE(エンドブレインアイ)」について、「医薬品、医療機器等の品質、有効性及び安全性の確保等に関する法律(医薬品医療機器等法)」に基づき、クラスII・管理医療機器として承認の取得を発表した。

腸内視鏡で撮影された内視鏡画像をAIが解析し、ポリープなどを検出すると警告を発し、医師による病変の発見を補助するソフトウェア。設計上、あえて検出した病変の位置まで特定することはせずに、音と画面上の色によって医師に警告を発するにとどめているとのこと。これによって、医師の診断する余地を残しつつ検出を支援することが可能で、医師の診断に寄り添った設計になっているそうだ。

小売店での顔認証、67.8%の人が映像や画像の活用に「不安」

株式会社クレストは1月28日、「カメラによる顔認証技術に対する意識調査」の結果を発表した。

店舗マーケティングでの活用は67.8%の人が「不安」と答えている。理由は、「顔や行動を撮影されること自体に抵抗がある(49.0%)」「いつどこで撮影されているのかわからない状態に抵抗がある(48.1%)」となっていて、同プレスリリースでは「撮影されること自体への漠然とした不安や撮影目的や場所を認識出来ないことに対する不安感では」としている。いずれの調査も株式会社クレスト調べ。

ゴルフスイングのフォームをAIが点数評価、丸山茂樹プロらが開発

株式会社カクセイは1月31日に、株式会社AIGと協業しゴルフパフォーマンス向上理論「AIGメソッド」システムの運用を開始すると発表した。

AIGメソッドは、富士通株式会社が保有する人工知能(AI)を応用した動作解析システムを使い、ゴルフスイングを数値化するトレーニングメソッドだ。非接触の3Dセンシング技術によって、映像AIによる骨格認識技術を用い、3D(360度あらゆる方向)による動きを再現できるという。

従来のゴルフレッスンは、指導者の経験や感覚値、独自のロジックに基づくトレーニングが主流であり、課題を克服するために試行錯誤を繰り返す必要があった。しかし、AIGメソッドを用いることで、指導者の技量を問わず、すべてデータに沿ったトレーニングが可能になる。

ゴルフスイングのフォームをAIが点数評価、丸山茂樹プロらが開発

株式会社カクセイは1月31日に、株式会社AIGと協業しゴルフパフォーマンス向上理論「AIGメソッド」システムの運用を開始すると発表した。

AIGメソッドは、富士通株式会社が保有する人工知能(AI)を応用した動作解析システムを使い、ゴルフスイングを数値化するトレーニングメソッドだ。非接触の3Dセンシング技術によって、映像AIによる骨格認識技術を用い、3D(360度あらゆる方向)による動きを再現できるという。

なお、本メソッドはAIG取締役・丸山茂樹プロ、AIG取締役・米倉和良プロを中心としたAIGメソッド開発チームにより、2019年に開発された。

運用自体は3月1日(日)から室内ゴルフレッスンスタジオ「USTMamiyaフィッティングラボ東京」で開始される。

理想のフォームまでの道のりを具体化

AIGメソッドを用いたトレーニングの大きな利点は、課題が数値化されるため、理想のフォームという目標に向かい何をどうするのか、どのくらい改善されたのかが明確であることだそうだ。

従来のゴルフレッスンは、指導者の経験や感覚値、独自のロジックに基づくトレーニングが主流であり、課題を克服するために試行錯誤を繰り返す必要があった。しかし、AIGメソッドを用いることで、指導者の技量を問わず、すべてデータに沿ったトレーニングが可能になる。

AIGメソッドは、アドレス、バックスイング、トップ、ハーフダウン、インパクト、ハーフフォロー、フィニッシュの7つのフェイズを、マーカーレスモーションキャプチャーで記録。人工知能を用いて動画解析し、各個人に理想的なフォームを数値データの形で算出する。

また、AIGが推奨するAIGスイングレベルまでの到達を最短でサポートするために以下の5項目を取り組むとしている。

  • 数値化されたデータを利用したレッスン
  • 理想的なスイングと自分のスイングをデータで比較
  • 骨格データ等からのAIGスイング点数でゴルフ力診断
  • 初心者にも分かりやすいデータを利用したレッスンプログラム
  • 自分の成長を数字で管理できるマイゴルフカルテの利用

くわえて、株式会社AIGの取締役でもある丸山茂樹プロは次のようにコメントした。

数年前に開発された弾道計測機器は、今ではPGA選手の朝の練習風景に欠かせないアイテムになっています。
そして今、私は骨格データを分析してゴルフパフォーマンス向上を目指す練習が、今後世界のトップゴルファーが当たり前の様に行い、その練習の姿勢をジュニアゴルファーが見習う、そんな未来が直ぐそこにあると信じています。AIG統合システムで表示される骨格データの数字を分析して、どの様にすれば分かりやすく皆様に伝えられるのか、日々AIGメソッド開発チームと研究開発していきます。そして、ゴルフにとどまらずスポーツ界全体に浸透してきている動作解析に基づいたメソッドによるパフォーマンスの飛躍的な向上を皆様と一緒に体験したいと思っています。
プレスリリースより転載)

>>株式会社AIG
>>プレスリリース

エイベックスはダンスの動画を解析して数値化

スポーツの分野では、フォームなどの動作を客観的かつ明確に評価することが求められつつある。それこそ、採点競技と言われるような「フィギュアスケート」「体操」などだ。

そんななか、エイベックスは1月21日に、動画解析技術とデータサイエンスを活用しダンス技術のスコア化を実現したと発表している。

ダンス分野では、育成や評価システムにおいて個人の感覚や感性に左右されることが多く、データサイエンスなどの科学的アプローチの活用が議論されていた。また、2012年度からは中学校の体育でダンスが必修化されたものの、教育現場では指導者のダンス技術の理解習得や、評価・評点方法の不明瞭さなど、指導者の大きな負担も課題となっていたそうだ。

エイベックスのスコア化実現においては、動画解析技術と独自のデータ分析およびアルゴリズム開発など科学的アプローチを取り入れることで、ダンスの定量評価(=スコア化)をしているそうだ。

小売店での顔認証、67.8%の人が映像や画像の活用に「不安」

株式会社クレストは1月28日、「カメラによる顔認証技術に対する意識調査」の結果を発表した。

調査概要【株式会社クレスト調べ】
・調査期間:2019年12月20日(金)~23日(月)
・対象:全国に住む20歳~69歳の男女500名(男性:250名 女性:250名)
・調査方法:インターネットによるアンケート回答方式(調査会社:株式会社ネオマーケティング)
>>https://www.crestnet.jp/

利用経験最多は「オフィスでの勤怠・人事管理システム」

意外にもスマートフォンなどでの利用が少ない(画像はプレスリリースより)

カメラを使った顔認証技術(画像や映像から顔の特徴を分析して人物を識別する技術)のサービス利用経験は、39.4%が「カメラを使った顔認証技術について聞いたことはあるが利用したことがない」と回答している。

一方で、利用したことがあるサービスで最も多かったのは「オフィスでの勤怠・人事管理システム」で28.8%。次いで「スマートフォンやPCへのログイン(16.0%)」「出入国管理時の顔認証ゲート(15.8%)」となっている。

しかし、顔認証技術の“サービス利用”に対しては、全体の64.8%が「抵抗感あり」と回答している。その理由は、「目的は何であれ、無断で自分の顔や姿を撮影されることが不快だから(47.5%)」と回答した人が最多で、プレスリリースによれば抵抗を感じる主な理由撮影行為自体に対する不快感と利用用途の不明瞭さであると推測している。

なお、「新しいサービスの利用方法に慣れるのが面倒だから」と回答したのは全体の11.7%だった。

店舗マーケティングでの活用は67.8%が不安を感じる

最近、導入事例が増えてきた“リテールテック”と言われる小売店舗での顔認証カメラの活用。スーパーやレストラン、アパレルショップなどに小型カメラを設置し、映った人の年齢や性別を分析。分析されたデータをもとに、来店客に対してのセールイベントや、おすすめ商品の提案などをすることで、店舗での体験向上に活用されるものだ。

店舗での活用に対する認知については、そもそも存在を「知っている」と回答した人は25.2%にとどまった。

だが、店舗マーケティングでの活用は67.8%の人が「不安」と答えている。理由は、「顔や行動を撮影されること自体に抵抗がある(49.0%)」「いつどこで撮影されているのかわからない状態に抵抗がある(48.1%)」となっていて、同プレスリリースでは「撮影されること自体への漠然とした不安や撮影目的や場所を認識出来ないことに対する不安感では」としている。

「とても不安である(18.8%)」「どちらかというと不安である(49.0%)」の合計で67.8%(画像はプレスリリースより)

その反面、店舗マーケティングでの活用に対して不安ではないと回答した理由は、「映像が削除されていれば、情報の流出・悪用の心配がない」が最多で44.1%だった。次いで「店舗での体験向上にデータが活用されれば自分にもメリットがある」が43.5%、「生活が便利になってほしい」が42.2%という結果に。


そのほか、株式会社クレストによる調査結果はプレスリリースから確認できる。

>>株式会社クレスト
>>プレスリリース(PR TIMES)

急速に進みそうな店舗での顔認証活用

クレストのプレスリリースにも記載されているが、これから先、顔認証を使った店舗マーケティングを活用する企業は増えていくとされる。

昨年2月には、エクスウェア株式会社が提供する顔認証サービスが「ラーメン凪 田町店」に導入されたそうだ。なんでも、顔認証から注文(発券)までをシステム化したとのこと。

それこそ、最近ではサブスクリプションを使った飲食店も増えているため、顔パス利用できれば手ぶらでご飯を食べに行けることになる(居酒屋でほしいサービスですよね)。

クレストのリリースにも記載があるが、利用者(顧客)が能動的に使う顔認証は多くの人に受け入れられるが、店舗側の意向だけで顔認証を使われることにはまだまだ理解しづらく感じる人もいるのだろう。とはいえ、店舗側でデータを活用してもらうことで、よりよい顧客体験を得られるのであれば急速に理解も進むはず。

人材育成を軸とした「AIの内製化支援」に全力。アイデミーが8.3億円の資金調達

株式会社アイデミーは1月30日記者発表会を行い、東京大学エッジキャピタルなどから総額8.3億円の第三者割当増資を実施したことを発表した。資金使途はプロダクト研究開発費に4億円、広告宣伝費に2億円、運転資金などに2.3億円としている。

なお、今回の増資でアイデミーの累計調達額は9.4億円となる。

「横串組織」だけでは成功しない、全社で取り組む必要性

アイデミー代表取締役の石川聡彦氏は、発表会で「AIプロジェクトを成功させるには、全社をあげて取り組まなければならない」と語った。

石川氏曰く、組織としてAIに取り組むフェーズは以下の3ステップに分けられる。

  1. 経営者がAIの必要性を理解する
  2. SIerやベンチャー企業を巻き込んでAIを試作する
  3. AIの組織育成・一部内製化に挑戦する

フェーズ2においては、通常「AI・DX推進部」などの、いわゆる「横串組織」が外部のSIerなどにAI開発を外注する。しかし、横串組織のみでプロジェクトを進めると、「本当に解くべき課題を見つけられない」「実運用フェーズでのモデルの運用に関して現場とコンセンサスが取れない」などの課題が浮上するという。したがって、横串組織のみならず、全社をあげてAIの理解促進やプロジェクトの立ち上げに取り組む必要がある。

出典:アイデミー登壇資料

アイデミーは、まず企業内の横串組織に対しての教育・研修を実施し、他部署へも展開。AIが実運用される現場社員がAIを理解している状態を目指すことで、AIで解くべき課題を整理していくという。

アイデミーが取り組む「AIの内製化支援」

アイデミーは、企業がAIに取り組む際(上述のフェーズでいえばフェーズ2以降)の、AIを内製化して実運用するために以下の4サービスを展開している。

  • 組織体制構築・人材育成
  • 事業定義
  • PoC開発
  • 実運用

組織体制構築・人材育成では、toBのeラーニングサービス「Aidemy Business Cloud」では、オンラインでAIなどの技術を学べるコンテンツを50種類以上提供。隔月でユーザー会も実施し、同じミッションを持つ担当者が自社のAIの取り組みや課題を共有する場も用意している。

Aidemy Business Cloud。公式HPより編集部キャプチャ

事業定義では、コンサルティングプラン「Aidemy BizDev Intensive Plan」を提供している。前述の通り、横串組織のみでは現場で解くべき課題の選出が難しい。このプランでは、コンサルティングを通じてAIの概要理解や、二人三脚でAIプロジェクトの企画書を作成するところまで伴走する。

そしてPoC開発では、エンジニアを対象とした「Aidemy Engineer Intensive Plan」を提供。PoCの際、エンジニアが機械学習モデルを作る際の「メンター不足」という問題にアプローチし、オンラインでのメンターとの壁打ちや、課題のコードレビューなどを実施している。

最後に実運用では、「Aidemy Technology」を提供予定だ。AIを運用する際には監視・再学習などの保守をする必要がある。このソリューションでは、運用に必要な監視・再学習・管理画面などをワンパッケージでの提供や、IoTデバイスなどへのデプロイ・データ保存なども利用可能だという。

なお、今回の調達におけるプロダクト研究開発費はAidemy Technologyなどの新規プロダクト開発に充てる。今年4月にプレローンチ予定だという。

今後2年間で導入企業を400社超を目指す。出典:アイデミー登壇資料

「ソフトウェアやデータをビジネスの中心に据える」という変革

発表会では、今回の第三者割当増資を引き受け、1億円を出資したダイキンも登壇。ダイキンはアイデミーと昨年1月から協業しており、大阪大学と共同で開講した社内講座「ダイキン情報技術大学」内のeラーニングにアイデミーの講座を活用している。今後はアメリカの生産拠点にもアイデミーの講座の活用を検討したいと語った。

ダイキンの例は、アイデミーが目指している、人材育成を軸とした「AIの内製化支援」の好例と言えるだろう。ダイキン広報担当社によれば、すでに社内講座を修了した人材が現場の部署の課題をAIを活用して改善し始めているという。

一方で課題もある。ダイキンから登壇した執行役員の米田裕二氏によれば「若手と比べ、eラーニングの管理職層への教育効果は低い。リテラシーの問題なのか、やる気の問題なのかは分からないが……」と語った。ITに普段から慣れ親しんでいるような若年層に比べ、そもそものITリテラシーが高くない管理職といった層に対して、どうAI活用を“啓発”していくのかという課題は、今後AI活用を検討している企業にも当てはまるだろう。

アイデミー代表の石川氏は、発表会でこうも語っていた。「Society 5.0、働き方改革、VUCA時代、AI/DXブームなど呼び方はいろいろあるが、共通しているのは『ソフトウェアやデータをビジネスの中心に据えるという変革』だ」。それをやりきる覚悟がある企業が、アイデミーのような企業と組んで変革を起こしていってほしい。

なお、石川氏が今回の調達に際しnote(外部リンク)を書いている。調達の裏側についてたっぷり語られているので、こちらも必見だ。

2020年のスポーツをAIが変える5要素、戦略立案から観戦まで

各種スポーツではAI(人工知能)に限らず、IoT機器やデジタル製品などの導入が進められている。以前、女子バレーボールの日本チームがiPadを使って試合の分析をしていたニュースを覚えている人も少なくないだろう。

時代は進み、いまではデジタル機器にとどまらずAIを活用する事例も増えてきた。それこそ、2019年は社会全体でさまざまなAIが導入された。それにともなって、スポーツやその周囲での活用事例も増えている。スポーツ分野全体をAIが変えるかもしれない。

AppierのチーフAIサイエンティストであるミン・スン氏は、2020年開催の国際的スポーツイベントとAIに関するセミナーを実施した。そこでは、AIによってスポーツの試合、観戦、競技場等の環境などが変化するかもしれないと言う。本稿ではこのセミナーで語られた、スポーツ分野全体で今後活用が始まったり、広まったりしそうなAI事例を紹介する。

>>Appier

1、戦略の立案やシミュレーターでの活用が増える

まず語られたのは、選手や監督・コーチ向けのAIだ。球技や格闘技などの試合(対戦)を要する種目で活用されるケースが多い事例だ。

自分たちの戦略に対して、相手チームがどういう動きを展開するのか、予測と分析をするAIに注目が集まるそうだ。いわゆる行動モデリングを利用したもので、自分たちと対戦相手の動きを学習させ、シミュレーション環境を構築するものである。

画像出典:pixabay

選手本人はもちろん、監督やコーチなどに有益となる技術になるという。これまでは机上で作戦を考えていたこともあったが、AIシミュレートすることで一層具体的に指示を出すことも可能になりそうだ。

AIシミュレートした戦術を、選手がどれだけ再現できるかがカギを握りそうである。

2、競技中に選手の各種情報をリアルタイムで表示

次に紹介されたのは、私たち観戦する人向けのプロダクト。すでにいくつかの企業がサービスとして展開しているが、実際に競技している選手を、リアルタイムでトラッキングし、さまざまな情報を可視化させる仕組みは今後のスポーツ大会でも採用機会が増えていくだろう。

陸上競技で例を挙げるなら、選手の基本情報や、選手の走る速度、その選手がいま何位なのかなどの情報を、映像に対して即座に映し出すものである。さらには、個々の選手の情報だけでなく、対戦カードごとの成績などもすぐさま表示できる。

パナソニックが開発した画像解析技術を用いた競泳選手のトラッキングシステム。選手の肌の色や動きなどの情報を考慮することで、選手の位置を数値的に判断できるようになった

なお、ボールなどを使う種目においては、そのボールをトラッキングすることで、ボールの回転や軌道などを画面に表示できるようだ。

さまざまな情報を可視化することで、あまり競技に詳しくない人でも、競技そのものや選手に興味を持たせることにもつながりそうだという。とくに、バドミントンなど超高速なスマッシュが出た瞬間などは、ルールや選手への知識は浅くても盛り上がるはず。

3、自動追尾ドローンで競技者を追跡しつつカメラ中継

先に挙げた選手のトラッキングは、特定の競技場内で実施される競技で主に適応できる技術だ。というのも、トラッキングするには競技前に複数のカメラを競技場内に設置する必要があるからだ。

自転車競技のロードレースやクロスカントリー、陸上競技のマラソンや競歩などは、一般道路で実施される競技なので、先述した特定の会場内で可能なトラッキングが難しいとされる。

そこで活用に期待がかかるのが自動追尾型のドローンだ。選手もしくは集団を自動で追尾し、その模様をカメラ中継するもの。当然、カメラ中継だけでなく、先の例のような選手情報などをリアルタイム表示させる機能も備える。

単純に追跡するといっても超えるべきハードルは非常に多い。街中で実施される種目の場合、木々や看板、トンネルなどとぶつからないよう自動的にドローンが回避しなければいけない。さらに、動く選手を追いかけて捉え続ける。さらには、その選手の速度などのデータを分析や処理したり表示したりする。

ドローンに求められる性能は非常に多いが、自律飛行が可能なドローンはskydio社(外部サイト)から発表されている。昨年末より配送開始となったとされる「skydio 2」は、手元でビーコンを使って操作すれば操作範囲は1.5kmほどまであるという。

Skydio 2の公式サイト(画像は公式サイトより)

選手ごとに固有のドローンが追従し、中継映像などを送ってくれる未来もそう遠くはなさそうだ。

4、混雑状況は基地局と公共交通機関で状態把握

スポーツに限らず、大きな大会やイベントが開催されると、その会場周辺は大混雑。訪日外国人観光客も含めると、想像できないほどの混雑になるだろう。2020年の夏ごろにおいては、およそ50万人以上の海外観光客が東京に訪れるのではないか、とされている。

画像出典:pixabay

観光客だけでなく、大会運営のスタッフやボランティアの方まで加味すれば、会場周辺が大混雑することは容易に予想できる。このような環境をAIがどのようにコントロールできるかについても問われているとミン・スン氏は言う。

そのために活用できそうなのが「通信基地局」と「公共交通機関」だそうだ。

ある特定の地域において、何台のスマートフォンがWi-Fiや4Gに接続しているかを把握できれば、おおよその人数の把握につながるのではないかという。また、電車の駅などの改札を利用すれば、どれほどの人数が駅を使っているのかもわかる。

これらのデータを集めることで、AIによる予測分析に使えるとミン・スン氏は考えている。

たとえば、これから30分以内に、どの地域がどの程度の混雑になるのかなどの予想もできる、とのことだ。さらにこの分析結果から「大変な混雑なので、臨時便を手配しよう」などの意思決定にもつながるのではと。

画像出典:pixabay

ただし、集めたデータの分析を毎回クラウドに送信していては、膨大なトラフィックが必要になる。さらには、データの流出などによって悪用されることも防がなければいけない。そのためにも、ローカルデバイス上でAIを使えるようにする必要があるそうだ。

5、審判におけるAI活用は選手への浸透がカギ

ところで、スポーツといえば気になるのは「審判」や「判定」へのAI活用だ。

パナソニックが発表したアメリカンフットボールの試合映像を解析し、プレーの開始と終了を自動でタグ付けすることを目標とした研究

ミン・スン氏は審判などへの普及について次のように話した。

「さまざまな種目のなかでも、球技はとてもわかりやすいです。たとえば、線の内外どちらにボールがあるのかの判定です。ミリ単位の精度でトラッキングでき、テニスやバドミントンなどでは活用されています。そのほかの種目でも、その種目ごとに適した技術自体は確立されつつあります。

競技で使用する道具にAIを仕込むことが必要なケースがあるので、その場合は選手等にどのように理解してもらい、浸透させるかが今後のカギです」

と言う。

最近では、動画解析などによって、ダンスの技術をスコア化するプロダクトも発表された。AIを活用することで、さらに競技を楽しめるようになるのかもしれない。

エイベックスは動画解析技術とデータサイエンスを活用しダンス技術のスコア化を実現したと発表


2020年は新たなマーケティング創出の機会

また、実際にスポーツの現場やその周囲に関わらなくても、2020年においては訪日外国人を見込んだ需要は増すと予想されている。ミン・スン氏も「ウェブサイトの閲覧データなどから、旅行者(消費者)のペルソナを立てることで、新たなマーケティング機会を創出できるだろう」と言う。

小売業界でも海外からの消費者ニーズを分析すれば、大きなチャンスを得られるかもしれない。

>>Appier

内視鏡検査中に大腸ポリープ検出を支援するAI、薬機法を承認取得

<画像はイメージです>

サイバネットシステム株式会社は1月29日、人工知能(AI)を用いて大腸内視鏡診断におけるポリープなどの病変の検出を支援するソフトウェア「EndoBRAIN-EYE(エンドブレインアイ)」について、「医薬品、医療機器等の品質、有効性及び安全性の確保等に関する法律(医薬品医療機器等法)」に基づき、クラスII・管理医療機器として承認の取得を発表した。

エンドブレインアイは、昭和大学横浜市北部病院消化器センターの工藤進英教授、名古屋大学大学院情報学研究科の森健策教授らのグループと共同で開発したものだ。

※医療機器は多種多様であるため、患者に与えるリスクに応じて、一般医療機器(クラスⅠ)、管理医療機器(クラスⅡ)、ならびに高度管理医療機器(クラスⅢとクラスⅣ)に分類されている。クラスII・管理医療機器は不具合が生じた場合でも、人体へのリスクが比較的低いと考えられるもので、レントゲン撮影装置や心電計、注射針、さらにはEndoBRAIN-EYEのような一部の診断支援プログラムが該当する。

画像はプレスリリースより

ポリープなどを検出すると警告を発し病変の発見を補助

サイバネットは2018年に大腸内視鏡診断支援ソフトウェアとして、超拡大内視鏡の画像を対象に“診断”を支援する「EndoBRAIN(エンドブレイン)」の医薬品医療機器等法の承認を取得していた。

今回開発されたエンドブレインアイは、“病変の発見”を補助するものだ。昭和大学横浜市北部病院、国立がん研究センター中央病院、静岡県立静岡がんセンター、東京医科歯科大学附属病院、がん研究会有明病院の国内5施設共同の臨床性能試験を経て、医薬品医療機器等法に基づき、クラスII・管理医療機器として承認(承認番号:30200BZX00021000)を取得した。

エンドブレインアイは、大腸内視鏡で撮影された内視鏡画像をAIが解析し、ポリープなどを検出すると警告を発し、医師による病変の発見を補助するソフトウェア。設計上、あえて検出した病変の位置まで特定することはせずに、音と画面上の色によって医師に警告を発するにとどめているとのこと。これによって、医師の診断する余地を残しつつ検出を支援することが可能で、医師の診断に寄り添った設計になっているそうだ。

また、オリンパス社製の汎用大腸内視鏡(ハイビジョン画質以上)に使用でき、多くの内視鏡機種と組み合わせて使用可能なのも特徴だという。

臨床性能試験では感度95%、特異度89%の精度で病変の検出が可能

本ソフトウェアには、AI研究で実績のある名古屋大学大学院情報学研究科森健策研究室にて研究されてきたアルゴリズム・ノウハウを実装している。国内5施設から集積した動画から抽出された約395万枚の内視鏡画像を学習し、臨床性能試験では感度95%、特異度89%の精度で病変の検出が可能で、内視鏡医の支援に足る十分な精度を達成した。

市販後に自律的な学習による性能向上はしないものの、学習画像数の増加やアルゴリズムの改良で性能向上が期待できる場合には、独立行政法人医薬品医療機器総合機構(PMDA)に申請し、承認取得後、適宜バージョンアップをする方針だ。

もともと、大腸内視鏡の検査は、経験豊富な医師でも負担の大きい複雑な検査と言われていたようだ。それは、大腸の長短や形状の個人差が大きいことが理由にあるとされる。

エンドブレインアイを使用することで、医師の内視鏡観察を支援し、病変の発見割合が向上することが期待されている。また、すでに販売されているエンドブレインとの連携によって、病変検出から診断の一連の工程をAIが支援する環境が整うことで、内視鏡検査に携わる医療従事者の負担を軽減させ、ポリープなどの検出率を更に高めることも狙っている。

※感度とは画像中に病変があるときにAIが正しく病変があると判定できる確率であり、特異度とは画像中に病変がないときにAIが正しく病変がないと判定する確率である。つまり感度が高ければ高いほどAIによる見落としが減り、特異度が高ければ高いほど誤検出が減ることを意味する。

大腸がんは日本人女性のがん死亡数の1位、男性でも3位

国立がん研究センターが発表する2019年10月04日付「最新がん統計“2017年の死亡数が多い部位”」がん情報サービス統計値(外部サイト)によれば、大腸がんは日本人女性のがん死亡数の1位、男性でも3位だそうだ。そのため、効果的な対策が求められるがん種だという。

プレスリリースによれば、大腸がん対策として、大腸内視鏡で早期がんや前がん病変である腫瘍性ポリープを切除することで、大腸がんによる死亡を大幅(53-68%)に減らせるとのこと。しかし、1回の検査当たり腫瘍性ポリープの約22%が見落とされている可能性が指摘されていた。

見落としの原因は、大腸のヒダや便に隠れてしまって描出ができていない場合と、ヒューマンエラーによる2点のケースがあるそうだ。

そこでサイバネットシステムは、昭和大学横浜市北部病院消化器センター及び名古屋大学大学院情報学研究科の森健策研究室と連携し、なかでもヒューマンエラーによる見落としを防ぐことを主眼として、医師による内視鏡検査を補助するAIを2013年から研究・開発している。

>>サイバネットシステム
>>プレスリリース

医療データサイエンティスト養成プログラムを開始

医療向けのAI活用はいま急速に進もうとしている。

1月10日には、株式会社HACARUSが医師や製薬企業をはじめとする医療事業者向けのAIトレーニングプログラムの提供を開始した。同社は医療AI、スパースモデリングなどに強みを持っている。

この養成プログラム受講者は、AI開発に必要なツールの使い方や、統計、機械学習の基礎的な内容を学べる。また、プロジェクト演習では、講習で学んだ知識を生かし、医療データを用いた AI開発を実際に体験する。プログラムの内容はすべて医療データを前提として設計されており、プログラム受講後に実務ですぐに活用も可能だ。

主に、自社・自院保有のデータで何ができるのかがわからない、患者情報を扱うためプロジェクト立ち上げに時間がかかる、外部委託のベンダー選定に判断基準がないといった課題の解決が可能になるそうだ。

日本ディープラーニング協会(JDLA)とは?G検定・E資格の概要・傾向・対策まで

2012年ごろから急速に発展してきたディープラーニング。今後の人工知能の発展を支え、さまざまな分野への実用化が進んでおり、日本の産業において重要な基盤技術になるともいわれています。

そんな大きな可能性を持つディープラーニングラーニング産業の拡大に取り組む団体が、日本ディープラーニング協会です。この記事では、日本ディープラーニング協会(英称:Japan Deep Learninng Association、以下JDLA)について解説します。

日本ディープラーニング協会について

JDLAの設立目的、協会活動、組織体制について解説します。

日本ディープラーニング協会とは

日本ディープラーニング協会とは、ディープラーニング技術の活用による日本の産業力向上を目指し設立された組織です。

ディープラーニング事業を核とする企業およびディープラーニングに関わる研究や人材育成に注力している有識者が中心となり、産業活用促進人材育成公的機関や産業への提言国際連携社会との対話など、産業の健全な発展のために必要な活動を行なっています。東京大学大学院工学系研究科教授の松尾豊氏が理事長を務めています。

協会活動

日本の産業力向上のために、JDLAは「活用促進」「社会提言」「人材育成」「国際連携」「理解促進」の5つの活動を行なっています。

JDLA協会活動図(出典:JDLA公式HP)

  1. 産業活動促進
    カンファレンスやワークショップ等のイベント開催(主催・共催・協賛等)を通して、産業応用事例や導入課題と対策等、産業が必要とする情報を提供します。また、分野ごとのワーキンググループを設置し、分野特有の課題(技術課題や法的課題等)を整理し、解決を目指します。

  2. 公的機関や産業への提言活動
    業界の健全な発展と倫理的側面を考慮し、行政・立法等の公的機関および産業界に対し、提言を行います。

  3. 人材育成
    ディープラーニングに関する知識を有し、事業活用する人材(ジェネラリスト)と、ディープラーニングを実装する人材(エンジニア)の育成を目指します。各々に必要な知識やスキルセットを定義し、資格試験を行うとともに、協会が認定した事業者がトレーニングを提供します。※
    ※資格試験は有償で提供。また、教育事業者のトレーニングの内容・費用は教育事業者により異なります。

  4. 国際連携活動
    ディープラーニングの社会実装における倫理的、法的、社会的課題に関して、国内外の関係機関と連携し、議論に参加することで、海外の取り組みや考え方を国内に発信し、また国内の活動を海外に発信します。

  5. 社会との会話
    「人工知能」と総称され、現段階でできることとできないことが曖昧になることで、過剰な期待や過大な心配が社会に生まれつつあります。情報発信や社会との対話を目指す活動を通し、ディープラーニングに対する理解を促進します。

組織体制


JDLA組織構成図(出典:JDLA公式HP)
JDLAは、以下の3つの委員会に分かれて協会活動を行なっています。

  • 産業活用促進委員会
  • 公共政策委員会
  • 人材育成委員会

JDLA資格試験(G検定・E資格)とは

JDLAは人材育成活動の一環として、事業活用する人材・実装する人材という2つの側面で必要とされる知識やスキルセットを定義した、「JDLA資格試験」を2017年から実施しています。


ディープラーニングに関する知識を有し、事業活用する人材(ジェネラリスト)と、ディープラーニングを実装する人材(エンジニア)の育成を目指します。各々に必要な知識やスキルセットを定義し、資格試験を行うとともに、協会が認定した事業者がトレーニングを提供します。G検定は年3回、E資格は年2回実施予定。日進月歩する技術であることから、検定・資格実施年毎に実施年号を付与します。(JDLA公式ホームページより)
G検定 E資格
受験資格 なし JDLA認定プログラムを過去2年以内に修了していること(後に解説)
試験概要 120分、小問226問の知識問題、オンライン(自宅受験)
(2020#1、問題数は前回実績)
120分、108問、会場試験
(2020#1、問題数は前回実績)
出題問題 シラバスより出題
(後に解説)
シラバスより出題
(後に解説)
受験料 一般:12,000円+税
学生:5,000円+税
一般:30,000円+税
学生:20,000円+税
JDLA賛助会員:25,000円+税
申し込みサイト JDLA Deep Learning for GENERAL(外部リンク) JDLA Deep Learning for ENGINEER(外部リンク)
年あたりの開催回数 3回(これまで約4か月に一回のペースで開催) 2回(これまで約6か月に一回のペースで開催)

G検定、E資格で身につくこと・役立つこと

G検定、E資格は知識の習得だけでなく、スキルの証明にもなるため就職や転職、自身の評価アップにも繋がります。

G検定の特徴

  • ディープラーニング(人工知能)に関する知識を体系的に取得できる
    人工知能・機械学習・ディープラーニングの基礎知識から最新動向、法律・倫理までが出題され、幅広い知識が身に付きます。

  • 転職や就職に有利
    ユーザー企業・ベンダー企業問わず、就転職時にG検定保有者は書類選考が免除されるなど、検定試験合格者を優遇する企業が増えてきています。

  • スキルや知識を証明し、社内外からの評価向上に役立つ
    産業界・学術界の第一人者が毎回出題範囲を見直し、シラバスを策定。日進月歩する技術動向に対応しているので、ディープラーニングの基礎知識を持つ証明として活用できます。さらに合格者には認証ロゴを配布、名刺に記載できるので社内外にアピールできます。

また、JDLAはG検定を勧める人の例を次のように挙げています。

こんな人におすすめ

  • ディープラーニングの知識を体系的に学び身につけたい方
  • AIを活用したい企業のマーケティング職、経営企画職の方
  • 未経験からAIに関する仕事で就職や転職を考えられている方
  • 突然AIプロジェクトの担当者に任命された、AI関連部署に社内異動となった方
  • AIを活用したいという相談を受ける代理店、コンサルタントの方

E資格の特徴

  • ディープラーニングを理論から理解し実装スキルを体系的に取得できる
    日々進化を遂げるAI領域においては、幅広い知識とスキルが要求され、最新論文の理解や理論へのキャッチアップも必要となります。JDLAではその膨大な領域の中から理論の理解と実装に必要な領域をシラバスとして定めているため、ディープラーニングの実装に関する知識・スキルを体系的に取得でき、最新論文を理解する力や自らライブラリを作る力が身につきます。

  • 転職や就職に有利
    数学的なバックグラウンドを持つ方やシステムエンジニアなど、未経験からディープラーニングの分野に進みたい・キャリアチェンジをしたい場合、E資格を保有していることで書類選考を優遇する企業も出てきています。

  • 協会が認定した事業者がトレーニングを提供、実装力も証明できる
    エンジニアに必要なのは現場で使える実装力。理論的な背景を理解するとともに、実装/実習を担う、いわゆる“教習所”を卒業することで、そのスキルを証明する資格試験となっています。合格者にはG検定と同様、認証ロゴが配布されるので名刺に掲載して実装力の証明をしている方が多くいます。

過去の受験者データ

G検定、E資格ともに試験開始以降、受験者数は増加しています。

G検定・E資格の受験者数・合格者数の推移(出典:JDLA資料)

G検定

G検定は累計受験者21,275名に対して14,523名が合格しています。合格率の平均は約70%(過去5回の実績より)です。2019#3の合格率は約71%でした。

G検定の申込者数、受験者数、合格者数、合格率の推移(出典:JDLA資料)

E資格

E資格は累計受験者1,420名に対して951名が合格しています。2019#2の合格率は約68%でした。G検定と比較すると、受験者、合格者数ともに大きく差が開いている状況です。

E資格の申込者数、受験者数、合格者数、合格率の推移(出典:JDLA資料)

より詳細な情報はこちら
「JDLA試験実施レポート 2019年12月版」(外部リンク)

問題内容(出題範囲・出題例・推薦図書)

日本ディープラーニング協会は、G検定、E資格それぞれの学習シラバスを提示しており、試験の出題範囲や推薦図書なども記しています

G検定

出題範囲(2019#3)
  • 人工知能(AI)とは(人工知能の定義)
  • 人工知能をめぐる動向
  • 人工知能分野の問題
  • 機械学習の具体的手法
  • ディープラーニングの概要
  • ディープラーニングの手法
  • ディープラーニングの研究分野
  • ディープラーニングの応用に向けて
  • 出題例 出典:JDLA公式HP
    公式テキスト 深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト

    出典:JDLA公式HP
    日本ディープラーニング協会が執筆した公式テキスト。最新シラバス「JDLA Deep Learning for GENRAL 2018」に完全準拠しており、各章末には練習問題も。
    詳細(外部リンク)

    E資格

    出題範囲
  • 応用数学
  • 機械学習
  • 深層学習
  • 開発・運用環境
  • 学習のシラバスはこちら
    JDLA E2020シラバス(外部リンク)
    JDLA E2019シラバス(外部リンク)

    JDLA認定プログラムについて

    JDLAでは、ディープラーニングの理論を理解し、適切な手法を選択して実装する能力を持つ人材を育成する講座を、「JDLA認定プログラム」として認定推奨しています。現在12種類の認定プログラムがあり、いずれかの認定プログラムの受講を修了すると、E資格の受験が可能になります。

    プログラム未経験からでも知識を身につけられるものや、ディープラーニングに特化したものなど、さまざまな種類の講座が用意されています。E資格を受験する人は、各プログラムを知ることで、自分に必要な知識を身につけるために最適なものを選ぶことができるでしょう。

    ※お申し込み・お問い合わせは各認定プログラムの実施事業者までご連絡ください。

    「JDLA認定プログラム」認定費用無償化制度スタート


    JDLAは、高等学校、高等専門学校、大学(短大、大学院を含む)を対象として、「JDLA認定プログラム」への認定にかかる費用を無償化および減額する制度を開始しました。

    • 対象となる教育機関:学校教育法第一条が定める「学校」※主に高等学校、高等専門学校、大学(短大、大学院を含む)
    • 無償となる費用:審査費用275,000円(税込)と認定料110,000円(税込)

    制度活用第一号として、中部大学の大学院工学研究科が承認されました。

    Ledge.ai編集部撮影

    試験対策:G検定・E資格合格者に聞きました

    実際に、株式会社レッジ内のG検定、E資格を受験している人に「総勉強時間」「勉強方法」「身についたこと」「役に立ったこと」を聞きました。

    G検定、E資格の受験を考えている人の参考になればと思います。

    G検定

    男性(Data Marketing div.データサイエンティスト)

    AIに携わった年数 1年未満
    総勉強時間 10〜20時間
    勉強方法 テキストや参考書を読み込む
    使用した参考書 『AI白書2019』『人工知能は人間を超えるか』『徹底攻略 ディープラーニングG検定 ジェネラリスト 問題集 徹底攻略シリーズ』

    女性(Corporate planning div.人事など)

    AIに携わった年数 なし
    総勉強時間 約20時間
    勉強方法 G検定公式テキスト数周(ほぼ通勤時の電車の中)、webでの模擬試験
    使用した参考書 『深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト』

    男性(Media div.ディレクター)

    AIに携わった年数 1〜2年
    総勉強時間 8〜10時間
    勉強方法 教科書と参考書をひたすら読み、例題を解く
    使用した参考書 『人工知能は人間を超えるか』『AI 白書』『深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト』

    男性(Media div.マーケティング・イベントプランニング)

    AIに携わった年数 1年未満
    総勉強時間 5時間
    勉強方法 G検定公式テキストを読み、例題を解く
    使用した参考書 『深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト』

    平均勉強時間は約9時間、AIに関わる業務をした経験がある人に関しては基本的に10時間を超えない結果となりました。参考書についてはG検定(ジェネラリスト) 公式テキストをほとんどの人が使用していました。

    また、受験を通して「身についたこと」「役に立ったこと」も聞きました。

    身についたこと

    • AI、ディープラーニング全般の基礎的な知識
    • AIを説明する方法

    役立ったこと

    • 自社ビジネスの基礎を理解することができた
    • AIの基礎が固まったことで、仕事を通して学んでいたことを再確認できたのと、今まで触れたことのなかった部分にも満遍なく学習でき、仕事に生かすことができた
    • 知識的な面ももちろん、名刺に合格者ロゴを入れられるため、名刺交換の際に話題になった
    • 取材時の信頼感がupした。イベントなどでの話題のネタになった

      E資格

      男性(Data Marketing div.マーケティング・セールス)

      AIに携わった年数 1年未満
      受講した認定プログラム 「現場で使えるディープラーニング基礎講座」(外部リンク)
      「現場で使える機械学習・データ分析基礎講座」(外部リンク)
      ※回答者は非エンジニアであり、機械学習の実装に不安があったため、受験には必須ではない機械学習講座も受講しています
      認定プログラム外の総自習時間 約100時間
      (受講した2講座の予習時間に約40時間、通し課題に約30時間、試験前の復習や試験対策に約30時間)
      使用した参考書 なし(認定プログラム内の勉強のみ)

      男性(Data Strategy Dept.機械学習エンジニア・ディレクター)

      AIに携わった年数 1年未満
      受講した認定プログラム 「現場で使えるディープラーニング基礎講座」(外部リンク)
      「現場で使える機械学習・データ分析基礎講座」(外部リンク)
      認定プログラム外の総自習時間 約100時間
      使用した参考書 ゼロから作るディープラーニング
      身についたこと

      • 画像、自然言語、予測、などそれぞれの分野の基本的な知識が身についた
      • ソリューションが思いつきやすくなり、会話の中で瞬時に打ち返せるようになった
      • ディープラーニングのような雰囲気がつかみにくい分野を、体系的に学ぶことができ、技術を整理して学ぶことができた

      役立ったこと

      • 商談時のネタになる。クライアントに興味を持ってもらえる。商談の中でどんなことをしたら良いのかがわかる(技術レベル)
      • 理論を理解してるから、再現性高く、AIの応用企画ができる

      認定プログラムの様子は、レッジの社員の受講体験記に。

      Ledge.ai編集部撮影

      合格者コミュニティ「CDLE(Community of Deep Learning Evangelists)」に参加し、情報交換なども可能

      Ledge.ai編集部撮影

      日本各地でディープラーニングの普及に向けたJDLAの活動のひとつに「CDLE(Community of Deep Learning Evangelists)」があります。

      「CDLE」は2018年に設立されたG検定・E資格の合格者コミュニティです。G検定・E資格に合格するとJDLA事務局からCDLE専用のSlackワークスペースに招待され、合格者同士が情報交換する場になっています。Slack上だけでなく、協会主催の「合格者の会」や合格者主催のMeetUpなど、オフラインの場でも交流も盛んに行われています。CDLEのSlackワークスペースは、合格者約1万5,000人のうち9,800人以上が参加する大規模なコミュニティになりつつあります。(2020年1月23日時点)

      全国高等専門学校ディープラーニングコンテスト(DCON)

      JDLAはビジネスの視点を持つ世界に通じるディープラーニングのエンジニアを高等専門学校から輩出するためのサポートを目的に、全国高等専門学校ディープラーニングコンテスト(DCON)を開催しています。

      DCONとは、高専生の日頃の学習成果を活かした「ものづくりの技術」とディープラーニングを活用した作品によって生み出される、事業性を競うコンテストです。

      Ledge.ai編集部撮影

      全国高等専門学校ディープラーニングコンテスト(DCON)2019最優秀賞(JDLA若手奨励賞)
      長岡工業高等専門学校 長岡高専プレラボチーム
      企業価値評価額は4億円、投資総額は4,000万円と事業可能性を大きく評価され、コンテスト内で提案された事業はすでにブルボンなど県内大手企業へ導入が決定しています。

      DCON公式HP(外部リンク)
      DCON公式Facebook(外部リンク)

      ディープラーニングを使った実用化の壁も徐々に浮き彫りになってきた2019年──松尾氏年頭所感


      2020年1月6日、JDLAの理事長である松尾豊氏による年頭所感を発表しました。松尾氏は、2019年についてAI人材の育成とディープラーニングの活用が着実に進んだ年だったと述べました。

      また、ディープラーニングの広がりと同時に課題として、ディープラーニングを使った実用化の壁も浮き彫りになった年でもあったと述べました。

      ――松尾氏
      2019年は、ディープラーニングの活用が着実に広がった年と言えるでしょう。(中略)同時に、ディープラーニングを使った実用化の壁も徐々に浮き彫りになってきた年でもありました。単に、「やってみました」ではなく、きちんとユーザの痛みを把握し、それを解決するような製品・サービスにつなげないと、実際に使われるようにならないということを、多くの技術者や企業が感じています。これも技術が着実に普及していることの表れでもあると思います。(日本ディープラーニング協会 2020年 年頭所感より抜粋)

      ディープラーニングやAIが「目新しい」だけでもてはやされる時代は過ぎ、産業での活用はさらに進み、なかには大きく成長する事業もあることでしょう。

      今後もディープラーニングの活用の拡大と「ディープラーニングの実用化」に取り組むJDLAに注目していきます。

      JDLA関連情報・リンク

      JDLA公式Facebook(外部リンク)
      JDLA公式YouTubeチャンネル(外部リンク)
      connpass JDLAグループ(外部リンク)

      Ledge.aiはJDLAの公式メディアパートナーを務めています。
      JDLAのリリース情報や、JDLAの取り組みを発信しています。

      インフルエンサーの信用度をAIがスコア化、いいねに代わる指標に

      株式会社A(エース)は1月27日、インフルエンサーの信用度をスコア化したマーケティングプラットフォーム「A stream」の提供を開始すると発表した。

      A streamは、企業とインフルエンサーのマッチングサービスや、インフルエンサーを対象としたヒット商品などの予測が可能なプラットフォーム。インフルエンサーマーケティングを実施したい企業向けのものだ。

      画像は公式サイトより

      >>A stream(外部サイト)

      2019年からインスタでは「いいね数」を非表示に

      エース社では5万を超すビッグデータをもとに、1万人以上のフォロワーを抱えるインスタグラマー約4000人をAIで分析。A stream上でインスタグラマーの信用度をスコア化しデータベースとして蓄積している。

      これまで、PR施策時に起用するインフルエンサーの評価軸は、フォロワー数やいいね数から測るエンゲージメント率が中心だった。しかし、2019年からインスタグラムではフィード投稿でのいいね数を非表示にするテストを進めている。

      A stream上では、インスタグラムフォロワーの男女比や年齢層、各インスタグラマーのフォロワーが抱えるフォロワー数、直近のフォロワー数の伸び率、各投稿コメント数などをはじめ、さまざまな指標を軸に、インフルエンサーの信用度をスコア化している

      この背景をうけ、2020年以降のインフルエンサーマーケティングでは、インフルエンサーの人気と影響力を評価する手法の見直しが迫られていた。

      エース社では、延べ5万人以上のインフルエンサーを運用するなかで、過去の施策やPR効果、さらに各投稿に対するエンゲージメント率などの膨大なデータをすべて蓄積。これらのデータをもとに、インフルエンサーの信用性を数値化し、いいね数にとらわれない新たな指標で評価するそうだ。

      A stream内のAIが各ブランドの施策商品のプロモーションに強いインフルエンサーを自動でマッチング。インフルエンサーのフォロワー全体に対して的確にプロモーションする仕組みを備える

      >>A stream(外部サイト)

      インフルエンサーの“不正”を見抜くAIも

      インフルエンサーを対象としたAIはいくつか登場している。なかでも話題になったのは、インフルエンサーの不正を検出するサービスだ。

      2019年5月に株式会社misosil(ミソシル)は、フォロワーを購入してフォロワー数を水増しするインフルエンサー自身の不正や、不正インフルエンサーを利用した(orしてしまった)キャンペーンを実施する企業を検知するサービスを発表した。このサービスは、同社のSNS分析ツール「Tofu Analytics」のオプション機能だ。

      昨今注目を集めたSNSでのインフルエンサーマーケティングでは、マーケティング担当者のリテラシー不足などによって、フォロワー数至上主義的なインフルエンサー起用プロモーションが横行していたそうだ。

      インフルエンサー自身もフォロワー数が多ければ報酬の高い仕事をもらえると認識していたため、実態のない海外アカウントやbot等をフォロワーとして購入しフォロワー数を水増しするアカウントもいたという。

      当然、不正にフォロワー数を増やすアカウントでプロモーションを実施しても、期待している効果は出ない。この状況に陥らないために、ミソシルは同サービスを開発したそうだ。

      いまの世界を“本当に最適化”するには人間の思考では追いつかない

      「いまの社会は、長年にわたって人間がさまざまな知恵を絞った結果、非常に暮らしやすくなっていますが、しかし、まだまだ非効率な事はたくさんあり、本当に最適化するには人間の思考では追いつかない」。

      こう語るのは、株式会社GRID(グリッド)の代表取締役・曽我部 完氏。GRIDは、電力ネットワークや工場をはじめ、さまざまな分野での最適化問題のソリューションを提供する会社だ。

      >>株式会社GRID

      最適化問題は常に我々に付きまとう問題である。そこで、曽我部氏に最適化とは何か、どのようなソリューションを提供しているのかなど、GRIDの取り組みを交えつつさまざまな問題に対する解決方法を聞いた。

      最適化問題とは何か? なぜ必要とされるのか

      曽我部氏は最適化問題について次のように言う。

      「最適化されてないと損をします。

      いま、“スマート社会”などが提唱されているのは、人間が非効率を嫌うから。つまり、無駄のない社会を築こうとしている。最適化に取り組み続けることで、多くのことに好影響を与えられます」

      最適化問題とは、特定の制約条件のもと、ある目的の最大もしくは最小となる状態を求める問題のことだ。実は、最適化問題はかなり身近な問題(課題)のひとつ。

      身近な例を挙げよう。現在地から特定の駅まで、JRや地下鉄などを乗り換えていくとき、「乗換案内アプリ」などを使うと最短時間で行けるルート、最安値で行けるルートなどを選択できる。それぞれ最適なルートを即座に表示してくれるのにも最適化が実行されている。

      要するに、目的に対し、無駄のない方法や手段を模索するのが最適化問題なのだ。

      当然、この最適化は、さまざまな分野で活用されている。たとえば、電力供給などが最たる例だ。家庭や施設などで使用する電力を最適(効率的)に制御すれば、電力発電時に発生する二酸化炭素などの排出を最小にでき、結果として環境問題への解決の一手になる。

      そのほかで言えば、コンビニエンスストアなどでの廃棄ロス削減も最適化問題として解決できる。時間帯、天候、来店客数予測などの組み合わせを加味して最適化することで売れるぶんだけのおにぎりを入荷し、売れ残って廃棄することはなくなる。

      GRIDは最適化問題を最適な手法で解決する

      GRIDでは最適化問題の解決にあたって、現実を模擬するシミュレーター(デジタルツイン)に対し、複数の最適化手法でモデル構築を実施する。手法は、MILPやヒューリスティックといった手法に加え、遺伝的アルゴリズム、深層強化学習を使う。

      複数の手法でアプローチするのには理由がある。

      「最適化問題を解くうえで、問題や課題に適した手法を選ぶのが効率いいからです。特定の手法だけで解こうとすると、どうしても限界や妥協があります。これでは良い答えにたどり着きません。そのため、企業様が抱えるそれぞれの課題を解決するために、さまざまなアプローチで最適化を図ります」(曽我部氏)。

      加えて、曽我部氏は深層強化学習を使った最適化手法のメリットも教えてくれた。

      「旧来の手法だと、状況が変わるごとに最適化計算を再度実行していました。しかし、強化学習なら状況が変化した際でも即座に対応できるのが特長です。

      たとえば、旧来手法では最適化問題を解くのに3分必要とするとします。3分前の問題に対しては解決策を打てますが、旧来手法で解き切ったタイミングで発生してしまった状況に適合しない可能性もあるわけです。その反面、強化学習なら即座に答えを導けるため、リアルタイムで最適化させることができます」

      GRIDが主に取り組んでいる最適化事例のなかに「電力システム」がある。電力システムの状況はリアルタイムで変化する。そのため、瞬時に答えを出すことが求められるそうだ。中長期的で激しい変化がない事例であれば旧来手法でも解決できるが、動的に状況が変わることに対しては強化学習が有効だと言う。

      強化学習と最適化問題の相性の良さ

      そもそも、GRIDはなぜ、最適化問題を強化学習で解決しようとしたのだろうか。

      曽我部氏は多くの人がAIについて期待している事は、「『未来がどうなるのかを予測してくれて、その時にどうすれば一番良いのかを教えてくれること』ではないか」と言う。

      あわせて、次のように述べた。

      「強化学習のいいところは、AIが“望ましい”とされる回答や行動をしたときに『報酬』を与えられる点です。つまり、100%のベストな回答ではなくても、一定基準を超す“良い結果”を出したときにも報酬を与えられるのです。この“曖昧さ”は最適化問題を解く時に非常に有効です。

      最適化問題とは、現状よりも良い状況を目指しますが、予測については予測数値が当たるか否かで判断されます。イベント会場を運営する人になったつもりで考えてみてください。1万人が来場すると予想を立てたものの、結果的には9900人しか来場しなかった。これは“ハズレ”になりますが、過去1万人を集客するのに必要な広告費用を最適化して削減できる、と最適化の世界では“よし”とされます。人によって基準は異なると思うものの、状況に応じて効率的なアクションを出せるのが強化学習なのです」

      もちろん、GRIDは100%ベストな最適化解決をしているわけではない。いま、最適化問題では量子コンピュータの活用が始まっている。すでに一部製品化したモデルもあるなど、実用化を進めている。

      今後は、実際の問題を量子コンピュータも活用して解くそうだ。従来の最適化計算では、組み合わせが膨大になると厳密計算が困難になるので、探索的に良い解を求める方法を取る、“良さそうな解を出す”ことが目的だった。だが、量子コンピュータを使えば“厳密計算”も可能になり、ベストな回答を提供できるようになるそうだ。

      ちなみに、量子コンピュータに関してGRIDは、昨年7月にはIBMの「IBM Q Network」にも参加したり、論文を発表したりしている。

      いまの世界は人間が「最適化した」と思っている

      曽我部氏が取材時に繰り返したのは「人間では最適化問題を解決しきれない」ということだった。

      ひとつの課題を解決するぶんには全く問題ないものの、最適化をするにあたって5個、10個と考慮しないといけない制約や条件があると、通常人間は思考を放棄・妥協してしまう。その点、機械学習などの技術を使えば、考慮すべき条件が多くても最適化を果たしてくれる、と曽我部氏は言う。

      曽我部氏は続けて次のように話してくれた。

      「いま、私たちが暮らしているこの社会は、人間が何年にも渡って努力して『最適化した』結果だと思っているんです。もちろん、100年前の東京と、いまの東京とでは、いまのほうが生活しやすいことのほうが多いはずです。ただ、これは人間が手動で導き出した結果。裏を返せば、これからの時代では機械の力で最適化が可能になります。

      GRIDでは電力やサプライチェーンなど、社会インフラの最適化問題を解決しています。徐々に最適化することで、社会が抱える課題を解決し、より生活しやすい環境に変えていけるはずです。最適化は簡単なことではないですが、社会的意義のあることだと思います」。

      複数手法を用いて最適化問題に立ち向かうGRIDが心がけているのは、“アルゴリズムありき”で課題を解決しないということだ。アルゴリズムありきだと、どうしても解決できない壁にぶつかることがあるそう。反面、GRIDは顧客ニーズに応えることで、ひとつずつ社会課題を解消していく。その先にあるのは、最適化された世界だ。

      >>株式会社GRID

      岐阜県大垣市役所がAI導入、担当課の案内や申請書の書き方を説明

      タケロボ株式会社は1月24日に、岐阜県の大垣市役所にAIを搭載したロボットが導入されたことを発表した。すでに本番稼働中とのことだ。

      案内ロボット「ロボコット」。コミュニケーションインタフェースとして、音声(認識・発話)、画面(タッチパネル)、手書きを装備し、AIを活用した各種案内を行うぬいぐるみを被ったロボットだ

      4言語に対応など各設置場所に応じた案内を提供

      大垣市役所に導入されたのは、案内ロボット「ロボコット」呼ばれるもの。大垣市役所にはロボコットが3台設置され、各設置場所に応じた案内を提供するという。

      主な機能や特徴は以下(プレスリリースより転載)。

      総合案内カウンター設置の窓口案内支援用

      • 総合案内
      • 来庁した目的を伝える(話し掛ける)と、担当課を案内します。

      • 多言語による案内
      • 総合案内は日本語に加え、英語、ポルトガル語、中国語でも対応可能。

      • QRコード連携
      • 担当課の場所は地図を表示するとともに、QRコードを表示し、スマホで地図を表示することができます。

      • 移動案内ロボットの呼出し
      • 移動して案内をするロボットを呼び出す機能も装備しています。

      サービス課カウンターおよび障がい福祉課カウンター設置の各種案内支援用

      • 申請書の書き方説明
      • 住民票等の写し、印鑑証明書、など各種申請書の書き方を説明します。

      • 翻訳支援
      • 英語、ポルトガル語、中国語と日本語間の翻訳を行います。

      • 筆談支援
      • 話すことが困難な方の筆談対応を支援します。

      画像は大垣市の公式サイトより

      タケロボのプレスリリースによれば、運用におけるAIの追加学習などは、利用状況に応じて対応するとのこと。

      >>プレスリリース(@press)

      官公庁で進むAI導入、青森県庁では議事録を自動作成

      実は大垣市だけでなく、いま、さまざまな市区町村でAIの導入が進められている。

      今年1月9日には、青森県庁で会議の議事録を自動で作成するAIの導入が発表された。

      AI議事録を使用中の様子

      議事録を作るという作業は、会議を実施している企業などにとっては必要不可欠なこと。ただ、実際に作ってみると、会議時間の何倍もの制作時間を要することもしばしば。そこで、業務の効率化をするためにも青森県庁ではAI議事録を導入することになったそうだ。

      役所などが率先してAIを導入し、単純作業を効率化させることで、人には人だからできる作業に集中させるような風土が構築されそうだ。

      データマイニングとは何か|できること・代表的な解析手法・AIとの関連を紐解く

      データマイニングは、ビッグデータをマーケティングに役立てるにあたって重要なものとなります。

      本稿では、データマイニングでできることや、データマイニングのプロセス、クラスタリングをはじめとしたデータマイニングで使われる統計的手法、AI(機械学習)とデータマイニングの関連性などについて解説します。

      データマイニングとは何か

      画像出典:pixabay

      データマイニングとは、企業などが収集した大量のデータから、知識を発見するために行われるものです。データから有益な情報を採掘(マイニング)することからこのように呼ばれます。

      データマイニングでは、顧客の購買行動などのデータを解析することにより、商品の購入率などを予測したり、顧客や商品を分類したり、関連するデータを見つけ出したりすることができます。

      データマイニングでできること

      データマイニングは、大量のデータの中から価値ある情報を見つけ出すことを目的としています。データマイニングでできることは、「分類」「関連性を見つける」「結果の予測や評価」の3つに大別できます。

      • 発生確率の予測
        収集したデータから、受注、購入といった特定の事象が発生する確率および、その発生要因を明確にします。

      • データの分類
        収集した顧客や商品などに関するデータを、特徴に応じて分類します。

      • データの関連性を見つける
        収集したデータから、同時に発生する頻度の高い事象を見つけます。

      データマイニングの目的は大きく二分される

      データマイニングを行う目的は、以下の2つに大別することができます。

      • データマイニングの目的①知識発見(探索)
        知識発見は、蓄積されたデータから新しいパターンやルールを見つけ出すものです。データ量が多い場合に有効な手段で、機械学習やディープラーニングが多く利用されます。

      • データマイニングの目的②仮説検証
        仮説検証では、事前に仮説を用意し、検証したい課題の解決に必要なデータを集め分析します。機械学習やディープラーニングに限らず、従来の統計的手法が使われることもよくあります。
      参考:テキストマイニングとは
      データマイニングのうち、文字列からテキストデータを分析することをテキストマイニングといいます。おもに自然言語を対象としており、SNSに投稿された口コミの分析や、自由記述形式のアンケートを扱う場合などに利用されます。また、ウェブページを対象にしたデータマイニングはWebマイニングと呼ばれています。

      「知識発見」と「仮説検証」が、マーケティングの課題を解決する

      データマイニングは、幅広い業界でマーケティングの課題を解決するために役立っています。たとえば、以下のようなケースで活用されています。

      • 小売業
        顧客データベースを活用することで、より効果的なキャンペーンを実施することや、顧客に対して効果的なオファーを行うことが可能になります。

      • 製造業
        製造業では、生産設備の老朽化を把握することや、設備の保守・整備を適切なタイミングで実施することにデータマイニングが役立ちます。

      • 教育
        学生の学習の進捗状況データから学生の理解度を予測することにより、教員が最適な指導を行えるようになります。

      データマイニングに必要なもの、プロセス

      画像出典:pixabay

      データマイニングを始めるにはどうすればいいか

      データマイニングは、以下の手順で実施します。

      1. 目的を定め、目的に沿ったデータを集める
        「ともかくビッグデータさえあればOK」というわけではありません。データ効果的なデータマイニングを実施するためには、目的と合致したデータを集める必要があります。そのためにはまず、データ収集の目的をしっかり定め、その目的に合ったデータを用意することが求められます。

      2. 収集したデータの加工・整理
        収集したデータには、「ノイズ」が含まれているため、そのまますぐに分析を行うことはできません。データがある程度揃った後は、それらのデータ加工・整理する「データクレンジング」の作業が必要になります。

      3. 分析(パターンの発見、グループ化など)
        分析のプロセスでは、クラスタリングやロジスティック回帰分析、マーケット・バスケットといった手法を用いて、データのパターンを発見したりグループ化したりします。それぞれの分析手法の詳細については後述します。

      4. 検証、評価
        分析の実施後は、その分析結果について要因の特定を行います。さらに、検証結果を基にルールを作成して仕組み化し、それを実際のデータに当てはめることで検証・評価を行います。

      データマイニングの分析手法とは

      画像出典:pixabay

      データ分析と統計分析

      データマイニングでは、以下の3つの分析手法がよく使用されます。

      • クラスタリング
        クラスタリングは、データを類似性に基づいて分類するための手法です。購買データをもとに同じような行動をとっている顧客をグループ化し、そのグループごとに異なるマーケティング施策を実施する場合などに役立ちます。

      • ロジスティック回帰分析
        ロジスティック回帰分析は、「Yes」「No」を明確に定義できるものを分析する場合に適した手法です。たとえば、キャンペーン実施時に、DMを送付した顧客が商品を購入するかどうかを予測する場合などに用いられます。

      • マーケット・バスケット
        マーケット・バスケット分析は、小売店の販売データから同時に買われることの多い商品を見つける際に使われる手法です。
        関連性が薄いように見えて実は同時に購入されることの多い商品や、逆に関連商品のように思えても同時に購入されることが少ない商品を明確にすることで、効果的な売り場づくりに役立ちます。

      データ分析とAI(機械学習)

      データマイニングは、先述した統計分析手法を使って実施しますが、このプロセスにおいて、AI(機械学習)を使うこともあります。AIを使ったデータ分析では、PythonやRなどのプログラム言語がよく使用されます。とくに特にPythonは、データ分析をするのに便利なライブラリが充実しているため利用しやすく、データから法則や関連性を見出す「知識発見」である場合には、有効な手法となります。

      データマイニングが、新たな知見の発見につながる

      画像出典:pixabay

      データマイニングに関する有名な事例として、「ビールと紙おむつ」があります。これは、「紙おむつを購入した男性は、同時に缶ビールを購入することが多い」というデータに基づき、この2つを並べて陳列するようにした結果、売り上げ上昇につながったという米国のスーパーでの事例です。

      「ビールと紙おむつ」では、データマイニングを行ったからこそ、一見まったく関係ないように見える2つの商品の関連性を発見することができました。ここからわかるように、データマイニングをマーケティングに活用することで、これまで思いもよらなかった法則や知見を得ることが可能になり、ビジネスを加速させることができるかもしれません。

      ただし、データマイニングを行う目的が「ビッグデータを使うこと」そのものになってしまうことは避けるべきです。データマイニングはあくまでもマーケティング手段であると認識し、ビッグデータの利用自体を目的化しないことが大切です。

      テキストマイニングとは | 文字分析のやり方とおすすめ無料ソフトウェア比較

      AI(人工知能)の自然言語データと密接な関わりを持つテキストマイニング。自由形式で記述された文章を分析するための手法です。たとえばSNSへの投稿をはじめとした大量の文字情報をビッグデータとして有効に活用するうえでも重要な技術です。

      本稿では、テキストマイニングの概要や活用シーン、無料でできるテキストマイニングの方法などを解説します。

      テキストマイニングとは? 分析する理由と、そのやり方

      テキストマイニングとは、文章を定量的に扱うための分析手法です。自由形式で記述された文章を単語単位に分割し、単語の出現頻度や相関関係、投稿時期などを分析することで、有益な情報を探し出すために使われます。

      テキストマイニングを行うことで、テキストの中で使われている単語や、その単語の使用頻度といった全体像や、どんな単語が増えているかといった特徴を分析することが可能になります。

      参考:データマイニングとは
      データマイニングとは、企業などが収集した大量のデータから、知識を発見するために行われるものです。データから有益な情報を採掘(マイニング)することからこのように呼ばれます。

      データマイニングでは、顧客の購買行動などのデータを解析することにより、商品の購入率などを予測したり、顧客や商品を分類したり、関連するデータを見つけ出したりすることができます。

      テキストマイニングができることとそのメリット

      インターネット上には、SNSへの投稿や口コミなどが、毎日大量に投稿されます。それらの情報の中には、企業のマーケティングや製品開発に役立つ情報も多数含まれています。しかし、人間が膨大な量の投稿を読んでそこから有益な情報を見つけ出すことは現実的ではありません。そこで役立つのがテキストマイニングです。

      テキストマイニングでは、大量のテキストをデータとして分析し、その内容を抽出できるので、ネット上などに集まる有益な情報を効率的に収集できます。

      テキストマイニングの実施方法

      テキストマイニングを実施するには、まず、分析の対象となるテキストデータを用意する必要があります。そのデータを後述するツールなどを使用して解析します。

      ツールによる解析では、文章を名詞や助詞などの最小単位に分割し、それぞれの品詞の種類や活用形を分析する「形態素解析」とよばれる手法を用いた処理が行われます。

      そして、文章内で使われる各単語の出現率や出現パターンの近い単語を可視化したり、使用される単語からユーザーの感情を分析したりします。

      テキストマイニングはどんな仕事で活用できる?

      画像出典:pixabay

      文字ベースで集まった情報の扱いで強みを発揮するテキストマイニング。活用が期待できる仕事を具体的にご紹介します。

      テキストマイニングを活用するべき仕事

      テキストマイニングは、ユーザーの本音を知るにはとても効果的な手法です。ユーザーの声を業務に生かすことが重要となる仕事では、大いに活用できます。

      • マーケティング
      • SNSや口コミサイトの投稿から商品購入者や購入を考えている人のリアルな声を集めることで、ユーザーの属性に応じた効果的なアプローチが可能になります。また、自社ブランドがどのように受け止められているかを調査したり、競合調査を実施したりする場合にも役立ちます。

      • 商品開発
      • ユーザーの抱えている悩みや不満を知ることで、商品開発のヒントとなる情報を得ることができます。

      • クレーム対策
      • コールセンターやWebサイトからの問い合わせの記録から、過去にどんなクレームが多く寄せられているかを明確にすることで、炎上を未然に防ぐための対策を講じることが可能になります。

      テキストマイニングは無料でできる! おすすめソフトウェアまとめ

      画像出典:pixabay

      無料で使える3ソフトウェア比較

      テキストマイニングは費用をかけなくても可能です。無料で利用できるデータマイニングツールをいくつかご紹介します。

      テキストマイニングツール by ユーザーローカル
      画像出典:ユーザーローカル

      ダウンロード不要でブラウザ上から使えるツール。単語の頻出度や、出現パターンの似た単語を線で結んだ「共起キーワード」、出現傾向の似た単語を樹形図で示した「階層的クラスタリング」といったテキストマイニングの基本機能を手軽に利用できる。

      KH Coder
      画像出典:KH Coder

      Windows版のソフトウェアに加え、必要に応じて機能の追加などもできるソースコードも公開されている。Macではソースコードから起動するか、有償サポートで提供されている自動設定ソフトウェアを使うことで利用可能。

      統計ソフトR
      画像出典:R Foundation

      Windows版、Mac版、Linux版が公開されている。コンソール画面からプログラムを入力して解析する。

      有料ソフトウェアならより詳細な解析もできる!

      無料のデータマイニングツールを使っていて、機能面で物足りなさを感じた場合には、有料のソフトウェアを導入する選択もよいでしょう。参考までに1例だけ紹介します。

      Text Mining Studio(テキストマイニングスタジオ)
      価格:要問い合わせ

      無料ソフトでも行える、単語や係り受けごとの分析といった機能に加え、年齢をもとにして 「年代」 という新たな属性を作成するなど、既存の属性から新たな属性を作り出したり、文章を指定のクラスタに分類したりできる。さらには、各クラスタの属性分布や単語分布、代表的な単語などを抽出するといった詳細な分析も可能です。

      分析結果はビジュアルでの表示に加え、CSVなどで書き出すことも可能です。

      テキストマイニングはエクセルでも可能? データ分析に使う関数とは

      画像出典:pixabay

      使い慣れたソフトでテキストマイニングを実施したいなら、Excelを使う選択もあります。具体的な手順を以下にご紹介します。

      Excelでテキストマイニングをする方法

      Excelを使ってテキストマイニングを実施する場合、あらかじめテキストを単語レベルに分解する必要があります。

      この作業には、「MeCab」や「Janome」などの解析エンジンを利用できます。

      その後、単語の出現頻度などをExcel関数を使って分析します。

      テキストマイニングで使うExcel関数は?

      テキストマイニングでは、下記の関数が役に立ちます。

    • COUNTIF関数
    • 単語の出現回数を集計する場合などに使用。

    • SUM関数
    • 特定の範囲の単語の個数を集計する場合などにCOUNTIF関数とあわせて使用。

    • INDEX関数
    • 指定したセルの値を表示できる関数。SUM関数とあわせて使うことで、指定したセルからINDEX関数で指定した範囲までの合計値を求める場合などに使用。

      テキストマイニングは日本語には不向き?

      ここまで解説してきたように、大量の文章から有益な情報を得るために効果的なテキストマイニングですが、万能というわけではありません。

      日本語の場合、同じ意味を表す言葉に多数のバリエーションがあったり、逆に、同じ単語が複数の意味を持っていたりすることが多いため、英語に比べると難易度は高くなってしまいます。

      しかし、「日本語ではテキストマイニングは役に立たない」というわけではありません。解析時の判定で誤りの生じやすい単語についても、辞書のアップデートによってある程度の対応が可能です。

      英語と同レベルの精度での解析は現状では難しいとはいえ、テキストマイニングを実施すること自体には十分な効果を期待できると言えるでしょう。

      個人がSNSで情報発信をすることが当たり前になった今、ネット上に集まるユーザーの本音は企業にとって非常に重要なデータです。テキストマイニングは、それらの情報を収集する上で重要な技術となってきているのです。