IMAGE BY SAM WHITNEY; GETTY IMAGES

AIが浮き彫りにしたジェンダーバイアス:米下院議員の画像にタグ付けさせる実験から見えてきたこと

画像認識の人工知能(AI)に米下院議員の写真を判断させたところ、女性の画像に対して身体的な外見に関するラベル付けの数が男性の3倍にもなるという実験結果が公表された。こうした結果からは、社会に浸透しているジェンダーバイアスがAIが“再現”している実情が浮き彫りになってくる。

Nature

男性は女性を外見で判断しがちだと言われる。どうやらコンピューターも同じようだ。

グーグルのクラウド型画像認識サーヴィスに米下院議員の写真を判断させたところ、女性の画像に付けられた身体的な外見に関するアノテーション(ラベル付け)の数が男性の3倍になった──。そんな研究結果を、このほど米国と欧州の研究チームが明らかにした。男性の画像に多く付けられたラベルの上位は「official(仕事上の、公式の)」「businessperson(ビジネスパーソン)」だったが、これに対して女性は「smile(笑顔)」「chin(あご)」だった。

「女性は地位が低いというステレオタイプを当てはめている結果です。女性は見た目がきれいであればいい、男性はビジネスリーダー、というステレオタイプです」と、研究者のひとりでドイツのケルンにあるGESISライプニッツ社会科学研究所の博士研究員のカーステン・シュヴェンマーは説明する。今回の研究は、ほかにニューヨーク大学、アメリカン大学、ユニヴァーシティ・カレッジ・ダブリン、ミシガン大学、非営利団体「California YIMBY」の研究者が共同で実施し、11月11日付で論文を発表した

研究チームが画像分析テストを実施したのは、グーグルのほか、競合であるアマゾン、マイクロソフトのAI画像認識サーヴィスである。議員の公式写真と本人によるTwitterの投稿写真にこれらのサーヴィスがどんなラベルを付けたのか、クラウドソーシングで依頼したスタッフに確認してもらった。

gender-bias-google

グーグルのAI画像認識サーヴィスは、写真のスティーヴ・デインズのような男性議員を「ビジネスパーソン」とみなし、ルシール・ロイバル・アラードのような女性議員を外見に関連する単語でタグ付けする傾向がみられた。IMAGE BY CARSTEN SCHWEMMER

AIによる画像認識サーヴィスは基本的に、人間が写真を見たときに目にするものと同じものを見ている。ところが、画像が女性か男性かによって異なるものを認識する傾向が出た。女性の場合、外見で特徴づける傾向がより強いことが明らかになっている。女性議員の画像に「girl(若い女性)」「beauty(美)」とタグを付けるケースが多かったのだ。女性を識別しない傾向もあり、女性を認識できない確率は男性よりもずっと高かった。

存在してきたバイアスをAIが再現

今回の研究は、アルゴリズムというものが数学的な公平さで世界を見ているとは言えず、これまで存在してきた文化的なバイアス(偏見)を再現したり、ときに増幅することすらある現実を裏づける証拠となった。この研究が実施された背景のひとつに、2018年のプロジェクト「Gender Shades」がある。このプロジェクトでは、マイクロソフトとIBMのAIクラウドサーヴィスが白人男性の認識については極めて精度が高い一方で、黒人女性の認識精度が非常に低い事実を明らかにしている。

今回の研究結果は発表されたばかりだが、対象としたAIサーヴィスのデータ収集は2018年に実施されている。『WIRED』US版がカリフォルニア州議会議員の男女10名ずつの公式画像を使って実験したところ、現在も同様の結果を確認できた。

gender-bias-google

アマゾンの画像認識サーヴィス「Amazon Rekognition」にカリフォルニア州議会議員の写真を分析させたところ、女性議員に「girl(若い女性)」「kid(子ども)」のタグ付けをするケースがあった。一方、男性議員について同様の傾向はみられなかった。写真は共和党所属の女性議員、リンリン・チャン。IMAGE BY WIRED STAFF VIA AMAZON

分析した20人の写真は、いずれも笑顔である。グーグルの画像認識サーヴィスが「笑顔」を最も高い確率でラベル付けしたのは、男性1人に対し女性では7人にのぼった。

また、男性については10人全員を「ビジネスパーソン」とラベル付けし、「official(仕事上の、公式の)」「white collar worker(ホワイトカラー労働者)」のラベルが付くケースも多かった。女性議員でこの3つのラベルのいずれかが付けられたのは5人だけだった。女性には「skin(肌)」「hairstyle(髪型)」「neck(首)」など外見関連のラベルも散見されたが、男性には該当しなかった。

アマゾンとマイクロソフトの同種のサーヴィスでは、グーグルよりはあからさまなバイアスが少ないように見えるが、アマゾンは10人中2人の女性議員を99パーセント超の確率で「若い女性」か「子ども」であると判定している。男性10名のうち、未成年者と認識された例はなかった。マイクロソフトは男性の写真をすべて男性と認識したが、女性を女性と認識したのは8人で、1人を男性と判断、もう1人はジェンダーのタグ付けをしなかった。

浮かび上がったジェンダーバイアス

グーグルは今年2月、外見で性別を推測することはできないとして、AI画像認識サーヴィスで性別のタグ付けをやめると発表している。グーグルのクラウド部門でAI担当ディレクターを務めるトレイシー・フレイは、会社としてはバイアスを減らすために継続的に取り組んでおり、外部からの意見を歓迎すると語る。「当社は常に改善に向け努力していますし、学術研究者など外部関係者とも引き続き連携していきます」

なお、アマゾンとマイクロソフトは本件に関してコメントしていない。いずれのサーヴィスも、性別を認識するラベルは女性か男性のいずれかしかない。

今回の研究に影響を与えた事例のひとつが、世界報道写真大賞を受賞した写真を研究者がグーグルの画像認識サーヴィスにかけたときの結果だった。テキサスの国境近くでホンジュラスから来た母親が国境警備隊の取り調べを受け、その横で泣く女児をとらえた心を揺さぶられる1枚である。

グーグルのAIは、この写真が77パーセントの確率で「fun(楽しいこと)」であると認識した。「子ども」と判断したラベルの52パーセントよりも高い。『WIRED』US版で同じ写真をグーグルのサーヴィスにかけたところ、やはり同じ判断が出ている。

GESISライプニッツ社会科学研究所のシュヴェンマーらがグーグルの画像認識サーヴィスで実験を始めたのは、人々がインターネット上で政治の話をする際にどのように画像を活用しているのか、パターンを探るために活用できないかと考えたからだった。ところが分析を進めていくと、画像認識サーヴィスに含まれるジェンダーバイアスが明らかになったのである。

これを受けてシュヴェンマーは、この技術は研究者が期待したような目的で使える段階にはなく、企業がこの種のサーヴィスを取り入れれば好ましくない結果を招く、と確信したという。「完全に誤った現状認識をしてしまう可能性があります」と、シュヴェンマーは警告する。

例えば、企業が偏りのあるAIツールを使って膨大な画像データを分類すれば、女性を「笑顔」のラベルで判定するあまり、女性にビジネスパーソンがいても意図せずして存在を見えなくしてしまう恐れがある。

gender-bias-google

2019年の世界報道写真大賞を受賞した、米国とメキシコの国境付近で泣き叫ぶ少女の写真。審査員は「心理的な暴力」が表現されていると評した。グーグルの画像分析アルゴリズムは写真に「fun(楽しいこと)」が含まれると判断している。IMAGE BY WIRED STAFF VIA GOOGLE

訓練用のデータに偏り?

過去の研究では、ラベル付けされた主要な画像データセットを画像認識アルゴリズムの訓練に使ったところ、料理を女性、射撃を男性に結びつけるといった重大なジェンダーバイアスが報告されている。偏りの背景には、研究者がネット上で画像を収集してきた結果、社会に存在するバイアスが画像にも反映されている現実が挙げられる。

ビジネスパーソンとして提示されている事例が、女性より男性のほうがずっと多いこともその一例だ。こうしたデータセットを使って訓練された機械学習アルゴリズムは、元の画像データに潜むバイアスを増幅させるという結果も出ている。

今回明らかになったグーグルのサーヴィスに含まれるバイアスも、おそらく訓練用のデータに偏りがあったからだとシュヴェンマーはみる。ただし、グーグルのシステムにアクセスできない以上、確かなことはわからない。

AIシステムの欠点やバイアスを突き止めて修正していく動きは、ここ数年の研究テーマとして注目度が高まっている。人間は画像から読み取れる細かな背景を瞬時に判断できるが、AIのソフトウェアは画像を構成するピクセルのパターンに焦点を絞って判断することから、齟齬が生じる余地は大きいのだ。

アルゴリズムの画像処理の進化に伴い、この問題はますます切迫した課題になっている。「いま、この種のアルゴリズムはあらゆるところで利用されています」と、プリンストン大学の助教授であるオルガ・ルサコフスキーは言う。「こうしたツールが社会で正しく機能しているか、意図しない結果をのちに招いていないか、きちんと確かめる必要があります」

gender-bias-google

IMAGE BY WIRED STAFF VIA GOOGLE

gender-bias-google

研究調査および『WIRED』US版の実験によると、グーグルの画像認識サーヴィスが女性議員には外見に関する単語をラベル付けし、男性議員には「businessperson(ビジネスパーソン)」「elder(年配者)」などのラベル付けをする傾向を確認した。上はカリフォルニア州議会議員キャスリーン・ガルジアーニ、下は同じく州議会議員のジム・ビール。IMAGE BY WIRED STAFF VIA GOOGLE

訓練データの改良が解決策のひとつに

対策としてのアプローチのひとつが、機械学習システムがバイアスを習得する根本的な原因になる訓練データの改良だ。ルサコフスキ-はプリンストン大学で「REVISE」と呼ばれるツールの開発プロジェクトに携わっている。画像データ集に地理やジェンダーなどの点で偏りが含まれていれば、自動的に検知して知らせるツールだ。

グーグルが提供する900万点の画像データセット「Open Images」に研究チームがREVISEを適用したところ、男性は女性よりも屋外の場面やスポーツ競技場にタグ付けされる頻度が高かった。また、「sports uniform(スポーツのユニフォーム)」のタグが付けられた男性の写真は大多数が屋外で野球などのスポーツをしている一方で、女性は屋内でバスケットボールをしていたり水着を着ていたりする画像が目立った。研究チームは、スポーツをしている場面を含め、女性が屋外にいる画像を増やすことを提言している。

グーグルをはじめとするAIサーヴィスの開発側は、自身もAIにおける公平性やバイアスに関する研究に進んで取り組んでいる。例としては、AIソフトとデータセットの限界や内容を標準化して開発者側に伝える方法を構築しようとする案もある。これはいわば、AIの栄養成分表示のようなものだ。

グーグルは「モデルカード」と呼ばれるフォーマットを開発し、自社が提供するクラウド画像認識サーヴィスの顔認識、オブジェクト認識のコンポーネントとして公開している。グーグルの顔認識技術はジェンダーにかかわらずおおよそ同等に機能する、との主張もあるが、その他のかたちでAIのジェンダーバイアスが働く可能性については言及していない。

※『WIRED』による人工知能(AI)の関連記事はこちら


RELATED ARTICLES

Business

フェイスブックのAIにも「認知バイアス」による偏見が潜んでいた

人工知能が「偏見」を学んでしまった──画像認識で「白人男性」より「黒人女性」の識別率が低かった理由

グーグルの画像認識システムは、まだ「ゴリラ問題」を解決できていない──見えてきた「機械学習の課題」


顧客の声たる「Xデータ」が実装する真のカスタマーエクスペリエンス

多くの企業がこぞって着手するデジタル変革(DX=Digital Transformation)は、果たして現在のみならず未来においても真に価値のあるものになっているのだろうか。「いま求められるカスタマーエクスペリエンスの実装の鍵は『Xデータ(eXperience Data)』が握る」とSAP ジャパンのヴァイスプレジデント森川衡と富田裕史は語る。

PROMOTION

玄関だけが美しいECサイトが溢れている

「いかにしてカスタマーエクスペリエンス(CX)、あるいは体験価値を高めるか」

急速にオフラインからオンラインへの転換を迫られた企業の多くは、いま、この難題に頭を悩ませている。

エンタープライズ・アプリケーションの世界最大手企業であるSAPは、そのひとつの解として、リアルタイムで“顧客の声”を集め、その声をほぼ同時にEND to ENDでCXに反映していくエクスペリエンスマネジメントを提案している。

SAPジャパン カスタマーエクスペリエンス事業本部本部長の富田裕史は、「今回のパンデミックによって企業と顧客の関係性は大きく変化した」と話す。

「人々が家にこもる生活が続き、オンラインで購買行動を完結させるケースが圧倒的に増えました。その結果、バイイングパワーが“顧客”へと急激にシフトしています。これは言い換えると顧客に寄り添った施策やデジタル変革(DX=Digital Transformation)の実装が待ったなしの状況になっていることを意味します」

モノやサーヴィスを売る企業であれば、ECサイトを備えていることは当たり前。サイト運営の担当者、経営者は当然のことだが、製造・調達、物流、アフターサーヴィスなど、あらゆるセクションのオーナーまでもがECサイトのクオリティ(CX)に気を配れているかが問われている。

実際にパンデミック以降、SAPには「カスタマージャニーの再定義を手伝って欲しい」というクライアントからの依頼が数多く寄せられている。そこにはニューノーマル時代において変化する顧客層への対応と、コロナ禍以前とは異なるビジネスモデルを模索する企業の姿が浮かび上がる。

富田裕史|YASUSHI TOMITA
SAPジャパン バイスプレジデント、SAP Customer Experience 事業本部事業本部長。日本におけるSAP Customer Experienceポートフォリオの事業担当。日本を代表するコングロマリット製造業向け営業責任者、SAS Instituteでビジネスインテリジェンスやマーケティングオートメーションの営業を務めたほか、システムインテグレーターにて西日本地域におけるCRMビジネス事業統括などを経験し現職。

「スタイリッシュで見やすいECサイトをつくっても、それはフロントエンドの話にすぎません。住宅に例えれば玄関まわりだけを整備したのと同じ。大切なのはリヴィングやダイニング、キッチン、浴室、そして寝室をどこに配置するかといった玄関から先の間取り(バックエンド)の使いやすさです。つまり在庫切れを防いだり、迅速な発送やリアルタイムで配送状況が確認できるかなど、変化する顧客のペルソナに合わせてEND to ENDで設計を行なえているかがCXにとって重要なのです」

エクスペリエンスのギャップを埋める

企業はスピーディーかつドラスティックな変化が求められる時代だからこそ、市場で生まれるエクスペリエンスのギャップにいち早く気づき、埋めていかなければならない。

森川 衡|HAKARU MORIKAWA
SAPジャパン バイスプレジデント、ソリューション統括本部長兼インダストリーバリューエンジニアリング統括本部長。早稲田大学卒業後、大手鉄鋼会社に入社。その後外資系ITベンダー、大手小売IT部門責任者を経て、2016年より現職。

「世の中のCEOの約80パーセントが自社の製品やサーヴィスが最高のエクスペリエンスを提供していると考えています。しかし、実際に企業から最高のエクスペリエンスを提供してもらっていると感じている顧客はたったの8パーセントという調査結果があります。この72パーセントのエクスペリエンスのギャップを捉えて、これまでスターバックスやGoogle、Uberなどのディスラプターが出てきたのは周知の通りです。言い換えれば、このエクスペリエンスギャップを正確に把握して埋めていければ、つまりエクスペリエンスマネジメントできれば、市場のディスラプターにもなれると思います」と同社ソリューション統括本部長である森川衝は言う。

当然、コロナ禍で注力されるオンライン(EC)と従来のオフライン(店舗)で生じるCXのギャップにも注意が必要だ、と富田は続ける。

「オフラインであれ、オンラインであれ、たった一度の残念な体験を理由に65パーセントもの顧客が購入するブランドを乗り換えたことがあるというデータがあります。ひとりの顧客がどの購買チャネルを利用したとしても、商品の選定から購入、さらにはアフターサポートまで、同じようなCXを提供できるかが問われています」

いま、多くの企業に求められるCXとは、ECサイトや顧客管理システム(CRM)などの刷新ではなく、リアルタイムで「顧客の声=ヴォイス・オブ・カスタマー」を集め、顧客の不満を解決するための改善をEND to ENDで反映していくこと。

「ECサイトのログやCRMは、結果の蓄積が示す実績データでしかありません。しかし、われわれが言うCXは、企業に蓄積されているデータだけで物事を考えるのではなく、顧客の声から『顧客が瞬間、瞬間に感じているエクスペリエンスを把握する』というラストワンマイルまで手を延ばしてサーヴィスを提供すること。それこそが本当のEND to ENDだと考えます。その鍵を握るのが顧客の声たるXデータなのです」(富田)

XとOで実現する顧客経験価値のマネジメント

Xデータとは、顧客満足度や従業員エンゲージメント、さらにはブランド認知度やユーザー体験といったエクスペリエンスに関するあらゆるデータを意味する。SAPはXデータを取得するため、2018年にオンライン調査・分析の支援サーヴィスを提供する米国のクアルトリクス社を80億ドルで買収している。

過去を捉えるOデータと、顧客の「今」を把握するXデータという異なるふたつのデータを駆使することで、顧客の声をリアルタイムでEND to ENDのカスタマージャーニーに反映することが可能になる。

SAPが従来から提供する統合基幹業務システム(ERP)などで実績を蓄積したOデータ(Operational Data)にXデータを統合すれば、企業は「何(What)が起きているのか」だけでなく、「なぜ(Why)そうなるのか」というインサイトが得られ、改善のアクションにつなげていくことができる。

「われわれが言うエクスペリエンスマネジメントの領域は、端的に言うと『ヴォイス・オブ・カスタマー』です。われわれがサポートをした自動車メーカーはXデータを活用するため、月に一度の割合で実施していた顧客満足度調査を、修理や車検などでタッチポイントが生まれたタイミングでリアルタイムに回答できる仕組みに変更しました。それによって回答率が上がっただけでなく、問題が起きたまさにその時の感想が返ってくるようになりました。定期的に行なっていた顧客満足度調査よりも詳細な回答を得られるようになったのです」

そのクルマの不調に対する不満や、修理に対しての満足度などが反映されたXデータをOデータを含めたSAPのシステムと統合することで得られたインサイトを元に、ディーラー網を通じた部品の調達時間の短縮や即座に修理に対応できる体制整備などへとつなげていった。

「顧客からのクレームを『今後の当社のオペレーション改善に活かします』といったおざなりな回答で済ませても、顧客満足度は下がるだけです。クルマに不具合があるならば、その部品を早急に手配して修理することが必要ですし、部品が欠品していれば一刻も早く納品することが求められます。お客様の状況次第では代車を手配する必要もあるでしょう。お客様が困っているのは「いま」なのですから、「いま」もしくは「一刻も早く」対応するために、エクスペリエンスマネジメントだけでなく、リアルタイムでアクションを取れるオペレーショナルシステムが必要なのです」

スピーディーな変革を実現する標準化と柔軟性

消費者と企業のバイイングパワーの不均衡とともに現れるネガティヴインフルエンサーの存在にも注意を払わなければならない。

「顧客が企業のサーヴィスに少しでも不満を感じて離脱したネガティヴインフルエンサーの95パーセントは、その企業の悪評を立てるというという調査結果があります」と富田。

オンラインの時代においては、一人ひとりの顧客体験をカスタマージャーニー全体を通してどのようにマネジメントできるかがより一層求められる。企業を取り巻く環境は刻一刻と変化し続け、それに呼応するかのようにペルソナも変わっていく。そうした状況変化に、企業はスピーディーに対応し続けなければならない。

「柔軟性のないシステムは論外です。いまのペルソナに完璧に合わせたシステムをつくってしまうと、変化が起きた瞬間に取り残されます。重要なのは最大公約数でニーズを取り入れるのではなく、いかに最小公倍数でカスタマージャーニー全体を俯瞰したシステムを考えられるかです。標準化と柔軟性をもち併せていれば、変化が起きたときに最低限の部品の変更だけで素早く対応できる。それは企業の競争力につながってきます」(富田)

「『標準化』と『部品化』はSAPのDNA。つまり、われわれがもつ何千何万というレゴブロックのようなアプリケーションを、クライアントごとにカスタマイズや開発するのではなく、“組み立てる”。だからこそ変化の著しいカスタマージャーニーにスピーディーに対応できると自負しています」(森川)

CXの領域だけで考えるとSAPが掲げるCXは、多くのIT企業が謳うポートフォリオと大きな違いはない。だが、企業として狙っているところがまったく異なるとふたりは口を揃える。

SAPのフィロソフィーである“RUN BETTER”を実現するためには、カスタマージャーニーを起点に企業のヴァリューチェーン全体を常に考えていく視点は欠かせない。そのうえで標準部品を組み合わせたヴァリューチェーンを構築し、あらゆる変革に“部分の変更だけで”スピーディーに対応出来るシステムを提供する。それこそがSAPが掲げるCXなのだ。

イベント「SAP CX DAY 2020」、初のオンライン開催!

今だからこそ、顧客起点で再考する、
「ビジネスプロセスと販売基盤、そして顧客基盤」
日時:2020年12月2日(水)13:00〜
申込:https://entryweb.jp/SAPCXDAY/
(お申込いただいた方に参加用URLをお送りします)

[ SAP JAPAN ]