<続・「文章フィルタリング研究」案件に関する私的メモの内容>
- 1.はじめに~前回までのお話と今回の内容あらまし~
- 2.今回の研究テーマは情報学と文化人類学や社会学の境界に位置する
- 3.「どんなオタク趣味をどの程度でオープンにするか」について~同人活動の周辺を中心に~
- 4.今後の「文章フィルタリング研究」案件のような研究はどうしていけばよいか~むすびにかえて~
1.はじめに~前回までのお話と今回の内容あらまし~
この記事は、前回の続編にあたります:
これまでのお話は、次のとおりです。
本記事では、pixiv内の(公開範囲が制限されていたと思われる)作品が、著者に対して事前の許可なく研究に使われ、その研究結果についてweb上にPDF文書の形で公開された問題について、扱います。今回の案件について、自分なりに調べ、大雑把に言うと、PDFの執筆者が、異文化に対して気づけないことが多かったことが、根っこにあったのではないか、と考えました。
(【2017.5.27_1745追記】情報学の研究に文化人類学的な調査手続きは必要か~「文章フィルタリング研究」案件に関する私的メモ~ - 仲見満月の研究室)
問題とされた研究、および経緯については次のとおりです。
人工知能学会の全国大会(第31回)のサイト内にて、学会員外の一般の人でも見られる形で、発表報告のレジュメ=梗概と思われるPDFファイル「ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング」でした。
この発表の研究は、イラストや漫画、文章作品の投稿を中心とするSNSサービスpixivに公開された、BLを含む二次創作*1の小説でR-18指定ものについて、「青少年にとって有害な情報,特に猥褻な意味を持つ言葉は直接記述されず暗喩により表現」を含む文章を、ドメインごとに、人工知能に機械学習をさせ、「表現の分類器を作り」、フィルタリングする手法の提案だったようです*2。この研究発表は、立命館大学の情報理工学部および大学院情報理工学研究科の学生と大学教員によって行われたとのことでした。
問題とされたのは、二次創作の小説について、その著者に説明や許諾がなく、研究にサンプルとして小説が使われた「らしい」ことに関する、研究倫理的な点だと思われます。さらに、無断で行った研究内容をPDF文書の形で、小説作品のURLやアカウント名等を含む情報をpixiv外に公開してしまい*3、著者にとって仲間の外には知られたくなかった自分の作品の存在を、外部の人にも知らされてしまったことが、大きな問題として指摘されているようでした。
(【2017.5.27_1745追記】情報学の研究に文化人類学的な調査手続きは必要か~「文章フィルタリング研究」案件に関する私的メモ~ - 仲見満月の研究室)
更に、「今回の「立命館pixiv」案件は、全体的に見ると、お互いに文化を知らなかったことが、「炎上」の遠因だと、私は考え」、その異なる文化圏とは、
- (pixiv内の)二次創作を含む同人活動の文化の人と、そうでない文化の人
つまり、同人活動の文化の人と、人工知能学会で件のPDF文書を執筆した研究者たち、もうひとつのコミュニティとは、
- 大きな学会大会で使うPDF文書を含む発表レジュメの「軽さ」を知る人と、それが分からない一般の人
です。
以上のような背景および経緯の案件につきまして、私はPDF文書の研究テーマ、および今回の問題について書いたことは、次の5つのことでした。
- 情報学と文化人類学や社会学に通じるテーマであり、前出の文系分野的な研究視点も必要であったこと
- それ故、他の文系学部の専門家の先生、あるいは別学科の先生に詳しい方にお力を借りれるなら借りたほうがよかったこと
- 文化人類学的な手法に基づき、事前に、研究対象の小説作品の著者に対して、調査について説明を行い、許可がとれたなら調査を実施し、NGであれば研究を中止すべきであったこと
- 今後、情報学の研究について、近い事例が出てきた時のことを想定し、その研究に取り組むであろう人たちに向けて、「pixivをはじめとして、そのシステムを使うユーザーがどういった考えを持ち、どんなことを目的としてそのシステムを使うのか」、情報学とは別の「別の文化圏に踏み入るときは、入れさせてほしい文化圏の人たちに、きちんと説明をした上で」、相手の文化を遵守し、「不快な気持ちにさせないようにして、尊重すること」を意識すべきこと
概要として、上記の内容で前回はお話をしたところ、はてなブックマークでやTwitter等で興味深いコメントを頂いたり、見かけたり致しました。更に、5月27日公開のYahoo!ニュース個人において、研究者あるいはそれに近い視点から、この案件を人工知能の研究者、二次創作を含む同人活動をする人たちの背景を丁寧に掘り起こした論説が、松谷創一郎さんによって書かれ、アップされていました:
本記事では、前回の記事を踏まえた上で、頂いたコメントやご指摘を盛り込みつつ、松谷さんの論説を引きながら、この案件を掘り下げてみたいと思います。
なお、私は法律の専門家でないため、学術論文への引用に関する問題等、著作権については、重点を置いてタッチしていませんこと、あらかじめ、おことわりさせて頂きます。
2.今回の研究テーマは情報学と文化人類学や社会学の境界に位置する
2-1.文化人類学や社会学の参与調査から見た今回の案件
この案件の研究では、SNSサービスpixivにおいて、会員外には 見えないよう公開半期に制限をかけられた「R-18指定」の状態で投稿された「BLを含む二次創作の小説」が、人工知能の機械学習の対象とされていました。この作品は、「同じ作品ジャンルや趣味の仲間内で二次創作の活動を行い、密かに楽し」み、そのコミュニティの書き手からすると「外部の人に知られたくない」という、ある種、書き手のプライバシ―に関わる作品だと言えるでしょう。
具体的には、
(筆者である松谷さんの友人の社会学系分野に属し)、自らもpixivでR-18の絵を発表しているある研究者は、pixivユーザーが強く反発する理由を説明してくれた。その最大の理由は「恥ずかしいから」だという。それはR-18の作品であるために、そこには作者の性的な嗜好が描かれている。それが断りなく研究対象となるのは、たとえペンネームであったとしても、とても恥ずかしいという。
(立命館大学の研究者による「pixiv論文」の論点とは──“晒し上げ”批判はどれほど妥当なのか(松谷創一郎) - 個人 - Yahoo!ニュース)
ということです。もっと言えば、書き手にとって「外の人たちからすれば「タブー」だったり、一種の踏み込んでほしくない「聖域」だったりするのが、二次創作の作品」です。
つまり、書き手に取ってプラバシ―性に関わる二次創作の作品を扱う場合については、松谷さんが挙げた「社会学博士の資格を持つある人物」が言うように、「立命館大学の研究者の姿勢に対し、人類学や社会学における参与観察における倫理を重ね」、今回の(著作権的にはグレーであるとされる)二次創作の小説について、「研究対象とするひとびとの許諾を得ることが必要であり、論文などでその研究成果を発表する際にもプライバシーなどには十分に配慮する必要がある」と考えられます。
続けて松谷さんは、
もちろん今回のケースは、参与観察とは明確に異なり、どちらかと言えば文献調査に近い。よって、参与観察と同じではない。ただし、研究対象が「私人のプライベートな趣味」であることには留意が必要だろう。よってこの研究対象は、参与観察と文献調査の中間のようなところに位置すると捉えられるかもしれない。
(立命館大学の研究者による「pixiv論文」の論点とは──“晒し上げ”批判はどれほど妥当なのか(松谷創一郎) - 個人 - Yahoo!ニュース)
と指摘していました。よって、研究対象の二次創作の小説の著者に対し、文化人類学や社会学の研究倫理にしたがい、参与観察的手続きにしたがって、事前に許可を得、(件のPDF文書を含む)研究報告のレジュメや審査付きの論文として発表する際は、「プライバシーなどには十分に配慮する必要が」あったと考えられます。
2-2.工学系の情報学分野の背景からみた研究メンバーや学会のこと
PDF文書の執筆者たちは、ファーストオーサーの情報理工学研究科の院生、後ろ2人が大学教員で経歴をざっと調べたところ、工学系の学部・大学院の部局でキャリアを積んで来た方々で、セカンドオーサーが情報理工学部の准教授、およびサードオーサーは情報理工学研究科の助教のようでした。大学教員のお二人は、工学系の情報学のコースで経歴を積んでこられたと窺えます。進んでこられた研究の環境上、今回のテーマで参与観察的手続きが必要だと気がつかれなかった可能性があり得ますね。
なぜかというと、
院生時代の情報学の同期、院に行っていたプログラマ等の周囲の人の話では、工学部はガチっと専門カリキュラムが組まれているそうです。そのため、文化人類学を含む文系の一般教養科目の学習には、カリキュラム上、しっかり腰を据えて、教育をする時間がとれない現状があるとのこと
(【2017.5.27_1745追記】情報学の研究に文化人類学的な調査手続きは必要か~「文章フィルタリング研究」案件に関する私的メモ~ - 仲見満月の研究室)
ということに「加えて、私の周りの情報学やっている人やプログラマの人たちには、「情報は(なるべく)公開し、自由にアクセスされるようにしたほうがいい」という考えの人が多いと聞いたことがあり」*4ました。このような大学・大学院の工学系部局の情報学の分野におけるアカデミックな思想的背景が仮にあるとすれば、文化人類学や社会学に馴染みが薄くて、今回の研究において、参与観察的手続きや「プライバシーなどには十分に配慮する必要が」あったという発想ができなくても、不思議ではありません。
そもそも、人工知能の機械学習に関しては、AIってやたら流行ってるけどなんなの?楽天とソネット・メディアに聞いてきた|CodeIQ MAGAZINEを読んだら分かるように、例えば、AIに通信販売の商品画面のパターンを沢山読み込ませて、最も売り上げのよいデザインのパターンを抽出し、企業の売り上げアップにつなげる、といった企業のもつ商業的なデータを使って、機械的なシステムを開発するのが中心だったようです。読み込ませるデータについて、個人のプライバシーが微妙に絡む二次創作の作品に関する機械学習の研究は、管見の限り、それほど行われていなかったのでしょう。
文化人類学や社会学の参与調査のなかで考えれば、例えば初心者の研究者が研究対象とされる相手に対して失礼に思われることをしてしまい、関係が拗れた上、その研究者の所属大学や学会の信用問題につながったケースも、あるようです。そういう時は、失態をおかした研究者の指導的立場の研究者や所属機関、学会が事実関係を把握し、相手に説明や謝罪を行うなど、経験を積み重ねて、研究倫理、つまりディシプリンを蓄積していくものだそうです。そのディプリンを反映したものが、例えば、松谷さんの取り上げた「日本社会学会の学会誌『社会学評論』の投稿ガイドライン」の充実ぶりに現れているのかもしれません。
一方、今回の人工知能学会の問題となったタイプの研究は、工学系の情報学分野では前例が少なく、調査のディシプリン自体が蓄積されにくかったのではないかと推察されます。松谷さんが、日本社会学会のガイドラインに比べて、「人工知能学会のガイドラインは非常に簡素」だとしているのは、個人のプライバシーが微妙に絡む二次創作作品のようなデータを扱う研究自体が、人工知能学会で明文化できるほど発表されていなかったとも言えるでしょう。
2-3.小結
詰まるところ、 今回の研究テーマは情報学と文化人類学や社会学の境界に位置しており、まず、研究メンバーが経歴上、そういったことに気づかないまま、配慮が必要と思われる研究対象の二次創作の小説の書き手に参与調査的な事前手続きを踏めませんでした。その背景にあったのは、人工知能学会において、個人のプライバシーが微妙に絡む二次創作作品のようなデータを扱う研究の前例がそれほどなく、学会のガイドラインで参与調査的な事前説明や許諾を得ること、データを扱う際には個人が特定できないようにするなどの配慮に関して、明文化できるほどの蓄積がなかった可能性が考えられました。
以上のような学術的な分野の違いによるバックグラウンドにおいても、この案件は、松谷さんの言葉を借りれば、「“前例”となり、将来的に参照し続けられる可能性がある」。特に、人工知能の研究分野において、重みをもった問題と捉えらるでしょう。
3.「どんなオタク趣味をどの程度でオープンにするか」について~同人活動の周辺を中心に~
3-1.同人活動趣味のオープン度合とその背景
人工知能の研究者(今回は工学系の情報学分野の人たち)ともうひとつ、オタクコミュニティの方々について、触れておかなければならないと思いました。ズバリ、「どんなオタク趣味をどの程度でオープンにするか」について、です。オタクと自覚のある人たちでも、年代やコミュニティ、何のジャンルの趣味をどの程度しているのか…。といった問題です。
今回はpixivの二次創作の小説が研究対象とされたことで、主に同人活動の界隈のことに、勇気を出して触れます。既にカミングアウトしていますが、私は一時期、同人活動に関わっておりました。入口あたりは、研究分野関連で知った某擬人化漫画でした。原作者+ファンの二次創作の載った合同誌を手に取ったことがきっかけで、本格的に同人誌の世界へ入っていきました。そこから、オリジナルのほうへシフトし、旅行記や批評、写真集等を読むようになりました。そのうち、創作系のイベントにサークル参加で出るようになりました。
大学院には漫画が好きな人が大学教員から院生までおり、また同人活動と絡む創作系のサークルに入っていたこともあって、漫画の道具を持ち込んで、ネームからペン入れまでしても、ガミガミ言われることはありませんでした。そういった環境があり、私は漫画を描く趣味自体は、オープンにしていましたが、さすがに同人活動をしていることは、言うのが憚られる感覚を持っていました。なぜかというと、絵もストーリーもお世辞にもうまくなく、それなのに創作ジャンルで本を作っていたこと(後に手伝いにシフト)が、技術面で未熟であり、恥ずかしかったからです。ちなみに、私は昭和末期の世代で、30代前半くらいだと思ってください。
一方、先の松谷さんの友人で、社会学系の研究者の方は、「自らもpixivでR-18の絵を発表して」おり、「そこには作者の性的な嗜好が描かれている」から、「恥ずかしいから」、知られたくないようです。一般の人たちであっても、性的な嗜好を公表することは、よほど相手を選ばない限り、憚られるのが自然だと思います。なお、松谷さんは1974年生まれの43歳で、友人の方は年齢が不明ですが、仮に松谷さんと同年代から一回り程度の年齢差があったとして、30代~40代としておきます。
問題の研究対処の小説には、BLジャンルのの作品が多数含まれ、このジャンルで同人活動をしている人には、上記と同じ理由で周囲にカミングアウトをしていない人は、かなりいると聞きます。基本的に、私の世代では隠す傾向の人が多い模様です。
3-2.オープン度合いに対する世代間差の指摘とその可能性
実は前回のはてなブックマークのコメントに、
という興味深いものを頂きました。オタク趣味を隠すか、隠さないかのジェネレーションギャップがあるということです。私や松谷さんの友人の30代~40代は同人活動自体を隠す傾向のある人は世代的にけっこういるでしょう。それに対して、20代前半の若年世代は、「オタク趣味を隠すという概念がそもそもなさそう」ということで、人によっては同人活動を公表している可能性があるということでしょうか。
自分より、10歳ほど下の世代の人で、同人活動をしている人には、院生時代のサークルや同人誌即売会を除いて、会ったことがなく、聞いたこともありません。このあたりの感覚は、はっきり言って不明です。
ただ、ここ10年あたりから、同人イベントのなかでも、最大のコミケの参加者数の増加やスポーツ・芸能新聞の出展にともなう同人イベント用語の解説記事、コスプレで撮影される人たちの取材や写真のまとめなど、様々なニュースで紹介するメディアが広がった印象はあります。特に2020年に予定されている東京オリンピックについて、コミケの会場として使われてきた東京ビッグサイトが挙がったことから*5、いっそう、メディアで報道される機会が増えてきているかもしれません。
毎年夏と冬のコミケは、開催されるたび、ニュースになることがあって、しばらく経ちます。なかには、大手の新聞社やテレビ局が紹介することもあったようで、世間一般での認知度は上がってきているでしょう。認知度のアップは日常的な話題にのぼる回数が増えることに繋がります。こうしてある程度、コミケの認知度が上がった2010年代後半において、ジャンルにもよると思いますが、同人活動を含めて、ひと昔前は隠す人の多かったオタク趣味のことを、現在の20代前半の人たちのかなかには、隠さないのが当たり前という意識の人たちがいても、不思議ではないでしょう。
そういったオタク趣味をどの程度でオープンにするのか、ということは、同人イベントの認知度が一般社会で上がってきたことによるジェネレーションギャップも、あるかと思います。そうした世代による意識の違いは、他のことについてもよく言われることであります。世代間の意識の違い、それから前回指摘したpixiv内ゾーニングをこえて、二次創作の村」に入り込んでしまった研究メンバーの一人(いちばん若い人)が、R-18指定の小説をサンプルとして選んでしまった。なくはない話だと考えられます。
ここまでは頂いたコメントに対し、私が一人で邪推したことであり、実際、どうであったかは分かりません。 ただ、このような同人活動や二次創作、R-18指定の作品のデリケートさに対する意識の差は、その世界にいる人によって個人個人で大きく違うことは事実です。同人活動全体に対して非常に神経質な人もいれば、自分の創作活動は比較的オープンにしてはいても同人仲間の活動については配慮している人もいます。
3-3.小結
「どんなオタク趣味をどの程度オープンにするか」という質問については、ジェネレーションギャップがあるでしょうし、また個人個人によって大きな差や扱い方が多様であると言えます。そういった背景があったとして、第2項に書きましたが、別のオタクコミュニティに足を踏み入るときは、事前に説明をした上で許可をもらったら、研究対象の人たちに失礼にならないように「マナー」に気を付けること。特に、個人のプライバシーに対して配慮を忘れず、作品とそれに付随する情報の取り扱いには慎重になること。の2点は、変わらないと思いました。
4.今後の「文章フィルタリング研究」案件のような研究はどうしていけばよいか~むすびにかえて~
第2項と第3項では、前回の記事と方向は違うものの、いずれにしても所属する文化圏、コミュニティの違いによって、参与調査的な研究対象に対する手続きや配慮が足りなかったことを示しました。
もう一つ、二次創作界隈の話をしますと、書き手・描き手たちには、仲間内で(こっそり)楽しみ、外部にこうした活動を(広く)知られたくない、という気持ちの方がいらっしゃいます。事前説明があろうと、プラス評価を受けようとも、研究を通じて自分たちの世界を広範囲に告知するようなことは、避けたいと望んでいる人がいるということです。
そうした書き手・描き手の方々に対しては、金田朋子氏も仰るように、「配慮しすぎて歴史研究、作品批評などが阻害されるのは、同分野の研究者として遺憾です。ただ「学術的引用」をかさに着て、研究対象のプライバシーを害する研究であってはならないと思っています」という難しさがあります。
今回の「文章フィルタリング研究」については、色んな方が言われているように、商業出版されている同じジャンルの小説を研究対象とすることで、研究倫理の面をクリアできたのではないかと。松谷さん曰く、
(さらに踏み込めば、研究対象となる小説をpixivではなく市販のものから探してくることも可能だったのではないか、とも思う。論文からは、pixivの投稿作品である必然がよくわからなかったからだ)
(立命館大学の研究者による「pixiv論文」の論点とは──“晒し上げ”批判はどれほど妥当なのか(松谷創一郎) - 個人 - Yahoo!ニュース)
とのこと。前半で展開された研究における著作権と引用のルールをもとにすれば、商業出版されているものは、出典を明記することにより、著者にいちいち許諾をとらなくてもよいとされていることが窺えます。実際、同じジャンルで作品を商業出版されている方が、今回の案件に対して、「自分の作品を使ってくれればよかったのに」というツイートをされていたのを見かけました。なお、先行研究については、金田淳子氏のプロフィールをのぞいたところ、自身の研究や著作が出版されているようですので、その著作から芋づる式に文献を探してもよいかと思います:金田淳子とは - はてなキーワード
様々な観点から注目をされるも、扱いの難しい二次創作や同人イベントの作品をめぐる問題については、 慎重になりつつ、同人イベントを主催している側の出版している本や、研究者が出している本を探して、使うということが考えられます。例えば、二次創作や同人イベントの歴史や起こった事件、ムーブメント等については、コミケを中心として次の本で知ることができるでしょう。
コミックマーケット40周年史 40th COMIC MARKET CHRONICLE
「文書フィルタリング研究」案件にも共通しますが、R-18作品の扱いをめぐって1980年代末に起こった「コミケ幕張追放事件」、グレーゾーンとされる二次創作の同人活動の様々な問題について、当時のデータや、関係者の事情を知ることができるでしょう。例えば、上記資料と合わせて、新聞記事で当時の同人誌即売会に関する動きを補うことで、会場移転をめぐる主催者側、コンベンションセンター側、自治体側といった関係者の話し合いと合意の取りつけについて、学術的な研究ができるかもしれません。
今回の案件は、同人活動者のコミュニティと工学系の情報学分野の研究者のエンカウントだけでなく、異なる学術の領域にテーマがまたがっていたこと、同人活動者のなかでも世代間や個人個人でオープン度合いや意識が異なる可能性が背景にあったこと等、複数の問題が重なっていることを示しました。それだけに、松谷さん曰く
今回の一件は、決着の内容しだいでは、今後さまざまな学問領域や二次創作界隈に大きな影響を与える“前例”となる可能性がある。
(立命館大学の研究者による「pixiv論文」の論点とは──“晒し上げ”批判はどれほど妥当なのか(松谷創一郎) - 個人 - Yahoo!ニュース)
わけです。明日以降の動きに注目しつつ、私は、ネット上の反応に影響を気にしすぎず、研究メンバー、人工知能学会、立命館大学の情報理工学部、ピクシブ企業は互いに慎重に審議を重ねていき、研究内容を含んだPDF文書を含めて、冷静な対応がなされることを願っています。
*1:「これは既存のマンガやアニメなどの設定を用い、ファンが二次的な創作をした作品のことだ。それらのほとんどは、原作者の許諾を得ずに勝手に創っているものばかりだ。
二次創作は、オタク文化の根幹をなす表現活動だが、著作権法的にはグレーの状況にある」という:立命館大学の研究者による「pixiv論文」の論点とは──“晒し上げ”批判はどれほど妥当なのか(松谷創一郎) - 個人 - Yahoo!ニュース
*2:jsai2017:2M2-OS-34a-1 ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング参照
*3:現在、PDFは非公開、おおよその内容は、次のまとめの冒頭の画像で一部、確認可能な模様:立命館大学の論文がBLを含むpixivのR-18小説を無許可で有害な情報のサンプルとして晒し上げてして炎上 - Togetterまとめ
*4:たしかに、オープンソースという言葉は私も耳にしますし、『文系女子だけど新卒でSEやってます』のしま子氏も、公開されたライブラリを使って、仕事をしようとした場面がありました:【2017.5.27_1745追記】情報学の研究に文化人類学的な調査手続きは必要か~「文章フィルタリング研究」案件に関する私的メモ~ - 仲見満月の研究室