平成29年7月27日(木曜日)13時00分~15時00分
文部科学省3F1特別会議室
喜連川主査、引原主査代理、赤木委員、家委員、逸村委員、井上委員、岡部委員、北森委員、五味委員、竹内委員、谷藤委員、辻委員、永原委員、美馬委員
(科学官)相澤科学官 (学術調査官)越前学術調査官 (事務局)関研究振興局長、板倉大臣官房審議官(研究振興局担当)、原参事官(情報担当)、丸山学術基盤整備室長、玉井学術基盤整備室参事官補佐
安達国立情報学研究所副所長、林科学技術・学術政策研究所上席研究官
【喜連川主査】 それでは、お時間になりましたので、ただいまから第4回学術情報委員会を開催したいと思います。
前回は、オープンサイエンスへの対応ということに焦点を絞りまして、科学技術・学術政策研究所の林和弘上席研究官から非常に丁寧な、示唆に富む御説明を頂戴したかと存じます。その後、意見交換をさせていただきましたが、時間の都合で議論をやや中途で打ち切らせていただくような形にならざるを得ないような状況だったかと思います。
そこで、本日は、まず前半は、若干中途となりましたオープンサイエンスに関する意見交換を引き続き行わせていただきました後に、後半でネットワーク等の学術情報基盤に関する御議論を頂戴したいと考えておりますので、どうぞよろしくお願いいたします。
そのようなことで、2回も御出席頂いて誠に恐縮ですけれども、林上席研究官には御陪席をお願いさせていただいておりますほか、国立情報学研究所(NII)の安達副所長にもオブザーバーとして出席をお願いしております。
それではまず、事務局から、配付資料の確認と傍聴者の状況をお願いします。
【玉井学術基盤整備室参事官補佐】 配付資料については、議事次第に続けて、資料1から7ということで御用意をしております。過不足等ありましたら、お知らせいただければと思います。
また、本日については、報道を含め28名の方の傍聴登録を頂いております。以上です。
【喜連川主査】 どうもありがとうございます。
それでは、審議に入りたいと思います。先ほど申し上げましたように、まずオープンサイエンスに関する意見交換をお願いしたいと思います。その前に、前回の委員会で御意見をいろいろ、多方面に頂戴いたしましたので、その部分について簡単に振り返りたいと思います。事務局から、前回の主な意見について御紹介頂いた後、林先生の方から追加で御説明頂くような事柄がございましたら、お願いしたいと思います。それでは、よろしくお願いします。
【丸山学術基盤整備室長】 それでは、失礼いたします。資料1をごらんいただきながら、お聞きいただければと思います。前回の御議論を主な意見ということでまとめてございます。大事な点が抜け落ちておりましたら、後ほど御指摘をお願いしたいと思います。
まず、林先生の方から意見発表がございましたが、抜粋をさせていただきますと、例えば二つ目の丸ですけれども、ICT技術の進展によって、多様な情報源との連携による、目的に応じたメトリクスが作成され、さらに、情報流通アイテムに付与されたIDを基に、誰が、どこの研究機関において、どのような研究費を得て、どのような成果が出たのかがひも付けられることで、研究パフォーマンスの測定、ひいては大学の強み・弱みの把握が可能になっているというお話がございました。
また、近年でございますけれども、プレプリントサーバの構築が進んでいるといったような御紹介もございました。特徴的な例としては、ディープラーニングの研究においては日々これが活用されていて、arXivに論文を載せると、もう次の日にはすぐ引用したものが出てくるといったようなスピードでの研究の公開が進んでいるということであります。
それから、こういったプレプリントサーバに載せた後に、改めてジャーナルに投稿するなどでピアレビューを経てパブリッシュされたものが業績リストに上がってくる、あるいは、研究費の申請やプロモーションへの活用が進んでいるという現状もあるようでございます。
また、その次の丸にございますとおり、イギリスの非政府系の助成機関がウエルカムオープンリサーチというものを開発して、プラットフォームへの成果の搭載を義務化したといったような動き。ここには、先ほどのプレプリントサーバと同等の機能を持つだけでなくて、ピアレビューファカルティサウザンド(F1000)と言われるようなモジュールが導入されて、査読が通ればパブリッシュされたものとして検索インデックスにも入るといったような仕組み、あるいはバックグラウンドで査読者の貢献が見えるような仕掛けもなされているといったような御紹介がありました。ひいては、こういうものは出版社を介さずに研究成果をオープンにすることができるモデルとなっているというような御指摘がございました。
それから、一つ飛ばしまして、1ページ目の最後の丸のところですけれども、オープンサイエンスが目指すところというのは、研究データの共有から始まり、その先にある新しいサイエンスの活動のエコシステムを作るといったようなことがビジョンになるのではないかという御示唆がございました。
それから、めくっていただきまして2ページ目でございますけれども、一つ飛ばして二つ目の丸、研究活動サイクルをモデル化して、そこにプラットフォームないしはサービスを提供して、研究者の活動を支援する繰り返しのフレーミングとモジュールづくりが大事であるといったような御指摘。
それから、その次の丸にありますとおり、研究におけるデータシェアリングの例として、高エネルギー物理における大量の実験データの共同解析は、公開というよりも研究者間での共有ということだろうと。それから、共同観測に関してもコデザイン、コプロダクション、コディストリビューションが可能な分野であるといったような話。それから、ちょっと視点は違いますけれども、今まで情報インフラでは、余り活用されていなかった、捨てざるを得なかった情報の再活用であるとか、見方を変えれば価値が出るようなデータを積極的に使ってみることも、データ共有の有効事例になり得るのではないかといった御示唆がございました。
それから、二つ飛ばしまして、オープンサイエンスに関わる分野別マッピングをお示しいただいたわけでございますけれども、例えば天文学、あるいは地球科学はもともとオープンサイエンスが進んでいて、市民の関与もあったところであると。一方で、高エネルギー科学の場合は、社会との関わりは間接的である。むしろ、コミュニティでの共有が望ましい分野で、数学についても同様ではないかと。他方、ジオサイエンス、あるいは環境系の分野に関しては、オープンサイエンスのメリットを最も享受しやすいと、新しい市民科学の可能性が模索されている部分ではないかと。それから、有機合成化学などは知財との関連が非常に強いということで、社会とのつながりが直接的でないということから、オープンにする意味合いというのは少ないのだけれども、オープンイノベーションの理念を使うことでオープンサイエンスの効果を得ることも可能となり、創薬のオープンプラットフォームなども現在進んでいるような状況だといったような御紹介がございました。
それから、2ページ目の最後の丸でございますけれども、オープンサイエンスでは、研究者に安心・安全と思ってもらえる、データ共有のいわゆる文化作りが最も重要であるという御示唆、簡便な蓄積をするためには、簡便な利用とユースケースを作って、サービスデザインが非常に重要であると、このサービスを使わないと研究ができないというぐらいのものになると良いのではないかといった御意見がございました。
総じて、まとめとして、オープンサイエンスというのは研究の在り方そのものを変えるものと。より健全な研究評価体制を生み出すほか、産業振興にもつながるものであるということ。
それから、当面は研究データの公開の前段階として、共有から始めるのが良い方法と思われると。オープン研究の効率化と加速、それから社会への迅速な波及効果を狙うものとして、必ずしもフルオープンということではなくて、相対的に今のポジションよりもオープンにするといったようなことがオープン化の本質ではないかと。
それから、研究データや研究者に識別子を付与して、研究の着想の段階から成果の波及までをモニターすることで、研究活動の流れや効果をより測定しやすくすることも可能となるということ。
それから、研究領域、あるいは研究機関及び研究者コミュニティの特性を踏まえて、研究が発展し、研究者の貢献がより健全に見える化することを前提に、研究をディスカレッジすることなく、新しいサイエンスを生み出すための推進策、今のサイエンスをより効率化するための推進策、あえて現状の体制を維持するという、主にその三つの施策を分野別に議論する必要があるのではないかということ。
それから、研究者の手間を増やして、意欲をそぐものであってはならず、むしろ将来の研究社会像を切り開くための前向きなもので、研究者が主体的に取り組むべきものといったような御示唆。
それから、まとめの最後でございますけれども、研究データを、研究者に安心して安全に共有できる基盤作りと文化作りが必要であるということでございました。
この後、意見交換がなされたわけでございます。主なものとして、例えば二つ目のエコサイクルが回っている研究活動、研究者をいたずらに刺激するものではなくて、ICTの技術を生かした、あるいはインフラを生かしたサイエンスをやろうという人たちも、数は少ないが生まれていると、まずはそこを押し進めるということもあるのではないかと。まずは、やりたい人たちをいかに探すかが大事ではないかといったような御意見がございました。
また、その下ですが、オープンサイエンスといったときに、読者と投稿者がニアリーイコールであるコミュニティと、読者が非常に広いコミュニティで議論は分ける必要があるのではないかといったような御意見がございました。
それから、ページをおめくりいただきまして、4ページ目でございます。二つ目の丸に、デジタル人文社会学は面白い取組ではないかと。日本の古文書などと情報系の人たちとを結び付けることで、日本オリジナルなものが出てくるような気がすると。ただ、人文社会系の人たちにどうアプローチするのか、あるいは情報系の人たちにどう橋渡しするかが難しいと。パイロットスタディーのようなものを提言することもあり得るのではないかという御意見。
関連しまして、人文社会系のオープンサイエンスに関連して、例えば心理学や社会学の分野における社会調査などについてもデータ共有し、研究者が分析できるようにする取組があると。歴史学に関しては、国立公文書館などが中心となってデジタル化を進めている。ある意味で、オープンサイエンス化を進めると、最も研究が進みやすくなる領域でもあり、意識は非常に高いのではないかという御意見がございました。
また、その下でありますけれども、これからはアカデミックなコミュニティの中だけでイノベーションが完結するものではなく、市民や産業界ともつながってオープンな形でイノベーションを推進していくことが、非常に重要になってくると。その場合、特にデータドリブンな研究の場合、データをどのように産業界と共有していくのかということについては、どのような整理が可能なのかといったようなお話。
それから、一つ飛ばしまして、公的資金によって得られた研究成果はオープンという原則が世界のコンセンサスになりつつあると。それを背景にオープンバイデフォルトのデータ基盤がいずれ出来上がると。その上でほかのデータと組み合わせて価値を創出し、産業にするという現実がやって来るのではないかと。そこまでどう持っていくのかということが論点になるのではないかと思うと。ただ、できるだけ広い公開をする方向性と研究者のインセンティブの仕組みをどう作るかが課題ではないかといったような御意見がございました。
また、その下でありますけれども、オープンバイデフォルトは例外もあり得るものであり、知財的な価値があるものや、商業的なものについては留保されている。公的な資金のオープン化がデフォルトではあるが、産業界と関連する研究のデータガバナンスのありようはまだ十分な検討がなされていないと。
その下でございますけれども、クリエイティブコモンズライセンスがデフォルトになりつつあるのは確かではあるが、厳密にはデータには著作権がなく、著作権を前提としたクリエイティブコモンズ(CC)には本来載ってこない。一方で、著作権の有無に関わらず、当該データを利用してもよいという意思を表示するためにCCを活用していると見ることもできるけれども、裁判所でエンフォースメントができるかといえばグレーであると。その意味では、ハードローとエンフォースメントの保証を目指すルールというよりは、ステークホルダーが皆で共有している認識のようなものに依拠しているスキームなのではないかという御意見がございました。
なお、今後の議論の進め方という観点では、例えば発表で提示された論点のうち、もう少し深める必要があるものについて議論していきたいと。オープンサイエンスに係る大体の方向感は共有されているので、具体的な一歩をどう踏み出すかという観点での御議論が重要であるというお話。
それから、一つ飛ばして、我が国にオープンサイエンスという切り札を入れたときに、この分野であれば、こうすればうまくいくだろうというような部分、あるいは、どの分野であればどのように強くできるのかというあたりに焦点を絞って議論することも考えられると。
それから、研究者の負担が増し、我が国がますます細まるというようであれば、今はまだその時期ではないという視点も重要で、更に不十分なところがあれば、どの部分を議論しなければならないかという点についても検討してはどうかと。
それから、最後でございますが、オープンサイエンスの枠組みや方向性、あるいは我が国としてどのように動かしていこうかという整理はかなりの程度できており、今後、全体的な枠組みの中で具体的にどうしていくのかが大きな課題になると。我々としては、何をしよう、こういう方向にしようという議論にもう少し向けていけば良いのではないかという御意見がございました。
本日の意見交換においては、このような点にも御留意を頂きながら御発言を頂ければ大変有意義なのではないかというふうにも考えております。前回の振り返りは以上でございます。
【喜連川主査】 どうもありがとうございました。それでは、林先生から見て、もうちょっと付け加えた方がいいというようなところとか、まとめの中でちょっとということがありましたら、最初に御意見を伺いたいと思いますが、いかがでしょうか。
【林上席研究官】 多岐にわたる、拡散しがちなオープンサイエンスの話をこれだけコンパクトにまとめていただいてありがとうございました。若干の補足をさせていただきますと、最初の方でプレプリントサーバが革新的な事例として紹介されております。出版社を介さずに研究助成団体が研究者とのやりとりをすることで研究成果をオープンにできるという、これは革新的なのは間違いないのですけれども、やはり研究者には、これまで良い成果が出たら出したい論文誌リストというのがありまして、これから出版社は要らないというように、短絡的に読めないようにする工夫があった方がよろしいのではないかと思います。これはネガチェックとして補足いたします。
あと、3ページ目の意見交換の上から三つ目、若しくはページの下から二つ目、読者と投稿者がほぼ同じであるコミュニティと、読者が非常に広いコミュニティで議論を分けると、ここがちょっと意味が取りにくい気がしております。申し上げたかったのは、(知の探求に重心を置いている)高エネルギー物理のように投稿者と読者がほぼ同じである場合と、(より産業応用が盛んな)化学のように、投稿する人より、読む人、それを利用する人の方が圧倒的に多いマーケットが存在する分野、そういうニュアンスで伝えていただければと思った次第です。
そのほかの点については、また皆様の御意見にお答えするような形で補足等ができればと思っております。以上です。
【喜連川主査】 はい、どうもありがとうございます。私もこの資料を読むのが本当に今なんですけれども、プレプリントに入れて、その後、論文を出版するというのがどこかに。
【林上席研究官】 あります。
【喜連川主査】 書いてありましたね。ですので、先ほどの出版社が要らないというような強いメッセージにはなっていないような気もするんですけれども、この文章を書き換えた方がいいということですか。
【林上席研究官】 この点、今加速度的に多様化しており、確かに今御指摘のルートは、出版社が関与しています。やはり物理系のプレプリント文化が根づいているところは、プレプリントサーバにまず載せて先取権を確保した後に、いわゆるピアレビュージャーナルに出して、査読付き論文として出版します。このルートとしては、出版社の存在はむしろ研究成果を固定する、ピアレビューを通してクオリティが担保された状態で論文として業績を固定し、もっと即物的にはDOIを付けて引用できるような状態、あるいはマシンリーダブルな状態にして公開する、この流れが一つございます。
この意味での出版社の立ち位置というのは、むしろこれまでどおりで、補足したのは別に紹介されているWellcome Trustが用意しているサーバについてです。いわゆる研究助成団体はこれまでは助成研究に対して成果報告書までは求め、論文については研究者は既存の出版社を利用しています。そして、昨年用意したWellcome Trustのウエルカムオープンリサーチは、その論文発表の場すら研究助成団体が持つと、そういうイニシアチブでございます。(あるべき概念論ではなく)具体的に研究助成団体がリポジトリを用意して、研究成果の論文を受けとめ、まず即時公開します。まず、この時点でプレプリントサーバの機能を持っております。
そこから、F1000リサーチを使って、要は査読を委託することによってピアレビューを行い、一定の質が担保されたものは通常のジャーナルと同じ論文として各種データベースにインデックスされます。このルートでは既存の出版社が全く介していないということになります。この点、非常に革新的であるがため、つまり、一人歩きするのを恐れております。そのルート自体はロジックとしては極めて革新的ですけれども、それを本当に研究者、研究者コミュニティが受け入れられるのかどうかは慎重に見る必要があり、こういう革新的な世界が来ると言い切るようなことは、今の時点ではまだ避けた方がよろしいかなという次第です。
【喜連川主査】 できるモデルとなっているというより、できるモデルも存在する、くらいの方がよろしいということでしょうか。
【林上席研究官】 そうですね、そういうものも生まれつつある。つまり、ゲームチェンジの兆しとしての例示というスタンスで行けばよろしいかと思います。
【喜連川主査】 では、そういう修正をしていただくと。
それから、もう一つの方は、この文章は、書いたものがその分野ではない分野にも読まれるというか、層が広くなるという意味でお書きになれているんですけれども、先生の今のお話では、化学の場合は、そもそも母体が大きいので、同じ分野だけれども、更に広く読まれると、そんなイメージなんですか。
【林上席研究官】 いえ、むしろ産業利用の展開の方をお考えいただいた方がイメージしやすいかと思います。つまり、読む側が必ずしも専門性を持って読むわけではない方が多い。
【喜連川主査】 ないようなところもということですね。
【林上席研究官】 そういう意味合いです。
【喜連川主査】 そうすると、悪くはないようにも見えなくもないですが、はい、分かりました。皆さん、そこを確認させていただいたということで、いい議論を再度させていただいたと思います。
それでは、このような前回の議論を踏まえてということなんですけれども、見ていただきますと分かるように、かなり広範囲な御議論を頂戴いたしまして、本日もその方向感でも結構なんですけれども、前回も2、3回申し上げたんですが、一応この分野の領域を咀嚼(そしゃく)するという意味では、非常にインフォーマティブだったと思うのですが、今後この委員会でどういう方向感で持っていくのが良いかという議論も、その御意見の中に若干含めていただけると有り難いかなとも思っております。
そういうところで、自由な御意見を頂戴できれば有り難いと思いますが、いかがでしょうか。講演の直後ではないので、皆さん、キャッシュアウトしてしまっている可能性があって、なかなかややこしいのかもしれないんですが。
【丸山学術基盤整備室長】 事務局から、済みません。ちなみに、前回の林先生の御発表資料でございますけれども、お手元の青いドッジファイルにとじ込みがございますので、必要に応じて御参照頂ければ大変有り難く存じます。以上であります。
【喜連川主査】 この委員会の中でもいろいろな分野に強く御関連されておられる、もちろん先生方がおいでになると思うのですけれども、そういう御自身の領域の中でこのオープンサイエンスというものをどういうふうにお感じになるかとか、これを一定程度進めていこうと頭の中でシミュレートされたときに、何が一番大きな課題になるだろうかな、みたいなところの御発言も頂けると有り難いかなと思っています。いかがでしょうか。
どうぞ。
【辻委員】 済みません、この議論を踏まえて、前回の議論の中で具体的な次の一歩をどうするかというところが、次に考えるべき大きなポイントだったかと思っています。そういった観点から、私自身は通信の事業に携わっております。そうすると、今までですと通信に特化した研究開発をしてきたわけなんですけれども、だんだんそれがいろいろな分野とのコラボレーションというか、そういう形の研究開発が増えてきています。
そのときに、じゃ、その中でオープンサイエンスということで考えていく場合、いろいろな分野との関係性も踏まえながらの自分たちの研究開発という観点も必要になってくるわけです。考え方として二つの側面があるかなと思っております。一つは、分野別にどういう特色があるのかというところと、もう一つは、研究のフローに合わせてどういう特色があるのかというところがあると思っています。
なので、場合によっては掛け算というか、マトリックスになるのかもしれませんけれども、各分野で例えば設計を行って、プロダクトを行って、ディストリビューションを行ってという中で、それぞれの分野がどういうところまでオープンにしていくのかという特徴を、実はマトリックス表示ではないですけれども、そんな形で見ていきながら、じゃ、その中で、その分野との研究開発においては、このあたりまでオープンにできるのではないかというような、何かそういった指標のようなものができると、ある意味、通信分野というのは、媒介的な要素になってくるものとしては大変有り難いのかなと思いながら、このまとめ資料を拝見しておりました。
雑駁(ざっぱく)ではございますけれども、以上です。
【喜連川主査】 どうもありがとうございました。
【林上席研究官】 多少補完、補足させていただきます。今の御意見で想起される事例としては、例えばHPCIとか、データ基盤整備なども、今はコンピューターの計算速度を競う時代ではなくて、その基盤を使ってどういうサービスができるかという観点にどんどんシフトしていることを御存じの方もいらっしゃるかと思います。
その文脈で、まとめの中にも入れていただきましたが、研究者に対して新しいエコサイクルを作るサービスをどう生み出すかが重要です。そのためには、やっぱりICTの技術を持っている方と、各研究ドメインの科学者との対話が今しばらくは必要です。若しくは一人の中で融合していてもよろしいのですけれども、この点がしばらく重要な観点になってくるかとは思います。
多少繰り返しになりますが、(科学者からみて、ICT技術者との対話の繰り返しなどによって)最初はまず御自身の領域の研究活動の効率化から始めていくことになるとは思います。そして、恐らくそれを繰り返しているうちに、研究者の皆さんですから、新しいアイデア、こうしたらどうなるだろうと、新しい価値やサービスを見いだすアイデアなどが生まれるのかな、などと推察しております。
【喜連川主査】 多分それが非常に妥当な考え方なんですけれども、IT屋さんから言わせていただきますと、今超引っ張りだこなんですね。全領域が多分今、ITの手助けをくださいという状況が生じておりまして、IT屋はとても忙しい中で、多分このオープンサイエンスをターゲットにということを考えたときに、逆に、そこから芽吹いてくるような、非常に面白い世界というものを提示しないと、ドメインのサイエンティストも動かない、IT屋も動かない、そういう状況になってくるのではないかなという気がします。
その描き方を、この委員会の中で一つの方向感として示していくことが重要ではないかなという気がいたします。例えば余り当てるのは今までしてきませんでした。しなくても、どんどん御発言になったんですけれども、きょうは趣向を変えまして、東京大学物性研究所の所長もされておられた家先生、物性領域だと、使おうかなと思うとか、そういう感触は何かありますか。
【家委員】 済みません、きょうちょっと遅れて来まして、このまとめを今読んでいたところなんですけれども。分野によって事情が違うというのはそのとおりだと思いますし、本当に現役でばりばりやっている研究者は、人にもよるかもしれませんけれども、論文は出さなければ業績になりませんから、そういうインセンティブがあると。だから、それをオープンにすることは、誰がコストを負担するかということは別として、誰も反対しないと思う。
データをどこまでというのは、どうですかね、研究者にとってはかなり面倒くさい話ですね。だから、そこにインセンティブをどう付けるのか。ポジティブのインセンティブを付けるのか、あるいは、それをしないと研究費をあげないよというネガティブのインセンティブを付けるのか、その辺の基本的な合意ができていないように思うんですね。もし仮にネガティブ、強制力を持ったようなものを、制度を作るとしたら、なぜそれをしなければいけないかということをかなり説得力を持って言わないと、研究者はついて来ないだろうと思います。
最初の頃に出されたリポジトリ、いろいろな大学にありますけれども、中身は結構まだすかすかという状況はそういうことを反映しているのではないかなと、ちょっと済みません、ネガティブな言い方で申し訳ないんですけれども。
【喜連川主査】 すかすかという表現が適切かどうか分からないですけれども、いっぱい入っているんですけれども、ダイバーシティーが高いというので、分野ごとの密度よりも広がりが多いと思うんですが。
ただ、DMP、データマネジメントプランは、多分科学技術振興機構(JST)も、日本学術振興会(JSPS)も……。JSPSはまだですか。エンフォースをされる方向ではないかと理解していますが。
【家委員】 推奨するという言い方にとどめています。
【喜連川主査】 推奨ですね。でも、推奨しちゃっているんですね。
【家委員】 推奨は文科省の方針だということで。ただ、オープンの在り方については、いろいろなオープンの雑誌に出す、あるいはリポジトリに置く、などいろいろな方法を。
【喜連川主査】 いやいや、データの方。
【家委員】 データですか。データについては全然まだ何も言っていません、済みません。論文のオープンアクセスだけです。データに関しては、JSPSは何も言っていません。
【喜連川主査】 JSPSはやっていないんですか。JSTは少しやり始めておられまして、私も一つ研究領域をあれしているので、それをプロモートする機関になっておりまして、それはNSF(National Science Foundation)のモデルを利用しながらという流れになっています。それも、ピュアなエンフォースメントにはなっていなくて、かなりエンカレッジメントになっていると。林先生、そうですよね。
【林上席研究官】 はい。そうです。
【喜連川主査】 そうすると、物性研究者としては気力が出ないと言ってしまうと、怒られるんですけれども。
【家委員】 化学とか、物質科学というのは、やっぱりどの時点で何をオープンにするかというのは、特に競争の激しい分野では、かなり微妙な問題になるところかと思います。
【喜連川主査】 難しいですね。そうですね。
北森先生はいかがですか。当てやすいのは東大関連者ばかりで申し訳ないんですけれども。
【北森委員】 化学代表と。この化学という意味が、ちょっと林先生にもお聞きしたかったことではあるのですが、バイオとかメディカルというのは化学の中に入ってしまっているんでしょうか。バイオ、メディカルがこのオープンサイエンスというのに非常に大きな影響を受けていて、今の特にバイオ、メディカルの人たちの、タンパクやゲノムはほとんどビッグデータの世界、どんどんデータを取り入れて、むしろマイニングで何か新しい創薬をしようとか、知見を見つけていこうとか、そういうような世の中になっています。実験のやり方も、とにかくデータをとって、その後からいろいろ解析するという、そっちの方向に行っていますので、バイオとかライフサイエンスがこの中に入ってきていないのは不思議に思います。バイオとライフなどは化学の中に入れているんでしょうか。
【林上席研究官】 この中というのは……。
【北森委員】 済みません、前回、僕は欠席していて大変申し訳ないんですが、そうです、オープンサイエンスに係る分野別マッピングの例、スライドでいうと33枚目でしょうか。議事録の中にもバイオとかメディカルは出てきていないんですが。
【林上席研究官】 医薬の中に、済みません、左下ですね。この医薬のカテゴリーは、ここで議論になっているような、有機化学、物質化学としての合成した分子のリストがあり、あるいはマテリアルのデータベースがある、そのような研究データを扱う領域を想定していました。そういった中から新しく何かを創っていくというやり方と、御指摘の通り、ライフサイエンスで進んでいるビッグデータ的な取扱いと、これはやや違う扱いになります。
【北森委員】 どちらかというと、相対的にオープン化しにくいのではなくて、しやすい方の、むしろ天文だとか地球科学の方に近いアプローチの仕方で進めていると思うので、セパレートして、規模的にも予算的にも非常に大きな分野ですので、別途加えた方がよろしいかと思います。
それで、先ほど喜連川先生が化学はどうなんだということなんですが、今少々申し上げました、化学もオープンサイエンスの影響がないというか、少ないということではなくて、むしろ日本での認識が物すごく低いというのが私の感想です。それで、ここにWellcome Trustの、イギリスが論文をどんどんアーカイブ化しなさいと。これは、この前の期の、この委員会でも私、紹介したと思います。それが、実際名前が付いて出てきたということなのですが、イギリスのオープンサイエンスに関する国家的な戦略、戦術、ポリシー等施策、それと学会レベルの戦術と戦略、それが非常に大きく展開していて、一種の大英帝国的な発想が学術の分野でなされている。
そのベースはやっぱり言語が英語であるというところから出ていて、この議論の中でも、ちょっと抜けているなと僕が思っているのは、オープンサイエンスと言ったときも、じゃ、最終的にペーパーにするのはどこのペーパーかというと、日本の学術誌ではなくて、ほとんどの場合が英米の2大学会のところにほとんどの人が。学会という公益的なところでもそうだし、NatureやScienceという商業的な論文誌であっても、やはり英語圏の方に行ってしまっていると。
じゃ、オープンサイエンスといったときに、主力論文は海外の一流紙に行く。じゃ、データはどうするのかというと、これも前回の委員会からお話ししていますように、イギリスでは、論文に関連するデータを自動的にデータジャーナルの方に上げるようなことまで考えていて、各論文誌に対してそれに対応するデータジャーナルを全部くっつけようという、そういう案も進んでいるわけです。
ここでオープン化といったときに、国際的な協調をどうするかということを考えておかないと、日本でデータをキープした場合に論文が英米の一流誌に出せないということになると、研究者の本能として、それを英米のデータベースの中に入れてしまうということも起こりかねないです。ですから、具体的に何かを取り組むときには、国際的な動きをしっかり押さえて、それに対応する形でやらないと、日本だけの中で閉じてやっていると、非常に機能しないものになる可能性が高いと思います。
これが化学の分野でさえ、こういうことになっていますので、オープンサイエンスに熱心な物理だとか、今のライフサイエンス、メディカル、その分野はもっともっと大きな動きになっているだろうと予想します。
【喜連川主査】 非常に貴重な御意見を大変ありがとうございます。ですから、大英帝国的に動いているわけですね。前々回ぐらいですか、引原先生もおっしゃっていたみたいに、論文に生じているパワーバランスとそのまま同じようになってしまうということへの危機感。逆に言うと、ここで起死回生の、という観点から言いますと、海外の動きをパッシブに受けるというよりは、我々が何かアクションを起こせないだろうか、ということの議論の方が期待されるかなと思うんですけれども、その辺いかがでしょうか。
【北森委員】 これも前年度の委員会でも発言していると思うんですが、今がほとんど残された最後のチャンスだろうと。先ほどお話ししましたように、具体的なメジャー、施策だとか、あるいはタクティクス、戦術として彼らはもう既に動いていますので、ここに我々は協調するのか、それともそれを持ってきて参考にして独自に動くのか、物すごく大きな違いがあると思います。今、この機会に協調の方に持っていかないと、これは完全に置いてけぼりになる。
そのときに非常に重要なファクターは、論文誌を扱っているのは政府ではなく学会であるということです。そのときに、学会の財政状況が日本と欧米ではまるで違う。日本の学会はどんな巨大学会でも会費収入で、ぎりぎり赤か黒かというところで、私も日本化学会の理事をやっていますが、非常に厳しい財政状況にあるわけです。欧米の学会は、それ自体が出版社としての機能を持って――これも前年度お話しましたが、例えばロイヤルソサエティー・オブ・ケミストリーですと、75億円から80億円ぐらいの収入があり、そのほとんどが出版事業であって、会費は微々たるもの。丸善、日本最大の理科系の出版社であっても、確か25億円の売上げである。その数倍の出版社の規模を学会が持っている。
欧米の学会が産業界と議論をして、オープン化による早期のR&Dにどうこれから世界戦略を立てていくかというのは、学会が自分のお金で産業界とやっている。日本は、学会が自分のお金で何かアクションするというのは、ほとんどできない状況にある。ここのところをクリティカルな違いだということを認識して、それに対応する何か手を打たないと手遅れになるのではないかなと思います。
【喜連川主査】 そこまでは、前委員会時代に御示唆を頂いたところで、今回の委員会は、それで日本はどうしましょうかという、若干デリケートなところに入るかもしれないんです。
【北森委員】 そこを私もすごく期待しているわけです。それで、例えば化学の分野であれば、今幸いなところに、日本からの論文は大変高いリスペクトを受けている。これはアジアのほかの国からの論文数が非常に二次曲線的に増えているんですが、やはりクオリティということを考えると、まだ日本は十分戦っていけるというところに位置しています。
この状況をうまく利用して、例えば巨大学会と協調する。例えばデータは日本に置いていいだろうと。そのときに日本のデータジャーナルに置いたデータは、向こうのこれから作るデータジャーナルとシスタージャーナル、姉妹誌としての提携を結ぶ。そのために幾らかのお金のやりとりはするだろうというような、具体的な手は今だったら打てるので、化学だったらそのようなことを考えられるのではないかと思います。
【喜連川主査】 ありがとうございます。非常に具体的な、やっぱりドメイン・バイ・ドメインに大分状況が異なっていると思うものですから、今、北森先生から御示唆頂いたことは非常にインフォーマティブであったのではないかなと思います。日本、相当化学系のノーベル賞は出していますから、その辺の強みということで、今御示唆頂いたような方法論が。
でも、分野、分野で必ずしも同じような方法論が打てるとも限らないと思いますので、今混沌(こんとん)としている中でユニファイドされた結論を出すのは相当難しいと思っております。一歩一歩、そういう領域バイ領域で挑戦をしていくということをエンカレッジするようなメッセージを、文部科学省として出す、この委員会として出すということが重要なのかなという気が個人的にはしておりますが。
ほかに、林先生、いかがでしょうか。
【林上席研究官】 済みません、前半御指摘頂いた点から、また想起される論点がございます。おっしゃるとおり、抜けていました。むしろ防災が置かれている領域にゲノムサイエンスなんかは入るかとは思います。そのときに、おっしゃったように、例えば化学の中でもまた分かれていってということになるときに、一つ、データ共有の問題を解決する議論のヒントは、その領域の研究者が扱うデータがどれだけ構造化されているか、定型化されているか、あるいは標準化されているかという点があるかと思います。
例えば化学の中で結晶学なんていうのは、X線を撮ったデータというのはCIFという標準化されたファイルで定型化されていますので、早くからデータ共有が進んで、ケンブリッジのデータセンターでは、事業モデルも構築しました。オープンに結晶学のデータを研究者には公開しつつ、企業からはお金を取る仕組みが出来上がっていたりもします。これは一つのモデルとしていつも御紹介させていただくんですけれども、そういった形で研究プロセスにおけるデータの構造やメタデータが整っているものに関しては、オープンサイエンスを進める、データシェアリングを進める利得があります。
それは、裏を返すと、ゲノムや疫学のように定型化されている、元から定型化されている、あるいは研究者のお作法として定型化されている。まずそういった分野、同じドメインの中でもそういうサイエンスに関しては、データシェアリングの効用が効きますし、後半の議論にもつながりますが、そこで国際協調に乗り遅れると不利な状況になりかねない、そういった点があるかとは思います。そういう見方で、各ドメインの中でも分けていくという考え方があるかと思います。
【喜連川主査】 ちょっと十分聞き取れなかったんですけれども、企業からの負担金というのはどういうフレームワークで。結晶学の場合は。
【林上席研究官】 まず、結晶学で起きていることをかいつまんでお話しさせていただきますと、X線結晶学のX線で論文を書こうと思ったら、そのX線データ(CIF)をケンブリッジのデータセンターに登録します。登録して、査読者にだけはまず開示をされて、論文が出版されると、誰でも見られるようになります。それを皆さん、基本的に研究者は無料で検索・閲覧できるのですけれども、企業はどの結晶を検索しているかも知られたくないので、そのデータセットを丸ごと買い取って、自分の内部サーバにおいて使うようにするとか、そういう仕掛けがあったりもします。
これは一例ですけれども、ベースの考え方としては、(何かのトピックに関して)ほぼすべてがあるデータセンターに流れるという、非常に強いデータのストリームラインが存在すれば、企業はそのデータをまとめて買ってくれる場合があります。オープンになっているデータでも、企業から収益を得ることができるモデルとなります。
【喜連川主査】 そのビジネスモデルは丸ごと物質・材料研究機構(NIMS)では適用できそうな気がするんですけれども、谷藤先生のところ、お金持ちになれるんじゃないでしょうか。いかがでしょうか。
【谷藤委員】 実装済みと言った方がいいですね。
【喜連川主査】 材料分野において、このオープンサイエンス、今かなり懸命に推進されようとしておられるかと思うんですけれども、その中で一番ハードルになるといいますか、具体的に問題として想起されるようなこと、何かありましたら御教示頂ければと思います。
【谷藤委員】 ありがとうございます。林先生が触れた企業というステークホルダーに関して言えば、材料分野では企業とともに材料開発するというオープンイノベーションに取り組んでいますので、オープンサイエンスという言葉が登場する前からあるスキームです。またそれが自然な研究の流れでもあると思います。
一方で、先ほどの北森委員のお話にも関係しますが、オープンサイエンスという言葉によって、いみじくも露呈した日本の悩みは、日本の学術界の反応が遅いということだと思います。学問のありようになじみがあれば、ごく自然にオープンサイエンス政策に向けた学会対応も進む可能性がありますが、例えば学協会や学会ジャーナルでのテキストマイニングであるとか、多様な情報活用に向けた発展的なオープンサイエンスに向かった協同は、まだ勉強段階にあると言えます。
どちらかというと論文をオープンアクセス出版することには、大方に認識が広がってきたようですが、オープンサイエンス政策が求める姿に、学会として、あるいは学会会員として関心を持って関わる理由や目的が見えていない、という状況にあると思います。
JSPSによる国際情報発信強化という定期刊行物支援がありますが、オープンアクセスに掛かる費用を国が出してくれたら、取りあえずは論文出版費用を無料にすることは可能であるが、オープンアクセス化の次のオープンサイエンスに向けた、例えば日本のデータ戦略に、学会としてどう関わるかという国際情報発信の取り組み例はまだないように思います。
議論のための議論を重ねるだけでは具体的なイメージが共有できず、もう少し具体化することを急ぎませんかというメッセージですね。
【喜連川主査】 今おっしゃったのは、啓蒙(けいもう)以上に、やはりどういうベネフィットがもたらされるのかというところでややもやもやしているというところが、多分大きいんですね。研究開発法人としては、そこをクリアにされるのも、多分ミッションの一つのような。大変大切だと思いますので。
そうすると、同様の意見を頂きましたので、まずは皆さんをモチベートしないと、上から言っていても始まらないのではないかということがだんだん分かってきたような気がします。我々、コンピューターサイエンスなんですが、コンピューターサイエンスはちょっとまたかなり意識感が違う領域でもありますので、ドメインの領域で少しどういうふうにすればいいでしょうかね。
文部科学省の委員会に来ると、すごい重い宿題だけが渡されるという、特に喜連川委員会ではそうだという、悪評が僕に立つのは構わないんですけれども、それもちょっと失礼な気もしていまして。
あるいは、一人で考えてそれを布教するというのもしんどいので、どういうふうにその雰囲気を作っていくのがよろしいんでしょうかね、谷藤委員。
【谷藤委員】 幾つかのチャンネルでいろいろやってみて、共通しているなと思うのは、オープンアクセスとかオープンサイエンスというのは、それぞれの人がイメージするものが違うことです。その先に見るイメージがある程度に共有できていないと、議論が散発的にあるだけで時間が終わってしまいます。机上論でもいいから幾つかケースモデルを、こうして、こうなったら、こんなふうになるよねということが共有できるイメージを創ると、議論が前進するように思います。
それは、材料分野でも始めているところで、その材料分野の中でも、今ここでデータをこうすることによって、この先こんなふうになるから、いいですよねということを言うためには、まずそのイメージを描き、共有することが有効であると思います。
【喜連川主査】 林先生、そういうイメージが描けそうな日本の分野というものの何か感触みたいなのは、一度そういうイメージを、例えば何学会、何分野かこちらにお招きして、この場でも議論を重ねることというのは非常に有益ではないかなという気がするんですけれども。コンプリートなものは無理だと思うんですけれども、アーリーステージでもそういうものが描けそうな分野というのは、感覚はございますか。
【林上席研究官】 はい、多少教科書的なお答えになりますけれども、長年の歴史と経験をお持ちなのは、やっぱりDBCLS(ライフサイエンス統合データベースセンター)、生物系、バイオデータベース系のセンターの若手の人たちです。ただし、今のところ立ち上がりでもあるので、どこも属人的な面が強く、その人の頭の中にビジョンがあるというケースがありますので、それをうまく引き出せる、組織としてこうだというようなところまで行っているところはかなり少ないと思います。また、ビジョナリストが寄って集まれば必ずいいビジョンができるかというと、そんなこともないと思いますので、まずは、個々に取り組んでいる方々をうまく認識して引き上げる、というのはすごく大事なことだと思います。
その流れで言うと、ほかに問題意識として高いのは海洋研究開発機構(JAMSTEC)さんとかですね。あと、防災科学技術研究所というような感じで。今、オープンサイエンスのこと、データシェアリングのことを当事者意識を持って真剣に語れるのは、やっぱりドメインベースの研究所がどうしても強くなります。大学の場合は、部局ごとにそれこそ考えないといけないという状況で、大学としての統合が難しい。そういう中で、横にいらっしゃる引原先生の京都大学は、その中でも研究データの整備を「大学」で進めている中では一番先頭を走っているというのが、私の認識ではございます。振ってしまって申し訳ありませんけれども。
【喜連川主査】 とうとう発言の機会が。
【林上席研究官】 もう1点だけ付け加えさせていただきたいのは、ビジョナリストに加えて、既に前回のプレゼンで少々伝え切れなかった点として、オープンサイエンスが進んでいる研究領域では研究者が自発的に進めているわけで、そのときに、それを進めている陰の立て役者みたいなのが既にいらっしゃるわけですね。有り体に言えば、データの管理をしている人、あるいはソフトウェアの開発をしている人、だけど、実は論文を余り書けていなかったりすると、全然認められないのです。
実は、私の見た範囲でも、既にオープンサイエンスに寄与している方は(日本でも)それなりの数いる、確実に存在しているので、そういう人たちをまず認識して、研究者の評価としても認めるということによって、こういうキャリアパスもあると知らしめることが必要だという話があります。データ共有に貢献し、新しいサイエンスを生み出そうとしている様々な活動をしている人も研究貢献者として――それをサイエンティストと呼ぶかとなると、またちょっと議論が分かれるかもしれませんが、研究に貢献する者として認めるみたいな形にしていくことになります。そして、更に拡張して恐縮ですが、その議論と多分図書館(員)の将来像とがリンクすることになり、オープンサイエンスに向けてより現実に寄り添った建設的な取り組みにつながりそうな気がします。
【喜連川主査】 また、お招きする人の選択に関して、ちょっと御相談を事務局からもさせていただくかもしれませんが、どうぞよろしくお願いいたします。
引原先生、御登場。
【引原主査代理】 きょうは静かにしますと喜連川先生に申し上げていたんですけれども。林先生から振っていただきましたので2、3申し上げたいんですが、先ほど谷藤先生がイメージを共有化するということは非常に重要だと言われたのは、正にそうだと思います。手前みそですけれども、大学がオープンアクセスのポリシーを出していくということで、その先は何があるかというのが最初見えないから、みんな動けなかったと思うんです。例として出していくことによって一挙に動いていくという実例はあります。
ですから、イメージを共有化するというのはやはり重要なポイントであろうと思うんです。先ほどの、研究者がデータを公開していくということのイメージは、本当にまだ見えていないんだろうと思います。我々、危機感を持っているのは、データを取られてしまうとか、出版社に対してどう対抗するかとか、そういうような戦略的なイメージはあるんですけれども、個々の研究者はやっぱりイメージが描けていないということです。
周りの化学系の研究者に聞きますと、論文を出したときにデータもアップしないといけないんですが、肝腎の部分をアップしないということを宣言する人たちも多いとのことです。じゃ、何のためのオープンデータなんだろうと思います。ですから、オープンデータ自身が研究者の自分たちのものではなくて、ほかから持ち込まれたコンセプトでオープン化させられているという実態にすぎないんだろうと思います。
ですから、コミュニティを守るということは、これまでの話にありましたけれども、化学系、あるいはJAMSTECもそうですけれども、いろいろなところのコミュニティを守るためにオープン化していかないといけないのに、オープン化になっていないという実態があるということも、これは意識しないといけないんじゃないかなと思います。それはイメージの問題ではないかなというのは、分かるような気もします。
先ほどからの議論にもう1個なかった点は、人社系というのがこの間も話があったんですが、日本は人社系というのは、海外から日本のデータは余り興味を持たれていないのではないかと思われている点です。前回申し上げたかったんですが、画像のフォーマットとして、IIIF(トリプル・アイ・エフ)等が共有化されるようになってきています。進めている国には余り必要なデータがなくて、欲しいのは日本であるとか、中国であるとか、インドであるとか、割とそういう世界のデータが欲しくて仕方がないというのが実態としてあります。
それは、ヨーロピアーナというか、ヨーロッパが特にそうなんです。著作権とか、所有権とか、全く無視して、今だったら何も考えないうちにデータが集められるだろうと彼らは考えている部分があり、非常に危ない状況になっています。日本も同じ状況です。いろいろなデータを今出していくような形になっていますし、喜んで出してしまいますと、また同じことになるという、先ほどの議論そのものになっていきます。
ですから、まだ踏みとどまれる分野は人社系にあると思うんです。やはりそれも理系と同じ状態で、やはりICTの分野、ほかの分野の人たちの知見の下で、やっぱりここは踏みとどまらないといけない部分としてあると思います。
最後にもう一つだけ申し上げたいのは、日本の画像化の技術はすさまじいです。高精細の画像処理もすごいと思います。そのデータを作れるところは、そんなに世界にはないんです。ですから、多くの国が日本を下請にしてデータを作らせようと思っている。その言葉を何度も聞いたことがあります。その状況で喜んで出してしまっては、やっぱりこれは駄目です。
そこまで、やはりテクニカルな面が優れているということを思いながらも、どれだけオープンにして、どれだけクローズにしていくかという戦略を全ての分野で持っていくということが必要なのではないかなと、今聞いていて思った次第です。ですから、化学系のデータでもどこまでオープンにしていくかということ。コミュニティの中で買い取れば使えるとか、それはお互いに出せば使えるとか、そういう共有関係というのが作り上げられないと、これはなかなかオープンサイエンスの方向には持っていけないのではないかなと考えたりします。お答えになったかどうか分かりませんけれども。
【喜連川主査】 最初に引原先生がおっしゃったオープンサイエンスという言葉は、現場の研究者の声から生まれたものではないのではないかと。むしろ、ポリティカルリーズンから来たもの、その辺のオリジンはちょっと私もよく理解できていないんですけれども。何度も言われているのは、G8がディベロッピングカントリーに対して、という言い方の配慮から来ているのかもしれない。その辺は、いわゆる理系の研究者間の努力というか、つらさみたいなものを感じられていないとすると、そもそもこなれないのではないのかと。
だからこそ、共有すべきイメージが必要ですよと。それは、引原先生的には作っていくことができそうなのか。後半の二つの事例からおっしゃると、そもそも共有イメージが難しいとおっしゃろうとしているのか。
【引原主査代理】 いや、作らないといけないと思っています。ただ、無理やりな作り方というのは無理であると思っています。ですから、タイミングはそれぞれあると思っていて、お尻をたたいて作れと言っても、それはできないと言って、今物すごく反撃を受けているのが現実だと思います、国内ではですけれども。
【喜連川主査】 そうすると、今回の取りまとめの中で、林先生からの紹介の中にまとまっていたと思うんですけれども、ピュアオープンではなくて、取りあえずシェアリングであると。ミューチュアルベネフィットが確立されるところから慎重にやっていくというのであれば、そこそこ行けそうだという御意見。つまり、持っていない人が他人のものをもらうために、やや全部オープンにしましょうと、そういう魂胆が見え透けているというのが、2番目のポイントだったわけですけれども。
【引原主査代理】 おっしゃるとおりです。
【喜連川主査】 そこに関してはどう?
【引原主査代理】 どうというか、おっしゃったとおりですけれども。やはり、データを持っている者がオープンにして協力していく、あるいは学問をその分進めるということは必要なことだと思います。それはアカデミックには必要だと思うんですが、その先、データになった時点、例えば画像でも、本体はあっても、画像データができた時点でそれが一人歩きしてしまいます。そのデータは本体よりも良いものになってしまう可能性があります。現物を持っていると強いという意識が物すごくあるんですが。
例えば何かの画像、物件だとしましょうか。そういうデータを持っているから、本体が日本にあるから大丈夫という発想があるかもしれませんが、それよりもデータになったものの方が価値を持つ可能性というのが非常に高いです。それは今までの理系でもそうです。論文、あるいはそこの実験施設よりも、データの方が重要になってきていることが多いわけです。たがら、そこのシフトに対して、どう我々が認識してやるかというのが重要なのではないかなと思っています。なかなか伝わらないのかもしれないですけれども。
【喜連川主査】 おっしゃっていることは伝わっていると思うんですけれども。要するにシーケンサで、X Tenというばかみたいに高いイルミナの装置を買う必要はないと。イルミナでスキャンしたデータさえもらえれば、それは一番得ですよということ。データが財として一番重要なポーションになっているときに、よっぽど慎重に考えないと、一番いいところを取られちゃいますよということをおっしゃっているわけですね。
【引原主査代理】 そうです。
【喜連川主査】 そんなこんなも含めて、きょうは前回に比べますと相当深い議論ができたと思うんです。私の理解では、引原先生は、そういう諸般の考えなければいけない、配慮しなくてはいけないものが多々あるにしても、流れとしては、データの共有化というのは避けられない方向ではないか、というのが分からないんですけれども、今のところ、多くの研究者の動き感なんではないのかなという気もしています。
そこのうまいエコシステムを描くことを、一定程度ドメイン・バイ・ドメインにやっていくということしか、方法がないんじゃないでしょうか。
【引原主査代理】 おっしゃるとおりです。ですから、大学でもいろいろな方法、岡部先生はおられますけれども、メディアセンターを通じたやり方と、それから大学の人社系の研究所を通じて、まとめて図書館、あるいは博物館でやっているやり方というのを、今統合しようとしております。その統合のイメージを作り上げるために、足しげくいろいろな人としゃべっていくということが今は重要なことで、そうすると、そこからドメイン・バイ・ドメインだったのが横につながっていくという、ローカルなところからやるしかないかなというところだと思っています。
【喜連川主査】 よろしゅうございますでしょうか。だから、データのイメージをきっちりすることによって、このデータは日本が出したものなんですという、今インダストリーのパワーバランスからしますと、センサー外の投資というのが相当大きくなってきているんです。そもそも計測できないことと、計測できることという、そこの知財を固める方が、財として見たときにどっちが強いかという議論もあったりしますので、なかなか一概にデータになってしまったら全てということは言いづらいかもしれないんですけれども、引原先生がおっしゃったようなことも含めて、少し戦略を練っていきたいと思うんですが。
今回、いい御視点を幾つか頂きましたので、この委員会としては、そういう視点も含めて、一度何個かの領域に関して本音の議論をお願いさせていただきながら進めるというのが一歩かなという気がするんですけれども。そういう方向について。
じゃ、はい。
【家委員】 今までいろいろなところから出た御意見、特にオープンデータに対して、安直に対応するといろいろなリスクがあるというのは、それはみんな幾らでもたくさん思いつくんですが。逆に、対応しなかった場合、あるいは流れに乗り遅れた場合、漠然とした不安はみんな持っていると思うんですけれども、具体的にどういうリスクが考えられるのだろうかというのが、いまいち私にも分かっていないし、その辺がもやもやとして議論が進まない一つのファクターかなという気もするんですけれども。
【喜連川主査】 これは、私が答えていいのかどうか分かりませんけれども、一応政府間の協定というものがあったときに、そこで合意をしている中で、トランプさんみたいに振出しに戻すというのも幾らでもあり得るわけですけれども、今、SDGsのようなものが進められている中で、一定程度、先進国がいろいろな意味で後進国を助けるというところの一つのカードにはなっているのではないかと。
【家委員】 それはよく分かるので、後進国の研究者が、パブリッシュされた論文にアクセスできるようにするというのは、それはコスト負担だけの問題で原則的な反対はないと思うんですけれども、それを拡大解釈してオープンデータまで本当にG8で合意したのかどうかというのは、私はよく分からないし。
【喜連川主査】 この辺をちょっと、1回調べないと分からないんですけれども、論文を読んで再現性の実験をするなんていうのは、もうそんなことをやっている暇はないぐらいの時間感覚ではないかと思うんです。我々は今論文を発表しますと、原則データとプログラムをくださいという言い方を、どんどん論文発表そのものから出てきますので、この傾向そのものは避けられないのではないかと。我々の、喜連川個人かもしれないですけれども、そういう感触がしていますけれども、先生のところは余りそうでもないですか。モラルというか、データに対するカルチャーが違うのかもしれないですね、分野によって。
【家委員】 論文に関連するデータというのはどこまでの範囲を言うのか、ということもあります。論文に対して疑義が生じたり、あるいは問合せがあったときに、論文の根拠となったデータは当然持っているはずで、それをある範囲でオープンにすることに、そんなに抵抗はないと思うんですけれども。
【喜連川主査】 どうぞ。
【引原主査代理】 今先生がおっしゃった、どこまでオープンにするかという問題は、別の内閣府の委員会でも議論はされていますけれども、線引きというのがいまだ議論の最中だと思います。
【家委員】 むしろ今は、例えば産業界なんかからは、論文になっていないデータが求められているのではないかと思うんですね。
【引原主査代理】 そうです、どちらかというとネガデータといいますか、出ていない、失敗したデータを集めようとしています。
【家委員】 そこは、研究や研究発表の在り方に関して、非常にリスクの大きい話だと思います。
【喜連川主査】 ですから、最初の御質問に答えますと、リスクという観点では、何となく大きな流れがある中で、日本は今まで随分、かなり慎重な態度を示してきているところで、これに関しても、最初にやると発言権がある中で、ちょっと遅れてしまうことへの不安感があるというぐらいのところが、一つのポイントではないかと思います。
北森先生、いかがですか。
【北森委員】 今、しばらく議論を伺っていて、まずオープンサイエンスに対する認識をいろいろな人に持ってもらいましょうと。これは当然のことなんですが、私はイギリスの方の学会に関わり始めたのは12年前なんですが、もう10年前にやっていた議論が、ちょうどきょうの議論。オープンサイエンスというのは何ぞやというのを、巨大学会が主導して、そこに集まってきている世界中からのアソシエイトエディターというんですが、論文を直接ハンドリングする人たちに、まず議論させ、そして自国の学会内で議論し、それを大学に伝え、ということをやっていたのが10年前ぐらいからです。
その議論が、今では、実際にどういう施策、あるいはどういうふうなデータ形式にして実際にデータを集めていくかということの段階に入っている。それで議論をしているのは、学会と産業界、学会と政府、それぞれに利用の仕方が違うわけですから、それぞれのセクターと議論を進めているというのが今の状況です。
それですので、ぐずぐずしていられないというのが言いたいことなんですが、欧米で10年前のことを今から始めて、それから、その先の施策をその議論が終わってからというのでは遅くて、両方一遍に進める必要がある。啓蒙(けいもう)する必要もあるし、それから学術外交としてどういうふうに先に進んでしまっているところと手を組んでいくか。あるいは、国費をかけた研究で得ているデータをどう守っていくか。そういう観点で議論する場所と、やっぱり同時に進めるべきだろうというふうに思います。
それで、どうやって使うかというのは、これも我々化学の分野ではほとんど自明です。ここにいる先生方はオリジナリティー、ノベリティーで勝負しているんですが、サイエンスはそれだけで進んでいるわけではなく、むしろ、その二番手でいろいろなデータを出して、銅でできたものが鉄でできるのか、コバルトでできるのか、そういういわゆるフォロワーの人たちの重要性というのは言わずもがななんですが、二番手の人たちで、フォロワーが出してくれているデータというのは、実用化してゆこうとすると、それが非常に大きな資産になってくるわけです。
その大きなデータを今の時代はマイニングをしていって、実験をやらないような人たちが創薬をするときに、過去の失敗データも含めて引き出してきて、それで、こういうふうに合成すれば、こんなふうに効くだろうということを、実験せずともある程度の見通しがつくような時代になってきてしまっている。これが、更にディープラーニング等が進めば、もっともっとこの傾向が進むのは自明であると。その認識は数年前からイギリス、その他の学会で議論されている。ですから、ここで議論していることも、実際にどういうふうにするかという段階の話と、国としてどう対応するのか、学会にどう対応させるのかというストラテジーに相当することと、両方とも同時に進め、そして具体的に施策を出すというのが一番大事ではないかと思います。
【喜連川主査】 大変貴重なコメントで、ですから、最初に先生に御意見をお伺いさせていただきたくて、もうちょっと露骨な表現にしますと、10年前に起こっていて化学会は今まで何をされてきて、どう啓蒙(けいもう)してきたのか、ということの共有から始めるべきではないかと思った次第です。
【北森委員】 是非共有していただきたいと思います。それは、この場でない方が好ましいと思いますので。それは、日本の学会が置かれている、特に化学会というのは巨大学会の一つであります。その巨大学会の中のメンバーであると同時に、私は分析化学、あるいはマイクロフルイディクスという、ごくごく狭い分野の専門家であるわけです。巨大学会の中の部分集合がやっている議論と、巨大学会全体の意見とはまた違ったりします。
言わんとすることはお分かりだろうと思いますが、そういったことが、やはりこの国の学会の抱える非常に大きな問題点ではないかと思います。直接的な表現で議論させていただくのは別の場でやらせていただければと思います。
【喜連川主査】 文部科学省でこれだけこういう御発言が出る委員会に出ることは、僕もめったにありませんので、ある意味で非常に本音のいい御議論をさせていただけたかと思います。
そうしましたら、大体大きな方向感としての御意見はお伺いできたかと思うんですけれども、ちょっとフラストレーションがたまっていると、私も言いたいという先生がおられましたら、御意見を伺いたいと思います。
それと、この後、冒頭申し上げましたけれども、大分時間が少なくなってまいりましたが、学術情報基盤の現状について、文部科学省からおまとめいただいたものもあります。何か言い残されたこと、いっぱいありますか。ちょっと縮小めに。
【永原委員】 私はオープン化が進んでおり、産業界とも距離のある天文とか、惑星科学という分野に属し、情報はGoogle Scholarで検索し、arXivで研究内容の情報を得るという世界に生きております。すなわち、最先端の研究や研究者についての情報はそこで得ることが大部分です。このような状況では、例えば日本の論文のサイテーションが少ない問題について言うと、まず名前を知られることが必要で、検索でいかにしばしば名前がひっかかってくるかかが重要です。
どこの分野も早晩このような状況になると思われますので、オープンサイエンスという枠組みが問題なのではなく、むしろデータの質の特性が問題なのではないかと思います。なぜこの分野が早期にこのような状況になったのかと考えると、実はデータそのものが共通でとられているわけです。大型の望遠鏡だったり、衛星だったり、あるいは掘削による試験だったり、リモートセンシングだったり、個人の手によるものではありません。しかしこの分野でもかつては、データを実際にとった人が、この貴重なデータは自分のものなので保持していた、自分が論文を書きたいと思っていましたが、あるときこれでは駄目だと気付いたわけです。
プロジェクト全体でいかにたくさん結果が出るかが次につながるという、非常に自明なことを皆が認識した結果、積極的にデータは公開することにしたわけです。ただし、一次データは難し過ぎて、公開しても普通の人は使えません。ユーザーが使えるように、ある程度加工したデータを公開することが、プロジェクトを立てるときから計画に含まれ、その仕事をする人間も手配されているというストラクチャーが出来上がってきたわけです。
議論を伺っていますと、このような分野と、例えば化学とか物性関係の基礎的な分野ですとか、個人的なレベルで研究がやられているところには明らかに違いがあります。そこからさらに、研究結果の共有ということそのものがまだよく理解されていないような分野、恐らくこの三つぐらいの段階に分けて、どうあるべきかというピクチャーを作らなくてはいけないのではないかと感じました。学術全体を一まとめにして、オープン化、そのための具体策作りという議論では、無理があるのではないかということを強く感じました。
【喜連川主査】 いわゆるビッグサイエンスの場合は、そもそも実験そのものが共有化されておられますので、多分内閣府でも私は言ったんですが、要するに化学の部分が一番整理しにくいんです。やや生々しいところの学問がやっぱり一番重要になってまいります。
谷藤先生、まだ言いたいことはありますか。
【谷藤委員】 少し頂けたら。家先生のお話をお聞きし、気が付いたことがあります。
欧米の大手ジャーナルに論文を出すときに、今はデータファイルも出すように学会や出版社から求められます。論文投稿のついでにデータファイルを提供することは、本人意思であるとしても、そこに提供されたデータは、例えば日本からビックデータやデータ駆動型研究のために収集しようとしても簡単にはできません。このことはオープンサイエンス潮流に乗れていない日本の問題だと思います。
何かの目的で、昔の物理の論文で現れていた数式やデータを改めて集めて別の研究に役立てたいと思っても、PDF化された論文をデジタル化してプロットデータをデータとして変換するという作業をすることになる現状は、オープンサイエンス政策の向きには合っていません。
ジャーナルがどれだけオンライン化されようとも、実際のデータ利活用の場面でこのような非近代的な方法によって近代の科学が進んでいる矛盾を、もう少し合理的にできるように、学会だけでなく、国のデータ戦略として取り組むべき時代に来ているのではないかというのが、このオープンサイエンスに絡んできているオープンデータの一つの目的だと思います。ですので、せめて日本の学協会が出しているジャーナルぐらいは日本にきちんとデータが保管されている、使いたければ使える状況にあるというインフラが大事なんだと思いますし、それが国際競争力に勝つ一つの条件になっていると。
そういう時代に来ているという意味では、この後お話になる基盤の話は大変重要だと思うのは、研究データを使うようになった途端に、今度は通信の話と、保護の話と、セキュリティとか、容量とかいう話が一緒になって出てくるので、これはジャーナルを出しました、だけの話にとどまらない、そういう話に今行こうとしているということなのではないかなと思います。以上です。
【喜連川主査】 それでは、通信、セキュリティという次の話題が大変重要だという前振りをしていただけたということで、ほかにも御意見いろいろあろうかと思うんですけれども、ちょっと司会進行者の気持ちも忖度(そんたく)頂きまして、ネットワーク等の学術情報基盤について御紹介を頂ければと思います。
それでは、よろしくお願いします。
【丸山学術基盤整備室長】 それでは、資料の2、3、4、5、6までを順次、時間もありませんのでごく簡単に御説明したいと思います。
まず、資料2でございますけれども、こちら、特にSINET5の整備に当たりまして、平成26年7月にこの学術情報委員会において、審議の取りまとめを頂いたものでございます。それの要旨をざっくりと作成しましたので、御紹介したいと思います。本日の御議論にも関連する部分を中心に紹介をさせていただきたいと思います。
まず1番の「はじめに」でございます。当時の状況といたしましては、我が国の学術情報基盤の整備が滞っていたということで、欧米、あるいは中国等、諸外国に後れをとっており、格段の高度化が不可欠と。各国との関係の現状は後ほどまた御説明したいと思いますが、こういう認識でございました。
背景といたしましては、人類の創出する情報量は21世紀に入り爆発的に増大と。ネットワーク上を流通する情報量はますます増大する傾向であったと、あらゆる組織でクラウドコンピューティングを導入する動きが顕著であった、ということであります。
2の(3)にございますように、当面の基盤整備の方向性としては、学術情報ネットワークの高度化は当面の喫緊の課題というふうにされたわけであります。
他方で、アカデミッククラウド環境の構築の必要性が指摘されて、導入においてはデータ量の大きさに耐え得る安定した高速ネットワーク環境の構築が必要というふうにされたわけであります。
一つめくっていただきまして、2ページ目でございます。そういった背景を踏まえまして、次期SINET、今で言うSINET5の整備について指摘がなされております。方向性としては教育、学習、研究基盤における新しい動向を踏まえて、クラウド等の構築・普及も念頭に置いた機能強化を効率的に行う必要があると。
一方で、SINET4の現状は、(3)にございますように、帯域は最速でも40Gbpsでありました。特に東京-大阪間、東名阪、あるいは日米間において通信帯域はひっ迫している現状で、さらに、海外の同様の学術ネットワークとの接続において相応のネットワークを構築する必要性がうたわれたわけであります。
海外はどうなっていたかと申し上げますと、後ほどまたペーパーが出てまいりますが、北米、欧米、アジアのいずれも100Gbpsの回線の導入が完了、あるいは整備が開始された段階にあって、国際間のネットワークにおいても100Gbps回線の利用が開始されたということでございました。
こういったことから、SINET5の整備に当たっては、まず国内回線は各都道府県に100Gbpsの高速ネットワーク環境をバックボーンとして全国に構築しようということで、今後のネットワーク需要を踏まえて、更なる増強を図るということにされたわけであります。
また一方で、国際回線についても、既に諸外国の学術情報ネットワークは100Gbpsの規模で増強が進行している中で、我が国においても対等な環境整備が必要とされたわけであります。
最後に、3ページ目でありますけれども、まとめとして大学等が国際競争力を保って優れた教育研究活動を展開していくためには、セキュアで高度な教育研究環境の持続的な確保につながる学術情報基盤の整備が不可欠とされた上で、クラウド化を含めた学術情報基盤の構築については、大学等とNIIが連携を図りながら積極的に取り組むことが大きな効果が期待される、ということであります。
また、SINET5においては、大幅な増加が見込まれる情報流通ニーズに応える帯域の確保と、クラウド基盤構築のためのネットワーク技術、あるいは最新のセキュリティ対策、情報コンテンツの相互利用を可能にするプラットフォームを搭載するということ。
さらに、大学等においては、機関とSINETをつなぐアクセス回線の高性能化に努めるといったようなことが提言されたところでございます。
こういったことを踏まえまして、現状の御説明でございますけれども、資料3をごらんいただきたいと思います。SINET5の概要でございます。SINET5は平成28年4月から運用を開始されております。その前はSINET4というフェーズでございました。全国の大学等を、今申し上げたように100Gbpsの網目状で接続をすると。さらには、海外の拠点とも相互接続をするということであります。
大学等は全国の50か所でございますけれども、最寄りのデータセンターにノードが置かれましたので、そこに大学等のニーズに基づいた帯域の回線を調達して接続をするということです。御案内のとおり、谷藤先生も最後に御発言がございましたけれども、こういった通信回線の運用と併せて論文の所在情報をはじめとする学術情報を流通させるための、正に学術情報の基盤ということでの整理が行われているわけであります。現在の加入機関数は、本年3月末時点で857ということになっています。
2ページ目、おめくりいただきますと、ちょっと駆け足で申し訳ございませんが、SINET4からSINET5へ、ということです。SINET5では、前の平成23年度から27年度に運用されたSINET4が先ほど申し上げたとおり、最速で40Gbpsの回線と、国際回線は10Gbpsということでございました。取り巻く環境としては、先ほどのクラウド化、大量の通信データがSINETに流入してくるといったような状況、あるいは、ほとんどの先進諸国が100Gbpsの回線を導入するといったような状況下において、SINET5においては100Gbpsの回線を全国的に導入するということで、国際回線の高速化が図られた、それから、情報サービスの強化が図られたということになっております。
3ページ目は国際回線の状況でございます。そういうことを踏まえて、SINET5の整備が進んだわけでございますが、現状としては国際回線はこのような状況になっております。この赤い部分がSINET5での国際回線の部分でございます。緑は他国が整備をしている部分でございまして、それらは相互に接続点において相互接続されているという状況です。SINET4からSINET5に整備した際の背景にあった各国の整備のバランスが、この絵をごらんいただくとお分かりのとおり、崩れてきている状況にございます。
例えばSINETのニューヨーク回線でございますけれども、南米回線も含めた100Gbpsのところに10Gbpsでつないでいるといった状況でございます。ヨーロッパについても、SINET4のときはヨーロッパ回線は直接はなかったわけでございますが、これはSINET5から導入した回線でございますけれども、既に東京-ロンドン間は周りが100Gbpsになっている中での10Gbpsが2本の接続と。
それから、アジアに目を向けますと、シンガポールに米国が100Gbpsの線を引っ張ってございますけれども、そこへの接続については、日本はまだ10Gbpsにとどまっているといったような状況です。
それから、シンガポール-ロンドン間、これはヨーロッパとアジアの各国との協力でネットワークが引かれているわけでございますけれども、現状は10Gbpsと聞いてございますが、近い将来には100Gbpsに増速予定と聞いております。
それから、こういったSINET5でございますが、4ページ目、これは御承知のとおりでございますので、ごらんいただければと思います。下の絵にございますとおり、大型実験施設等の共同利用であるとか、あるいは各分野での連携力の強化、あるいは世界各国との国際連携、それから、ビッグデータの共有、あるいは各大学の教育研究の質向上のための基盤となっています。基盤というよりは、正に生命線なのだろうという認識でおります。以上がSINET5の状況でございます。
資料の4番でございます。この資料は学内ネットワークの整備状況でございます。実は、高速ネットワークの有効活用という観点からすれば、大学等の機関と最寄りのSINET接続点との回線、また学内のネットワークの整備、すなわち利用者と結ぶ最後の部分が非常に重要ではないかと考えている次第でございます。この委員会の2回目にもお出しした資料と同様でございますけれども、学内LANの状況は今こういう状況になっておりまして、1Gbps以上の回線を整備している大学が9割を占めておりますが、そのうち10Gbpsの高速回線で学内LANを整備している大学が約3割ということであります。圧倒的に国立大学の整備が進んでおりますが、5年以上設備更新ができていない大学というのが、全体の6割を占めているという点が課題になっております。
それから、これの2ページ目は、今度はSINET等との対外接続の状況でございます。現在、各家庭でも1Gbps、ベストエフォートで接続できる状況でございますけれども、大学等においても1Gbps以上の回線を整備している大学というのは6割強にとどまっていて、そのうち10Gbps以上の高速回線を対外接続に使用しているところは13%ということになっております。こちらについても、5年以上設備更新を実施できていない、増強できていない大学が全体の半数以上を占めているということで、ユーザーの近辺においてボトルネックの状況があるのではないかということが見えております。
それから、資料5でございます。こちらは、クラウドの状況でございますけれども、近年、学内、研究機関の情報システムをクラウド化している機関が非常に増えております。情報システムをクラウド化している大学は、これ、学術情報基盤実態調査の統計でございますけれども、平成28年度は8割になっております。下に棒グラフがありますけれども、24年度からは約1.46倍というか、1.5倍ぐらいの伸びになっております。
一方で、2ページ目にございますとおり、クラウドの用途は、複数回答ではございますが、かなりの部分が管理運営基盤にそそがれている部分が多くて、教育・学習基盤であるとか、研究基盤の利用というのは、下のように、特に研究基盤についてはまだ15.3%というところにとどまっていると。ただ、このあたりが今後ぐっと伸びてくる可能性との兼ね合いで、ネットワークへの負担も大きく変わってくるのだろうと考えています。
最後のページがクラウド化の効果ということでございます。その効果としては、管理・運営等に係るコスト軽減、特に大学等においては大変財政状況がひっ迫しているという観点もございますので、今まで以上に中身も含めてクラウド化が進行してくる可能性が非常に高いと考えております。
こういった状況も踏まえて、最後の資料6でございます。NIIにおいて、このSINET5の運用においては、商用クラウドの活用支援をしてございます。SINETに商用クラウドを直結して、加入機関向けに接続環境を提供しているということで、商用クラウドサービスを高速・安全・低価格で活用することが可能な状況を整備してございます。
データとしては、一昨日時点のデータをとってございますけれども、現在21社の商用クラウドがSINETに接続されている状況であります。これを活用している機関は、2ページ目にございますけれども、利用加入機関数としては88機関ということになっておりますが、今後、先ほど申し上げたようにクラウドの活用の拡大とともに、接続機関は増えてくるものというふうに考えております。
非常に広い概念でございますが、きょうはネットワーク周辺のデータにとどめさせていただきましたけれども、いずれにしても、これまで御議論頂いている図書館の関係であるとか、今御議論頂いておりますオープンサイエンスの関係であるとか、こういったものを下支えする非常に重要な基盤でございますので、この委員会でも御議論を十分に頂きながら整備の方向性を見ていきたいと考えております。以上でございます。
【喜連川主査】 どうもありがとうございます。前回、林先生から御議論頂きましたような形で、今回はまず、現状の学術情報基盤、どうなっているかというのを御報告頂いた形ですので、まずこれに関しまして御質問等を、どんなアングルからでもいいかと思うんですが、頂ければと思います。いかがでしょうか。
岡部先生。
【岡部委員】 私はNIIで学術情報ネットワーク運営・連携本部という、正にこのSINET事業の諮問機関の委員も務めているんですが、きょうはその立場を離れて、ちょっと喜連川先生、安達先生を驚かすようなことを言うかもしれませんが、お許しください。
ここで、こういうふうに出していただいたのは、現状がどうかということだけではなく、次どうするかということも含めて方向性を考えるということだと思うのです。そういう意味で、NIIはこういうふうにSINETの広帯域ネットワークを引いて、またクラウドということで商用クラウドへのアウトソースによるコストダウンをやってこられたわけです。きょうの前半の話との関係で言うと、これだけではまだ足りませんよね。
この委員会の前の期の議題であったオープンアクセスに関しては、JAIRO Cloudということで、各大学が機関リポジトリを整備するというのがこの委員会の答申でありまして、それに対して各大学が作るところの受皿として、NIIは入れ物として、あるいはプラットフォームを用意して、そこに各大学が作るということをなされたわけです。
次に、我々は、今度はオープンサイエンスをやろうということで。それには、データジャーナルとか、いろいろな仕組みがあって、もちろん各分野によって温度差はあるけれども、やりたいと思ったところが、じゃあやろうかということになったときに、膨大なコストを掛けて作らないといけないという現状があると思うんです。ですから、そこに対してNIIの基盤は何ができるのかというところを御検討頂ければどうかと思います。以上です。
【喜連川主査】 これ、委員長が発言するのもあれですので、安達副所長。
【安達国立情報学研究所副所長】 今の御質問の件については、既に取組を始めております。研究データ基盤、すなわちオープンあるいはオープンでないものも含めた、研究機関における研究データの管理のためのシステム構築を行い、既に幾つかの大学で試行的な利用と評価を始めております。機会を頂ければ、是非この委員会でもその現状とコンセプト、展望について御説明させていただければと思っております。
今申しましたように、単にデータをオープンにするというところだけではなく、研究プロセス全体の中でデータを作っていく過程も含め、その中でオープンにするものをオープンなリポジトリに持っていくというところを、いかに合理的に、例えば研究グループ内でデータを共有することなども含めて、そのような機能を持つソフトウェアを実現し、クラウドの形で利用していこうという取組であります。以上です。
【喜連川主査】 どうもありがとうございます。4月1日に、オープンサイエンス基盤研究センターというのも作っておりまして、正に岡部先生から御指摘頂いたようなものを共通プラットフォームとして何か御支援できないかというのを検討しているところでございます。
【岡部委員】 是非この委員会で御紹介頂いたらと思いますが。
【喜連川主査】 そうですね、ちょっと事務局と相談して。実は谷藤委員のところと、にこにことしたNIMS協調のMoUの写真まで、NIMSのホームページに出ているんですね。
【谷藤委員】 私ではなくて、理事の。
【喜連川主査】 ですので、一定程度、少しずつ進めているんですが、先ほどの引原先生の御指摘のような、なるべく上から目線にならないような形と、いろいろな機関と協力しながらというのを、このSINETと同じように進められれば有り難いと思っておりますので、御紹介の機会があればそのようにさせていただきたいと思います。
それ以外に、ネットワークの整備状況等に関しましては、このような数値というのはなかなかごらんになる機会も、我々も余り多くないんですけれども、御質問等ありましたらお願いいたします。
先生、どうぞ。
【逸村委員】 国際的な状況と対比して、現在の状況はどうなんですか。前の資料等を見ていると、SINET4のときは、かなり国際的に立ち遅れたので、何とかSINET5で追いつくんだという話で、2016年から追いついたと言っているんですけれども、当然、諸外国も更にその先をいろいろ考えているのではないかと思うんですが、そこら辺は現在どうなっているんでしょう。
【喜連川主査】 どうぞ、安達副所長、お願いします。
【安達国立情報学研究所副所長】 今回のこのSINET5の設計のポイントは、スケーラビリティーと信頼性にあります。この新しいネットワークのつながり方の構成、日本海側や太平洋側に沿う部分や、それらをつなぐ部分などについて、資料3の図を見ていただくと冗長なところもあるように受けとめられるかもしれませんが、いろいろ工夫しております。スケーラビリティーというのは、これら回線の速度を基本は100Gbpsをベースに設計しており、それを200Gbps、300Gbpsというように増速することを比較的低コストで行えるという特徴を持たせてあることです。
技術的には、ベースのスピードを400Gbpsに上げる最新技術をいつ導入するかということがありますが、そのようなことに対しても比較的柔軟に対応できるということです。日本は細長くて、東京-大阪間に通信が集中するという非常に設計しにくい状況なのですが、今までの高速化対応のように、非常に大がかりな移行作業ではなく、柔軟に対応できる設計になっています。
次は信頼性です。信頼性プラス性能の結果として、遅延時間が非常に短くなったということを御評価頂いております。まず、信頼性は大学から一番要求されている事項であり、今回もそれに注力して設計してあります。移行直後に熊本で大きな地震が起こりまして、光ファイバーが何か所か切れたのですが、ネットワークは問題なく動いていたということであります。
以上、諸外国もベースは100Gbpsでネットワークを運用するという形になっておりまして、我が国もその速度をベースにフレキシブルに性能を強化していく、そのようなことのできるアーキテクチャーになっております。
国際回線も、特にアメリカ-ヨーロッパ間は100Gbpsを基調に研究ネットワークを作るようになっておりまして、今回我が方も100Gbpsでアメリカに接続できました。ヨーロッパに対しては、従来はアメリカ回りで接続していましたが、今回初めて20Gbpsの回線を直接ヨーロッパまでつなぐことができましたが、すぐにその帯域が満杯になりました。研究者からは、「ヨーロッパが3倍近くなった」という反応を得まして、性能的には何とか御満足頂いております。先ほどお話しましたリサーチデータがこの帯域のかなりの部分を占めているということであります。
先ほど言及がありましたとおり、南米に設置された望遠鏡につなぐ回線の先が細くてとか、いろいろと更なる整備が求められています。その中で、ヨーロッパとの回線を太くすることが日本のサイエンスのために緊急に必要、というのが今の状況です。
ネットワークより上位レベルの、クラウドの利用も徐々に広がっております。上位レベルの利用については、各国で考え方に違いがありまして、ネットワークだけをやるという国と、クラウドやオープンサイエンスまで含め、この委員会で議論していただいているようなスコープで考える国があります。例えばイギリスは後者のスコープです。ドイツなどは、上位レベルと下位レベルは分けて考えているようです。このクラウドの利用に関しましても、我が国は諸外国よりも一歩進んでいるのではないかと思います。商用クラウドとネットワークを直結し、しかも高いセキュリティで、大学のコンピューターが遠方に存在したままで使うという環境を提供することができるという点で、一歩先を言っていると思います。いずれにせよ、各国ともこの基盤については注力しておりますので、我が方としても、それを見ながら先手、先手で行きたいと考えております。以上です。
【喜連川主査】 よろしいでしょうか。10年凍結していたところを100Gbpsまでばんと上げたというところで、今安達先生から御紹介頂きましたように、相当自由度が上がりまして。増速もまだやれていないんですけれども、さすがに去年アップグレードしたばかりですので、その辺も視野に入れられるかなと。
【逸村委員】 先ほどのオープンサイエンスの話と同じなんですけれども、ネットワークを増強するイメージに関して、現在の状況と、更に数年先、学術研究をする大学であればというイメージをもうちょっと大学執行部にアドボケートというか、そういうことができないものかなと思った次第です。
【喜連川主査】 同様の問題というのは、ほかの大学さんでもあるでしょうか。京都大学はしっかりしているので大丈夫と。岡部先生大丈夫ですね。
【岡部委員】 そういう意味では、うちは学内ネットワークの利用料を取っていまして、昨年度、値上げというのを十数年ぶりにやりまして、なかなか御理解頂くのは大変でした。十数年前と違うのは、皆さん実は無線LANで使っていることの方が多くて、インフラとしての有線のLANは頑張って1Gbpsを維持しているんですけれども、末端1Gbps、バックボーンは10Gbpsでやっているんですけれども、なかなかそのコストを全学で負担していただくということに対して、コンセンサスを得るのは決して容易ではないです。もちろん、時間を掛けて説得はしておりますけれども。
【喜連川主査】 それは、SINETが100Gbpsになったからお金が掛かるんだとか、そういう理由で値上げされたわけではない?
【岡部委員】 いえ、そうではなくて、やはりどこも運営費交付金そのものが減らされている状況なので、この御時世、値上げとは何だと。あと、システムの更新についてもなかなか。
【喜連川主査】 これは、IT業界全体の悪い風潮で、全てをただにして、別のルートからお金をもうけるというビジネスモデルになってしまったもので、ネットワークは原則ほとんどただだと思っている方ばかりで、国大協に行って御説明するのはすごく大変だったという経緯がございます。
スパコンに比べれば、数十億で多くの大学をつなぐネットワークが運用できているというのは、コスト感覚からいえば、非常に効率的ではあるんですけれども、なかなか御理解を頂くのは容易ではないのが実情です。
それは、岡部先生が御参加頂いているNIIの委員会において大きなテーマになりますか。
【岡部委員】 それが、とおっしゃるのは、何がですか。
【喜連川主査】 逸村先生がおっしゃっていただいたアドボケーションをどうするか。つまり、今終わった瞬間、ゴーができた瞬間なんだけれども、次につなげるためにはもうちょっと広い意味での宣伝というか、御理解頂くようなことを積極的にする必要があるのではないかと。
【岡部委員】 そうだと思います。特にこのオープンサイエンスも含めて、ネットワークの利用の仕方そのものが変わってきているということも、皆さんに御理解頂いた方がいいかなと思います。
【喜連川主査】 はい、先生どうぞ。
【逸村委員】 更に付け加えますと、先ほど言っていた人文社会系のデジタルアーカイブが進んで、海外から結構アクセスがあります。そうすると、それまで帯域とか、そういうことは余り考えずにいた、知識がなくて済んでいた人文社会系の研究者のところにも、あんた、こんなにネットワークを使っているんだよと言うと、えっ、何の話ですか、から始まるわけです。人社系のデジタルアーカイブ等々、あるいはオープンサイエンス化を進めるとなると、当然そこら辺の問題もはっきりさせておかないと、という気はいたします。
【喜連川主査】 ちょっと人社系の風向きが悪いんですけれども、御発言を。
【逸村委員】 悪いわけではないんです、言っておかないと。
【喜連川主査】 御発言をされる先生がおられましたら、大丈夫ですか。多分御存じでないので、筑波大学さんも一定程度、クラウドにシフトされておられるわけですね。
【逸村委員】 なっています。
【喜連川主査】 ですから、アマゾンを1回でも使ったことがおありになる方は、いかにネットワーク料金が高いかというのを痛切に感じられるのだと思いますが、もうちょっと、その辺、NIIも啓蒙(けいもう)普及していきたいと思います。
ほかに何か御意見等ございますでしょうか。林先生、いかがですか。
【林上席研究官】 SINETの上にアカデミッククラウドを使ってオープンサイエンスを実現するという上で、恐らく大事な点で、それがもしかするとSINETやアカデミッククラウドの求心力になるかもしれないのは、シングルサインオン(学認)の仕掛けをうまく使うと、研究者の今後の活動ログというのが基本的にその上で見ることができる、という考えがあるかと思います。その研究データの実体物がどこに置かれるか、民間なのか、公営なのかさておき、これは実はヨーロピアンオープンサイエンスクラウドの関係者との議論に出てきた着想点なんですけれども、日本ですと、今シングルサインオンで、日本のアカデミズムはきれいにまとまって、研究者の行動のログがとれる環境に近い状況にあるともいえます。オープンサイエンスなので、研究公正の意味合いで議論すると研究者が萎縮してしまうので、研究の貢献が健全に見える方向の議論にうまく組み合わせることによって、研究評価や、その手前のインパクトアセスメントの新しい開発につなげることができるのではないかという議論があります。
ヨーロピアンオープンサイエンスクラウドは多数国からなるEU共同体の取り組みですので、日本のように統一した活動ログを取れるような状況を整えることが難しく、それをどうしたらいいのかという話から、日本は相対的にやりやすい立場にあるねというような議論になったことを御紹介させていただきます。
【喜連川主査】 それ、是非科学技術・学術政策研究所さんで先導を切ってまとめていただけると有り難いと、非常に大きいポイントですね。どういう学術需要のパターンがIT上で行われているか、そこを中心により重点投資をすべきだと、そういうことですね。
ありがとうございます。ほかに御意見はと思ったら、もう時間が過ぎているのを忘れておりました。
失礼いたしました。前半の議論がすごく盛り上がってしまいまして、後半のお時間が十分にとれずに誠に失礼いたしました。本当にオープンサイエンスに関しましては、本質的な議論をかなり深めることができたのではないかと、大変有り難く感謝を申し上げる次第です。事務局から連絡等ございましたら、お願いできますでしょうか。
【玉井学術基盤整備室参事官補佐】 はい。本日の会合の議事録については、これまでと同様、各委員に御確認頂いた上で公開をさせていただくことにしております。
また、資料7の方に次回以降の日程を記載しておりますけれども、次回は9月20日水曜日、13時から15時、場所についてはまた改めてお知らせをさせていただきたいと思います。
それと、前回以降に日程を照会させていただきました、第6回、第7回の日程についても、記載のとおり10月18日、及び12月13日と予定をさせていただいておりますので、皆様の方でも日程の確保を頂きますようにお願いしたいと思います。
【喜連川主査】 それでは、これをもちまして閉会とさせていただきます。大変ありがとうございました。
――了――
麻沼、齊藤
電話番号:03-6734-4080
ファクシミリ番号:03-6734-4077
メールアドレス:jyogaku@mext.go.jp(コピーして利用される際には全角@マークを半角@に変えて御利用ください)
-- 登録:平成29年09月 --
Copyright (C) Ministry of Education, Culture, Sports, Science and Technology