1――大学生の8割が講義中に動画を視聴した経験あり
気になって別の大学で「講義中のスマホ視聴」についてアンケートを取ってみたところ、YouTube や動画サブスクを意図的に見たり、SNSで偶然流れてきた動画を見たりと、授業とは無関係の動画をなんらか視聴した経験がある学生は、150人中122人(約8割)だった。「音がなくても楽しめるのか?」――そう疑問に思ったが、よく考えると筆者自身も日常的に、音を出さずに動画を見ていることが少なくない。その体験を可能にしているのが、画面に表示される字幕の存在だ。
電車内でも同じ光景をよく目にする。音を聞きたい場合はイヤフォンを使うものの、満員電車では装着しづらい場面も多い。都心では移動自体が短く、わざわざイヤフォンを取り出さない人も珍しくない。そもそもイヤフォンを持ち歩かない人も一定数いる。私たちの視聴環境は、もはや「音を出せない場」での利用が基本ケースになりつつある。
電車でいえば、首都圏では「トレインチャンネル」に代表される車内デジタルサイネージが普及しており、満員電車で身動きが取れなくても、モニターに流れる天気予報や雑学が退屈をまぎらわせてくれる。音声なしの情報が、日常生活の中で自然に役立っていると感じる人も多いだろう。2025年1月6日からは、JR東日本の主要10路線とゆりかもめの車内サイネージ「TRAIN TV」にてショートドラマ『いつだって究極の選択』の配信が始まり、「無音で楽しむ映像」が当たり前のモノとして成立し始めていることを象徴している。
そもそも、動画を「見よう」と思っていなくても、SNSやニュースアプリをスクロールしているうちに自然と動画が再生される。現代の隙間時間の中心はスマートフォンであり、どんなサービスを利用していても、広告・ニュースを含む短尺動画が次々と流れ込み、私たちは意識しないまま動画に接触する状況に置かれている。こうした“ながら視聴(非能動的視聴)”や“無音視聴”の環境を前提に、制作側も音声に依存しない情報設計へ舵を切っている。字幕の付与はすでに標準仕様となり、YouTubeやX(旧Twitter)では自動字幕生成が行われている。
2――各種調査から読み解く字幕視聴
2021年には、ネイティブ広告や視聴行動の研究に強みを持つ広告テクノロジー企業 Sharethrough が、モバイル動画の視聴行動に関する調査を実施している2。同調査によると、モバイル動画視聴者の75%が音声をオフにしたまま動画を視聴しており、ミレニアル世代では85%、X世代でも64%に達していた。世代差は多少あるものの、この傾向は広く見られ、「音声なしで動画を見る」行動が標準化していることを示している。Instagram、Facebook、Snapchatなどのプラットフォームで、テキスト字幕付きの動画に慣れているユーザーにとっては、テレビで字幕がない映像は、たとえ音声があっても理解しづらいと感じるケースが多いとのことだ。また、音声の有無を問わず大多数がテレビを字幕付きで視聴しており、この傾向は若年層ほど顕著で、Z世代の半数以上が常に字幕をオンにしていることが明らかになった。
こうした状況を踏まえ、同社は「動画広告に字幕がある場合とない場合で、視聴者の理解度がどう変わるのか」という点についても実験を行った。750名を対象に、同一の広告を提示したうえで、字幕の有無や見出しの有無、字幕の配置(動画内/動画下など)を変化させ、視聴後の理解度を測定した。その結果、字幕付きの動画広告は字幕なしに比べて理解度が56%向上することが明らかになった。
一方で、聴覚障害者主導の慈善団体 Stagetext の調査3によると、若者は高齢者の約4倍もの割合で字幕付きのテレビ番組を視聴していることが明らかになっている。
この調査では、若者にとって字幕は「特別な配慮」ではなく“普通の視聴方法”として受け入れられている一方、年配層では必ずしもそうではないことが示されている。高齢層は外国語作品などにおける字幕表示を、集中力を要するものと感じる傾向があるのに対し、若者は日頃から多くの情報を同時に処理するメディア環境に慣れており、字幕を読む行為も自然にこなすため負担が少ないようだ。
また、同調査では、全体の31%が「会場内に字幕があればライブやイベントにもっと行く」と回答している。この割合は18~25歳では45%に達する一方、56歳以上では16%にとどまった。コロナ禍でオンライン化したイベントでも同様の傾向が見られ、若年層は「字幕があることで内容を理解しやすかった」と回答する割合が高いのに対し、高齢層では「字幕はむしろ邪魔だった」との回答が多かった。こうした結果から、字幕は、もはや「聴覚障害者のための補助機能」にとどまらず、理解の促進や集中の補助として幅広い層に利用される視聴習慣として定着していることが分かる。
日本では、産経新聞グループの産経リサーチ&データが18歳以上の男女2,466人を対象に、字幕付き番組の利用状況やテレビ視聴行動に関する調査を実施している4。調査の結果、普段から字幕付き番組を視聴している人は全体の29.6%にのぼった。当然 80代以上では45.3% と高くなるが、すべての年代で25%以上が字幕番組を見ていることが判明した。こうした結果から、字幕放送は高齢者や聴覚障害者に限られたものではなく、すでに全年代で広く定着した視聴スタイルであることが示されている。
コメント欄では視聴中のミュージックビデオの歌詞が貼られたり、かつての匿名掲示板のように議論や口論が交わされることも多く、視聴者は動画をフックに、他者の反応や意見を“読む”ことも含めて視聴体験を楽しんでいる。その意味で、動画はコンテンツというより、視聴者同士がつながるための“場”として機能し、コメント欄は一種のSNSのように活用されている。共感やツッコミ、情報交換といった文字ベースのやり取り=読むこと が視聴体験に組み込まれている点は、現代の動画消費を象徴する特徴と言える。
1 Sahil Patel 85 percent of Facebook video is watched without sound DIGIDAY May 17, 2016 https://digiday.com/media/silent-world-facebook-video/
2 Sharethrough 75% of people watch mobile videos on mute: What that means for advertisers DIGIDAY June 9, 2021 https://digiday.com/sponsored/75-percent-of-people-watch-mobile-videos-on-mute/
3 Ian Youngs Young viewers prefer TV subtitles, research suggests BBC 15 November 2021 https://www.bbc.com/news/entertainment-arts-59259964
4 株式会社産業経済新聞社「テレビ放送開始70年、クイズ&アンケート実施 全年代、4人に1人は字幕利用 dボタンの利用状況など、2466人が回答」2023年1月31日 https://prtimes.jp/main/html/rd/p/000001363.000022608.html
5 ナイル株式会社「YouTubeビジネス動画に関するアンケート調査|2023年10月実施」 2023年10月24日 https://www.seohacks.net/column/20521/
6 株式会社ヴァリューズ「【調査リリース】YouTube・YouTubeショート・TikTok利用実態 TikTokの利用率は約4割 YouTubeは学び、TikTokはトレンドがキーワード」2024年3月13日 https://prtimes.jp/main/html/rd/p/000000186.000007396.html
3――動画視聴は「気づかれずにできる行為」へ
- 69%が公共の場で音声オフのまま動画を視聴
- 25%は自宅などのプライベート空間でも音声を消して視聴
- 80%が「字幕があれば動画を最後まで見る可能性が高まる」と回答
- 50%が字幕を重要視。その理由の多くが「音声を消して動画を見ることが多いから」
字幕が動画理解において補助的な役割を果たすことは確かである。しかし筆者は、この調査からもわかる通り、それ以上に、字幕があることで“本来なら動画視聴が難しい場面”でも迷惑をかけずに視聴できるようになった点が、現代の消費文化に大きな影響を与えていると考えている。教室、満員電車、静かなカフェ――従来であれば動画視聴がはばかられる環境でも、音を出さずに字幕だけで内容が理解できるため、視聴は「気づかれずにできる行為」へと変わったのである。
筆者が学生だった2010年頃、大学の講義中に暇をつぶす方法といえば、携帯やスマホ、携帯ゲームを操作するか、他の講義のレポートや課題を進める内職くらいしかなかった。特に授業中のスマホ利用は厳しく注意され、教室から追い出される学生も珍しくなかった。当時は携帯電話とスマートフォンの利用が半々で、“ギガが減る”こと=通信量 が死活問題であり、現在のようにフリーWi-Fi環境が整っていたわけでもない。結果として、講義中に動画を視聴する学生はほとんどおらず、暇つぶしにはスマホを物理的に操作する必要があった。
しかし、いまや状況は一変した。動画視聴や重いオンラインゲーム利用を前提に通信量が設計され、使い放題プランも一般化した。フリーWi-Fiを備える大学施設も増え、多くの教室では電源プラグまで完備されている。こうした環境の変化により、学生は筆箱やペットボトル、タンブラーなどにスマートフォンを立てかけ、YouTube や Netflix を再生しながら、画面を眺めているだけで暇をつぶせるようになった。スマホに触れていないため視聴行為が目立ちづらく、周囲からは講義に参加しているようにも見える。その結果、注意されることもなく動画を消費できる、“気づかれない視聴スタイル”が形成されているのである。
7 TJ McCue Verizon Media Says 69 Percent Of Consumers Watching Video With Sound Off Forbes Jul 31, 2019, https://www.forbes.com/sites/tjmccue/2019/07/31/verizon-media-says-69-percent-of-consumers-watching-video-with-sound-off/?sh=2bef0d9335d8
4――動画は文字で理解する情報パッケージ
また、倍速視聴でも内容を追いやすい、映像やテロップだけでは拾いきれない情報を補えるといった利便性の指摘も多い。さらに、静かな場所で音を出さずに必要な情報だけを得られることや、手持無沙汰な状況でも“バレずに”視聴できるといった環境面の理由も示された。これらを整理すると、字幕が選ばれる理由は大きく(1)理解の補助、(2)利便性、(3)環境への配慮 の三つに分類できる。
字幕の需要が高まっている背景には、動画そのものの位置づけが変化してきたことも挙げられる。動画はかつてのように、自分から見ようと決めて再生する“能動的なコンテンツ”ではなく、スクロール中に自然と目に入る“環境の一部”になった。意図せず遭遇する動画が増える一方で、私たちの生活空間には音を出せない場面が多い。結果として、視聴者は音声ではなく、映像を“読む”ようにして情報を受け取る行動が一般化しているのだ。それゆえに、PowerPointのスライドショーのように静止画像が切り替わるだけのシンプルな構成や、画面の大半がテキストで占められるコンテンツが人気を得ているのはその象徴である。無音の中でも情報量が多いほど評価されるという現象は、動画が音や映像で理解するメディアから、むしろ 文字で理解する情報パッケージへ変容していることを意味している。そして、この「読む動画」が普及した結果、視聴態度そのものにも大きな影響が生じている。つまり、倍速視聴や、ながら視聴といったタイパ志向の行動が広がり、視聴者は短時間で効率的に情報を処理しようとする一方で、特に目的もなく隙間時間を埋めるために動画を眺め続けるという、二つの相反した行動が同時に進行している。興味深いのは、多くの視聴者が「情報が多すぎて疲れる」と感じながらも、同時に「必要のない動画を無意識に消費してしまう」という矛盾した状況に陥っている点である。これは、視聴の主体が完全に能動的とは言えず、発信側に動画を消費させられる力が強く働いていることを示している。
また、この視聴スタイルが視聴者だけでなく、コンテンツの供給側の行動をも変えてしまうという点が懸念される。視聴者が「早く」「静かに」「ながらで」「文字で理解できる」コンテンツを求めるようになると、クリエイターはその需要に合わせて、情報を素早く提示できるフォーマットに寄せざるを得なくなる。彼らも視聴回数を稼ぎたいからだ。結果として、丁寧に作り込まれた表現よりも、瞬時に意味が読み取れる“即席型コンテンツ”が量産されやすくなる。
現代の動画視聴は、脳の報酬系に直接働きかける“即時理解型”のコンテンツが主流になっている。報酬系とは、脳内にある神経回路のシステムで、快感や喜びを感じさせ、「もっとやりたい」「もっとほしい」といった意欲(モチベーション)を生み出す仕組みである。たとえばスマホを使うとき、私たちは「何か楽しいことが見つかるかも」と期待して画面を見続けてしまう。これは“報酬”を得られる可能性を脳が予測しているからだ。スマホ依存として議論される現象も、この報酬系が関係している。惰性的にSNSを眺め続けたり、ゲームをやめられなかったりするのは、脳が報酬の再来を期待しているためである。たまたま見た動画が面白かった、何気なくやったゲームで高スコアが出た、投稿がバズった——こうした“偶然の成功体験”がドーパミンを放出させ、強い快感(期待感)をもたらす。ドーパミンは「快感」や「やる気」に関わる神経伝達物質であり、報酬を得たときやその予兆を感じたときに分泌される。これが脳を「またやりたい」と学習させ、やがて“やみつき”や“中毒”を生み出すのだ。
視覚と聴覚を同時に刺激し、短時間で内容を把握できる動画ほど、ユーザーは手軽にドーパミンを得られる8。そのため視聴者は、複雑な思考を必要とせず、短い時間で満足できるタイパの良さを無意識に求めるようになっている。
この流れの中で、最近特に顕著なのが字幕付き動画だ。音声を再生しなくても、字幕を読むだけで内容が理解できるため、移動中や学校・職場など音を出せない環境でも“即座に理解できる”。つまり、「耳を使わず、読むだけで情報が入る → 理解が早い → 報酬(ドーパミン)が得られる」という、視聴の効率性がさらに最適化されているのだ。
また、近年では、自動生成されたAIボイスを使った動画も増えているが、これらの音声はイントネーションが不自然だったり、感情の抑揚が乏しかったりして、聞き取りにくさを感じるユーザーも少なくない。そのため視聴体験において音声を主役にする必要がなくなり、多くのユーザーが最初から音声を無視して字幕だけで内容を理解しようとする行動が一般化している。こうした状況では、動画を「読むもの」として捉える視聴習慣が強まり、聴覚より視覚を優先する傾向が加速している。
8 近年のショート動画は、1本あたり数秒から1分弱と非常に短く、興味を引かなければ指をひと振りするだけで次の動画へ移れてしまう。この“切り替えの軽さ”が、視聴者に「あと1つくらいなら…」という終わりのない視聴行動を生み出す大きな要因となっている。さらに、フィードに並ぶ動画はアルゴリズムによって選ばれ、次に何が現れるかは誰にも読めない。たとえば、まったく関心のないPR動画の直後に、思わず笑ってしまう動物のクリップが流れることもあれば、日常のゆるい映像のあとに、思わず見入ってしまう実験映像が登場することもある。この「予測できない当たりくじ」が時折混ざる構造こそ、脳の報酬系を刺激し、次の動画を求めてしまう要因になっている。
さらに多くのショート動画は、視聴者の注意を最初の数秒でつかむために徹底的に工夫されている。「この先で思わぬ展開が…」と期待をあおる導入や、冒頭から強烈なビジュアルを置くことで、“続きを見ずにスワイプするのは惜しい”という心理状態を作り出している。こうした仕掛けが積み重なり、「次はもっと面白いかもしれない」という期待が強まり、結果的にドーパミンの分泌を促す設計になっている。字幕はその導入の効果をより強める役割も持っている。画面を開いた瞬間に文字情報が飛び込んでくることで、脳が「内容が入りやすい」と錯覚し、視聴のハードルが下がる。これもまた、ドーパミン的な報酬を早く得られる構造といえるかもしれない。
5――“バレない視聴”を生む報酬の非対称
結局のところ、スマホ依存の背景には、刺激の強さそのものよりも「報酬までの速さ」の差がある。スマホは即座に満足を与えるが、講義は結果を得るまでに時間がかかる。このギャップこそ、多くの学生が目の前の学習よりもスマホを選んでしまう理由だと言える。
しかし、つまらない講義はどうしてもつまらないし、残念ながら皆が皆学ぶために大学に通っているわけではないのが現実だ。それに加えて、手のひらにはいくらでも時間を潰す手段がある。それでもそれを使用して怒られたくないし、評価も落としたくない。その板挟みの中で、“バレずに動画を見る”という行動は、ある種、今の環境が生み出した避けようのない選択肢なのかもしれない。