Entries


これが最強のラノベタイトルだ!

今年出たライトノベルのタイトルを全部取得して、形態素解析し、最もウケそうなタイトルを自動で作らせてみた。

2014年のライトノベル全タイトル


手始めに、今年出たライトノベルの全タイトルを取得しよう。
そのために使えるのがAmazonが提供する『Product Advertising API』だ。

これはAmazonの商品情報を取得できるwebサービスで、登録すると使えるようになる。
というわけで早速面倒くさい登録作業をして、適当にプログラム書いて動かしてみると――
カチャカチャカチャ…ッターン! どやあっ!?

……100個しか結果とれねーし。

その100個の中にはKindle本が混ざっていて、それを取り除くと有効なデータは半分くらいしかないのだ。
検索する時にKindle本を省くオプションはない(多分)。

うぉいっ、ジェフ! 使えねーだろ!

*元々、そういう風に使うAPIではない
*ジェフ:Amazon創設者のジェフ・ベゾス


Amazonが駄目なら、楽天を使えばいいじゃない


Amazonは駄目だったが、楽天も書籍検索APIを提供していることが分かった。
それなら、楽天を使えばいいじゃない。よし、早速――

「アプリの登録にはログインまたは楽天会員登録が必要です。」

あー……。
楽天に登録することだけは避けたい。
なぜなら、覚えのないメールマガジンが届きすぎるからである。

く…ここまでか……

諦めようと思ったが、調べてみると、楽天の書籍検索APIをテストできるページがあった。
これだー!

 楽天ウェブサービス(RAKUTEN WEBSERVICE) : APIテストフォーム

楽天の書籍検索APIは1回で30個のデータを、100ページまで取得できる。
やった。これで今年のデータは楽勝で取れる。

さらに、ライトノベルレーベルを絞って検索でき、出力結果も細かく制御できるのだ。
おー優れものじゃないか!

ほんとは登録して、適当なサーバーで動かせばいいのだろうけど、そこまでしたくない。
ちゃっちゃっと検索すればすぐ終わる。

――で、終わった。


2014年のラノベタイトル数


主要レーベルだけ取ってみたところ、今年のタイトル数は以下のとおり。
(MF文庫は楽天側のデータがおかしいのか、取得できなかった)

順位レーベル冊数
1電撃文庫176
2富士見ファンタジア文庫149
3ファミ通文庫89
4角川スニーカー文庫80
5講談社ラノベ文庫78
6GA文庫76
7ガガガ文庫68
8HJ文庫60
9スーパーダッシュ文庫47
10このライトノベルがすごい!文庫16
 合計839

このラノはデータ間違いかと思ったけど、公式サイト見たらこのくらいだった。
大丈夫なの、このラノは。


MF文庫はおそらく電撃や富士見と同じくらいは出しているだろう。150冊程度と仮定。
メディアワークス文庫は月に5〜6冊の印象だから、年間70冊程度。
他にも新興レーベルがある。3つの新興レーベルが年間30冊くらい出したとすると

今年出たラノベの総タイトル数は、およそ

 1200タイトル

である。
毎月100冊。実感もこのくらいだと思う。


全タイトルリストはテキスト形式で置いておく(ShiftJIS+CRLF)。
2014年ライトノベル全タイトルリスト


次は分析だ


形態素解析も含めて、ざっくりと集計、分析してみよう。
形態素解析とは、日本語の文章を品詞に分解する作業のことである。

分解はすぐ出来るのだけど、きちんと評価するのは難しいので、簡易的に以下の三点だけ考えた。

1.名詞、動詞、形容詞の抽出
2.漢字とひらがな、カタカナの割合
3.タイトルの長さの平均


これらにより、

・ウケそうな語句
・どの程度くだけてもいいか
・タイトルの適切な長さ


が分かる。


分析ゴー!


適当にプログラム書いて
カチャカチャカチャ…ッターン!

ガガーピーピー、ガガー……
ピコーン。
ブンセキケッカ、ガ、デマシタ。

よろしい。表示せよ!


まずはタイトル長さから


タイトルの長さをレーベルごとに調べた結果は以下のとおり。

レーベル平均長偏差
電撃文庫115
富士見ファンタジア文庫115
ファミ通文庫103
角川スニーカー文庫128
講談社ラノベ文庫127
GA文庫126
ガガガ文庫104
HJ文庫114
スーパーダッシュ文庫115
このライトノベルがすごい!文庫126
全レーベル115

ふーむ、なるほど。
そんなものか。

全タイトルの平均長さは、11文字。
標準偏差は、5文字。
ここから導かれる結論は以下のとおり。

ライトノベルのタイトルは

 11文字ぐらいがいい

また、

 全タイトルの70%が、6文字〜16文字である

ことも分かった(1標準偏差で7割カバーできるため)。


続いて、漢字/ひらがな/カタカナの割合を分析せよ!


漢字、ひらがな、カタカナの割合は


早速、タイトルにおける文字の割合を見てみよう。
結果は以下のとおり。

レーベル漢字%ひらがな%カタカナ%英数%
電撃文庫3824345
富士見ファンタジア文庫4124277
ファミ通文庫3921382
角川スニーカー文庫4631194
講談社ラノベ文庫3424393
GA文庫4028275
ガガガ文庫3930302
HJ文庫5522203
スーパーダッシュ文庫3022408
このライトノベルがすごい!文庫3622349
全レーベル4025305

ほう。
カタカナの方が多いのか。
上の分析結果と合わせると、ラノベのタイトルは

 漢字4文字+ひらがな3文字+カタカナ3文字+1文字

くらいが平均的である。


次が今回もっとも知りたい分析。
よく使われる語句を集計せよ!


よく使われる語句はずばりこれだ!


使用頻度の高い語句は以下のとおり。

順位語句使用数
1世界39
235
329
428
528
6魔王27
727
8ない26
9これ26
1025


おー、なるほど!
これは、かなり納得できる結果ではないだろうか。
10位までを見ただけでも、異世界、魔王、姫、神、といった最近の傾向が伺える。

分析結果はテキスト形式でここに置いておく(ShiftJIS+CRLF)。
使用語句リスト


最強のラノベタイトルを作成せよ!


ここまでの分析でさまざまなことが分かった。
これらを組み合わせ、最強のラノベタイトルを作成するプログラムを書いてみよう。

といっても、意味が通るタイトルにするところまでは無理なので、候補となる語句を抜き出すだけにする。後で自分で整えればいい。


条件はこんなところ:

・タイトルの文字数は、11文字から増減5文字
・漢字は、最大6文字
・使用数10以上の語句を1つか2つ必ず入れる
・語句の使用数の合計が、80を越える


これには助詞、助動詞なども含めたリストを使った。その方が自然になると思う。


では20個ほど出してみよう。数値は語句の使用数の合計値になる。
出ませいっ!

タイトル候補使用数合計
武者ツンデレノ150
記メソッドガルミロワール憂鬱138
魔法能殺し隠遁ニートアオイ121
作家殺急募GD×115
アンコール系幼なじみ姉妹再オ103
召喚戦腐っOGA呼ばが102
刃聖オタクもの94
量子勇者ワールドする抜け90
魔法異弓セツナトリ88
主です殺デイズメ88
葬生き返る流星藤スカイやがて81
未来ハンター求める金色81
たち女難方々翼師ヒロ81
叛逆日本なりなる版Iアポカリ81
日常スカイ肉食滅っ年ハートブレイ80
オンライン隠遁女の子なかあの再80
殺し妹四天王グランブラッ80
協会勇者のに妹ラノ80
亡きオタク外伝は80
そう転生妹外伝春80


わはははっ!
けっこう面白いし、それっぽい。

これらを適当に整えれば、最強のラノベタイトルの出来上がりだ!


ぼくのかんがえたさいきょうのラノベタイトル


最強のラノベタイトルはこれだ!

武者ツンデレ!
メソッドガール・ミロワールの憂鬱
魔法殺し隠遁ニート・葵
アンコール系幼なじみ姉妹ふたたび
召喚したら腐ったオーガだった件
オタク刃聖
量子勇者はすり抜ける
叛逆日本アポカリプス
隠遁女子オンライン〜女の子のなか〜
勇者協会の方から来ました、妹です。


わははは!
誰かこのタイトルで書いてくれないかな。




プログラム言語の勉強がてら、タイトルの分析をしてみた。
分析というほどではないけれど。

多分、キーワードのリストを作っておくのはけっこう役に立つと思う。
アイデア出しにも使えるし、意外なタイトルを考えるのにも使える。


楽天のブック検索apiは、主要レーベルごとに3000件取れるので、年間150冊程度だとすれば20年分は取れる。やはり登録した方がいいかも知れない。

……と思ったのだけど、そういえば国会図書館があった、と思って調べたらやっぱり利用できた。
もっと詳しく検索できそう。
とは言え、登録はけっこう面倒くさそうではある。

他にもいろいろあるらしい。
Amazonのapiの使い方も分かったし、勉強になった。



関連タグの記事
この記事にトラックバックする(FC2ブログユーザー)
http://otsun.blog46.fc2.com/tb.php/985-36e0d325

トラックバック

コメント

[C1546]

これはひどい、もとい、面白いw

前に仰ってたアレですねw

そしてこの単語リスト、「あるある」ってなりますね。
これ自体がネタになるほどにw
とりあえず世界で魔王で聖なるで魔がどうでと。

語句の使用数合計は、一覧に使われた合計、という事だとは思いますが。

これに関してはジャンルとの相互作用も考えてみるともう一段突っ込めるのかもしれませんw
異能系だとどうなのか、日常系はどうなのか、と。

武者ツンデレノはそのまま読んでみてもいいかもしれない!w

ツンデレノ……なに? みたいな感じでw

まあ、一番笑ったのはセツナトリですけれどw
たぶんこれ、五感だけで成立してるあれですよね。

オーウェル経由系ジョーク的なw

普通に読みたいのは殺し妹四天王ですけどw

考えてみれば、「魔法異弓」とかは「作品内ガジェットのタイトル化」ですし、それに続く「セツナトリ」は、作品内の固有名詞、と見ることが出来て、こういうパターンはたしかに多いです。
特に多いのが富士見ですけど、電撃でも未だに散見するタイプで。

>ぼくのかんがえたさいきょうのラノベタイトル

量子勇者、いける!w

いや、これはマジでメタ勇者モノになると思いますw
タンス開けちゃう系勇者とか、なぜか物語に都合の良い状態以外をスルーされちゃう特徴とかでもw
トンネル効果系異能力者で、選択の度に世界が収縮する=都合の悪い選択を「すり抜けている」勇者とかでもいいですねw

反逆日本アポカリプス→間違いなく至道流星

ギアスを至道流星作品にしたらこうなるんじゃないでしょうか(いや、元々パロディやってますがw)。

勇者協会・妹→不条理系のあれ。

これもいいですw
一覧の中でのタイトルでは一番目に止まりますね。
「なんで妹?」ってなるので、ネタ系としてはこの中で最上のインパクト率があるかと。

勇者と妹の相関性を導いていく作品かもw

で、まあ。

色々こう見てみると、リスト抽出系のこうしたタイトルは、タイトルを先に考えてネタを逆算する類いの、2ch的なアイディアに近いものがありますね。
まおゆうなんかも元々はそっち系になりますし。

もちろん、それだけにいかんせん手垢の付いたネーミングになりがちですし、文字数の制約上ネタ系の長文タイトルになりがちではあるかもです。
それに関しては読本なんかでも「気を付けるべし」としてましたけど、これはこれで見るべきものがありますしね。

タイトルリストというのは、「極端に影響されない」なら、或いは、「ネタから先に考える」には、かなり面白いメソッドなんだなあと。

よく「キャラクター名作成マクロ」みたいなのは見掛けますけど、こういうのはなかっただけに、公開されてたら使う人は多そうです。
中二二つ名抽出マクロみたいなのと違って、使うのは創作者になってくると思いますがw

反面、こうした「タイトルを先に」という思考は、恐らくテーマや内容が既にかっちりと決まっていたり、指針が定まっている人には枷にもなってしまうのではないんだろうか、という、割と素朴な疑問だったりしましたw
  • 2014-12-17 20:43
  • 通りすがり
  • URL
  • 編集

[C1548] Re: タイトルなし

> タイトルリストというのは、「極端に影響されない」なら、或いは、「ネタから先に考える」には、かなり面白いメソッドなんだなあと。

面白がっていただいてようで良かったです。
アイデア出しのための一要素みたいなものでしょうね。
意外な組み合わせを考えるには使える方法だと思います。


> よく「キャラクター名作成マクロ」みたいなのは見掛けますけど、こういうのはなかっただけに、公開されてたら使う人は多そうです。

すこし統計的な手法について調べていたのですが、テキストの特徴量なんかも取れるので、あらすじなんかを解析して保存しておけば、自分が好きなラノベと似たラノベはどれか、みたいなことも計算できるようです。
ちょっと面白そうだなと思っています。


> 反面、こうした「タイトルを先に」という思考は、恐らくテーマや内容が既にかっちりと決まっていたり、指針が定まっている人には枷にもなってしまうのではないんだろうか、という、割と素朴な疑問だったりしましたw

そうですね。
逆に、書いた原稿を分析して、頻出単語や頻出表現を出せば、それらをタイトルに使えるかも知れませんね。

一般的にいって自由すぎると動けませんから、全然書けない人の場合、キーワードなどの制約条件があった方が書き出せるのかなとも思いました。

あるいは、もう内容が決まっている人でも、キーワードなんかを無茶ぶりされた方が、突拍子もないものが書けるかも知れませんね、はは。
なかなか自分の思考の範疇を越えることは出来ませんし。


コメントの投稿

コメントの投稿
管理者にだけ表示を許可する

Appendix

プロフィール

otsun
Author:otsun
2008年春から書き始めました。
最新記事のRSS

過去ログ


進捗

・アイデア出し

読んでいる

  • 走ることについて語るときに僕の語ること 村上春樹
  • スキュラ&カリュブディス 相沢沙呼
  • イラストで学ぶ人工知能概論 谷口忠大
  • 初めてのPython MarkLutz
  • 東大現代文で思考力を鍛える 出口汪
  • 14歳からの哲学 池田晶子
  • 難関入試算数速攻術 中川塁

今日の一枚

12/27 久しぶりの美術館。通路にガラス製のオブジェが置いてあった。

タグ