これが最強のラノベタイトルだ! 今年出たライトノベルのタイトルを全部取得して、形態素解析し、最もウケそうなタイトルを自動で作らせてみた。
2014年のライトノベル全タイトル
手始めに、
今年出たライトノベルの全タイトルを取得しよう。
そのために使えるのがAmazonが提供する
『Product Advertising API』だ。
これはAmazonの商品情報を取得できるwebサービスで、登録すると使えるようになる。
というわけで早速面倒くさい登録作業をして、適当にプログラム書いて動かしてみると――
カチャカチャカチャ…ッターン! どやあっ!?
……100個しか結果とれねーし。 その100個の中にはKindle本が混ざっていて、それを取り除くと有効なデータは半分くらいしかないのだ。
検索する時にKindle本を省くオプションはない(多分)。
うぉいっ、ジェフ! 使えねーだろ! *元々、そういう風に使うAPIではない
*ジェフ:Amazon創設者のジェフ・ベゾス
Amazonが駄目なら、楽天を使えばいいじゃない
Amazonは駄目だったが、
楽天も書籍検索APIを提供していることが分かった。
それなら、楽天を使えばいいじゃない。よし、早速――
「アプリの登録にはログインまたは楽天会員登録が必要です。」
あー……。
楽天に登録することだけは避けたい。
なぜなら、
覚えのないメールマガジンが届きすぎるからである。
く…ここまでか……
諦めようと思ったが、調べてみると、楽天の
書籍検索APIをテストできるページがあった。
これだー!
楽天ウェブサービス(RAKUTEN WEBSERVICE) : APIテストフォーム 楽天の書籍検索APIは1回で
30個のデータを、100ページまで取得できる。
やった。これで今年のデータは楽勝で取れる。
さらに、ライトノベルレーベルを絞って検索でき、出力結果も細かく制御できるのだ。
おー優れものじゃないか!
ほんとは登録して、適当なサーバーで動かせばいいのだろうけど、そこまでしたくない。
ちゃっちゃっと検索すればすぐ終わる。
――で、終わった。
2014年のラノベタイトル数
主要レーベルだけ取ってみたところ、今年のタイトル数は以下のとおり。
(MF文庫は楽天側のデータがおかしいのか、取得できなかった)
| 順位 | レーベル | 冊数 |
|---|
| 1 | 電撃文庫 | 176 |
| 2 | 富士見ファンタジア文庫 | 149 |
| 3 | ファミ通文庫 | 89 |
| 4 | 角川スニーカー文庫 | 80 |
| 5 | 講談社ラノベ文庫 | 78 |
| 6 | GA文庫 | 76 |
| 7 | ガガガ文庫 | 68 |
| 8 | HJ文庫 | 60 |
| 9 | スーパーダッシュ文庫 | 47 |
| 10 | このライトノベルがすごい!文庫 | 16 |
| | 合計 | 839 |
このラノはデータ間違いかと思ったけど、公式サイト見たらこのくらいだった。
大丈夫なの、このラノは。
MF文庫はおそらく電撃や富士見と同じくらいは出しているだろう。150冊程度と仮定。
メディアワークス文庫は月に5〜6冊の印象だから、年間70冊程度。
他にも新興レーベルがある。3つの新興レーベルが年間30冊くらい出したとすると
今年出たラノベの総タイトル数は、およそ
1200タイトル である。
毎月100冊。実感もこのくらいだと思う。
全タイトルリストはテキスト形式で置いておく(ShiftJIS+CRLF)。
⇒
2014年ライトノベル全タイトルリスト 次は分析だ
形態素解析も含めて、ざっくりと集計、分析してみよう。
形態素解析とは、日本語の文章を品詞に分解する作業のことである。
分解はすぐ出来るのだけど、きちんと評価するのは難しいので、簡易的に以下の三点だけ考えた。
1.名詞、動詞、形容詞の抽出
2.漢字とひらがな、カタカナの割合
3.タイトルの長さの平均 これらにより、
・ウケそうな語句
・どの程度くだけてもいいか
・タイトルの適切な長さ が分かる。
分析ゴー!
適当にプログラム書いて
カチャカチャカチャ…ッターン!
ガガーピーピー、ガガー……
ピコーン。
ブンセキケッカ、ガ、デマシタ。 よろしい。表示せよ!
まずはタイトル長さから
タイトルの長さをレーベルごとに調べた結果は以下のとおり。
| レーベル | 平均長 | 偏差 |
|---|
| 電撃文庫 | 11 | 5 |
| 富士見ファンタジア文庫 | 11 | 5 |
| ファミ通文庫 | 10 | 3 |
| 角川スニーカー文庫 | 12 | 8 |
| 講談社ラノベ文庫 | 12 | 7 |
| GA文庫 | 12 | 6 |
| ガガガ文庫 | 10 | 4 |
| HJ文庫 | 11 | 4 |
| スーパーダッシュ文庫 | 11 | 5 |
| このライトノベルがすごい!文庫 | 12 | 6 |
| 全レーベル | 11 | 5 |
ふーむ、なるほど。
そんなものか。
全タイトルの平均長さは、
11文字。 標準偏差は、
5文字。 ここから導かれる結論は以下のとおり。
ライトノベルのタイトルは
11文字ぐらいがいい また、
全タイトルの70%が、6文字〜16文字である ことも分かった(1標準偏差で7割カバーできるため)。
続いて、
漢字/ひらがな/カタカナの割合を分析せよ! 漢字、ひらがな、カタカナの割合は
早速、
タイトルにおける文字の割合を見てみよう。
結果は以下のとおり。
| レーベル | 漢字% | ひらがな% | カタカナ% | 英数% |
|---|
| 電撃文庫 | 38 | 24 | 34 | 5 |
| 富士見ファンタジア文庫 | 41 | 24 | 27 | 7 |
| ファミ通文庫 | 39 | 21 | 38 | 2 |
| 角川スニーカー文庫 | 46 | 31 | 19 | 4 |
| 講談社ラノベ文庫 | 34 | 24 | 39 | 3 |
| GA文庫 | 40 | 28 | 27 | 5 |
| ガガガ文庫 | 39 | 30 | 30 | 2 |
| HJ文庫 | 55 | 22 | 20 | 3 |
| スーパーダッシュ文庫 | 30 | 22 | 40 | 8 |
| このライトノベルがすごい!文庫 | 36 | 22 | 34 | 9 |
| 全レーベル | 40 | 25 | 30 | 5 |
ほう。
カタカナの方が多いのか。
上の分析結果と合わせると、ラノベのタイトルは
漢字4文字+ひらがな3文字+カタカナ3文字+1文字 くらいが平均的である。
次が今回もっとも知りたい分析。
よく使われる語句を集計せよ! よく使われる語句はずばりこれだ!
使用頻度の高い語句は以下のとおり。
| 順位 | 語句 | 使用数 |
|---|
| 1 | 世界 | 39 |
| 2 | 俺 | 35 |
| 3 | 姫 | 29 |
| 4 | 神 | 28 |
| 5 | 者 | 28 |
| 6 | 魔王 | 27 |
| 7 | 魔 | 27 |
| 8 | ない | 26 |
| 9 | これ | 26 |
| 10 | 異 | 25 |
おー、なるほど!
これは、かなり納得できる結果ではないだろうか。
10位までを見ただけでも、
異世界、魔王、姫、神、といった最近の傾向が伺える。
分析結果はテキスト形式でここに置いておく(ShiftJIS+CRLF)。
⇒
使用語句リスト 最強のラノベタイトルを作成せよ!
ここまでの分析でさまざまなことが分かった。
これらを組み合わせ、
最強のラノベタイトルを作成するプログラムを書いてみよう。
といっても、意味が通るタイトルにするところまでは無理なので、候補となる語句を抜き出すだけにする。後で自分で整えればいい。
条件はこんなところ:
・タイトルの文字数は、11文字から増減5文字
・漢字は、最大6文字
・使用数10以上の語句を1つか2つ必ず入れる
・語句の使用数の合計が、80を越える これには助詞、助動詞なども含めたリストを使った。その方が自然になると思う。
では20個ほど出してみよう。数値は語句の使用数の合計値になる。
出ませいっ!
| タイトル候補 | 使用数合計 |
|---|
| 武者ツンデレノ | 150 |
| 記メソッドガルミロワール憂鬱 | 138 |
| 魔法能殺し隠遁ニートアオイ | 121 |
| 作家殺急募GD× | 115 |
| アンコール系幼なじみ姉妹再オ | 103 |
| 召喚戦腐っOGA呼ばが | 102 |
| 刃聖オタクもの | 94 |
| 量子勇者ワールドする抜け | 90 |
| 魔法異弓セツナトリ | 88 |
| 主です殺デイズメ | 88 |
| 葬生き返る流星藤スカイやがて | 81 |
| 未来ハンター求める金色 | 81 |
| たち女難方々翼師ヒロ | 81 |
| 叛逆日本なりなる版Iアポカリ | 81 |
| 日常スカイ肉食滅っ年ハートブレイ | 80 |
| オンライン隠遁女の子なかあの再 | 80 |
| 殺し妹四天王グランブラッ | 80 |
| 協会勇者のに妹ラノ | 80 |
| 亡きオタク外伝は | 80 |
| そう転生妹外伝春 | 80 |
わはははっ!
けっこう面白いし、それっぽい。
これらを適当に整えれば、最強のラノベタイトルの出来上がりだ!
ぼくのかんがえたさいきょうのラノベタイトル
最強のラノベタイトルはこれだ!
武者ツンデレ!
メソッドガール・ミロワールの憂鬱
魔法殺し隠遁ニート・葵
アンコール系幼なじみ姉妹ふたたび
召喚したら腐ったオーガだった件
オタク刃聖
量子勇者はすり抜ける
叛逆日本アポカリプス
隠遁女子オンライン〜女の子のなか〜
勇者協会の方から来ました、妹です。 わははは!
誰かこのタイトルで書いてくれないかな。
プログラム言語の勉強がてら、タイトルの分析をしてみた。
分析というほどではないけれど。
多分、キーワードのリストを作っておくのはけっこう役に立つと思う。
アイデア出しにも使えるし、意外なタイトルを考えるのにも使える。
楽天のブック検索apiは、主要レーベルごとに3000件取れるので、年間150冊程度だとすれば20年分は取れる。やはり登録した方がいいかも知れない。
……と思ったのだけど、そういえば国会図書館があった、と思って調べたらやっぱり利用できた。
もっと詳しく検索できそう。
とは言え、登録はけっこう面倒くさそうではある。
他にもいろいろあるらしい。
Amazonのapiの使い方も分かったし、勉強になった。
関連タグの記事 br>
前に仰ってたアレですねw
そしてこの単語リスト、「あるある」ってなりますね。
これ自体がネタになるほどにw
とりあえず世界で魔王で聖なるで魔がどうでと。
語句の使用数合計は、一覧に使われた合計、という事だとは思いますが。
これに関してはジャンルとの相互作用も考えてみるともう一段突っ込めるのかもしれませんw
異能系だとどうなのか、日常系はどうなのか、と。
武者ツンデレノはそのまま読んでみてもいいかもしれない!w
ツンデレノ……なに? みたいな感じでw
まあ、一番笑ったのはセツナトリですけれどw
たぶんこれ、五感だけで成立してるあれですよね。
オーウェル経由系ジョーク的なw
普通に読みたいのは殺し妹四天王ですけどw
考えてみれば、「魔法異弓」とかは「作品内ガジェットのタイトル化」ですし、それに続く「セツナトリ」は、作品内の固有名詞、と見ることが出来て、こういうパターンはたしかに多いです。
特に多いのが富士見ですけど、電撃でも未だに散見するタイプで。
>ぼくのかんがえたさいきょうのラノベタイトル
量子勇者、いける!w
いや、これはマジでメタ勇者モノになると思いますw
タンス開けちゃう系勇者とか、なぜか物語に都合の良い状態以外をスルーされちゃう特徴とかでもw
トンネル効果系異能力者で、選択の度に世界が収縮する=都合の悪い選択を「すり抜けている」勇者とかでもいいですねw
反逆日本アポカリプス→間違いなく至道流星
ギアスを至道流星作品にしたらこうなるんじゃないでしょうか(いや、元々パロディやってますがw)。
勇者協会・妹→不条理系のあれ。
これもいいですw
一覧の中でのタイトルでは一番目に止まりますね。
「なんで妹?」ってなるので、ネタ系としてはこの中で最上のインパクト率があるかと。
勇者と妹の相関性を導いていく作品かもw
で、まあ。
色々こう見てみると、リスト抽出系のこうしたタイトルは、タイトルを先に考えてネタを逆算する類いの、2ch的なアイディアに近いものがありますね。
まおゆうなんかも元々はそっち系になりますし。
もちろん、それだけにいかんせん手垢の付いたネーミングになりがちですし、文字数の制約上ネタ系の長文タイトルになりがちではあるかもです。
それに関しては読本なんかでも「気を付けるべし」としてましたけど、これはこれで見るべきものがありますしね。
タイトルリストというのは、「極端に影響されない」なら、或いは、「ネタから先に考える」には、かなり面白いメソッドなんだなあと。
よく「キャラクター名作成マクロ」みたいなのは見掛けますけど、こういうのはなかっただけに、公開されてたら使う人は多そうです。
中二二つ名抽出マクロみたいなのと違って、使うのは創作者になってくると思いますがw
反面、こうした「タイトルを先に」という思考は、恐らくテーマや内容が既にかっちりと決まっていたり、指針が定まっている人には枷にもなってしまうのではないんだろうか、という、割と素朴な疑問だったりしましたw