発声練習

2014-08-07

[] 歴代首相の広島市原爆死没者慰霊式並びに平和祈念式あいさつリンク

比較

Ruby Gemライブラリのdiff/lcsを使って、’最長共通部分列(=longest common subsequence)’法で二つのテキストの共通部分を見つけてみた。

Rubyのソースコードと1997年から2014年までの各首相の広島市原爆死没者慰霊式並びに平和祈念式あいさつのテキストファイル(単に上記リンク先のページの内容をコピペしたもの)は以下のZipファイルにまとめてある。Ruby 2.1で動く。

中にあるRubyスクリプトはdiff/lcsをインストールした上で以下のように使う。

% sudo gem install diff-lcs
% ruby compare.rb 比較したいファイル1 比較したいファイル2 > HTMLファイル名

以下、いくつか比較した結果。なお、類似度はだいぶ適当な計算であるため、60%以上ぐらいじゃないとあまり参考にならない。

  • 平成25年度と26年度の安部首相のあいさつ:類似度 73.73 %
  • 平成19年度と26年度の安部首相のあいさつ:類似度 32.73 %
  • 平成24年度野田首相あいさつと25年度の安部首相のあいさつ:類似度 32.73 %
  • 平成23年度菅首相あいさつと24年度の野田首相のあいさつ:類似度 37.90 %
  • 平成22年度と平成23年度菅首相のあいさつ:類似度 38.17 %
  • 平成13年度と14年度の小泉首相のあいさつ:類似度 60.57 %
  • 平成14年度と15年度の小泉首相のあいさつ:類似度 58.29 %
  • 平成15年度と16年度の小泉首相のあいさつ:類似度 62.80 %
  • 平成16年度と17年度の小泉首相のあいさつ:類似度 58.40 %
  • 平成17年度と18年度の小泉首相のあいさつ:類似度 43.95 %
  • 平成13年度と18年度の小泉首相のあいさつ:類似度 36.71 %
  • 平成18年度の小泉首相のあいさつと19年度の安部首相のあいさつ:類似度 49.94 %

以上より、去年と今年の安部首相挨拶がダントツで類似している。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト

コメントを書くには、なぞなぞ認証に回答する必要があります。

トラックバック - http://d.hatena.ne.jp/next49/20140807/p3