ユーザーブロマガは2021年10月7日(予定)をもちましてサービスを終了します

辞書・漢字・正規表現の修正・データまとめ記録(配布した物の修正版・改良版はここに貼り付ける)
閉じる
閉じる

辞書・漢字・正規表現の修正・データまとめ記録(配布した物の修正版・改良版はここに貼り付ける)

2016-03-01 17:48
  • 10

修正版 

青空文庫朗読動画投稿用 棒読みちゃん単語・正規表現辞書 2017/3/26
ReplaceWordRegex http://www1.axfc.net/u/3627547

単語 漢字の読み MS-IMEユーザー辞書 2017/3/26 
漢字ユーザー辞書(試作版).dic+テキストファイル形式
辞書.zip https://www.axfc.net/u/3761037
システム辞書形式(旧式 上記のMS-IMEユーザー辞書より少し古い)
https://www.axfc.net/u/3721791.zip

2017/8/20 青空文庫 テキストファイル
新仮名遣い約8450作品 旧仮名遣ひ約5550作品 その他14作品 計 約14000作品
青空文庫テキスト作品( https://www.axfc.net/u/3837436.zip



間違ってたものの記録 自分用

蜷川新
にながわあらた

日本童話研究会
にほんどうわけんきゅうかい

日本国
にほんこく

日本経済新聞社
にほんけいざいしんぶんしゃ

新渡戸稲造
にとべいなぞう

西田幾多郎
にしだきたろう

仁科芳雄
にしなよしお

-------------------------------------------------
2016/12/31
中谷宇吉郎
なかやうきちろう

中山省三郎
なかやましょうざぶろう

中山太郎
なかやまたろう

長与善郎
ながよよしろう

夏目漱石
なつめそうせき

楢崎竜
ならさきりょう

奈倉次郎
なくらじろう

成島柳北
なるしまりゅうほく

南部修太郎
なんぶしゅうたろう

新島襄
にいじまじょう

新美南吉
にいみなんきち


広告
×
青空文庫を読む際にお世話になっております。
漢字ユーザー辞書(試作版).dic
を登録しようとした所

Microsoft IME 辞書からの登録
---------------------------
指定されたファイルは認識できないファイルです。
---------------------------
と出てしまって登録できません。
Windows7 です。何か対策はありますか?
55ヶ月前
×
>>1
うーん、自分のパソコンで、辞書を入れ直してみましたがそのまま使用できて、エラー(失敗)の再現が出来ませんでした。
自分は今Windows10の環境しかないので、バージョン違いの影響だとすると対策がわかりません。
別の方法で辞書登録してもらえるのなら、ほぼ間違いなく登録できる(と思う)テキストファイルの辞書を置いておきますので、よろしければ試してみて下さい。

登録の仕方は下記のURLの辞書登録の方法部分が参考になるかもです。
http://ch.nicovideo.jp/saikai/blomaga/ar536592
http://ch.nicovideo.jp/saikai/blomaga/ar614191
55ヶ月前
×
上の本文に、テキストファイルの辞書のダウンロードURLを追加しました。
後々、作成出来ましたら、念のためにシステム辞書も追加しておきます。
55ヶ月前
×
お返事を頂いていたのに本当にすみませんm(_ _)m
私のパソコンの調子が悪かった様です。
リカバリしテキストファイル形式の辞書で無事読み込む事ができました。
ありがとうございます!本当に重宝しております。
54ヶ月前
×
>>4
いえいえ、上手くいったのなら何よりです。
54ヶ月前
×
ReplaceWordRegexを利用させて頂いてます。

棒読みちゃんで、青空文庫を読み上げてて,
字下げなどが読み上げられてて本当に不便な思いをしてたので
まさに欲しかった機能でした。
ありがとうございます。

1点、質問なのですが
ReplaceWordRegexは
棒読みちゃんの正規表現の置換機能を使ってますが

秀丸エディタなど正規表現およびマクロを使うエディタで、
テキスト自体を置換することは出来ますか?

よろしくおねがいします。
45ヶ月前
×
>>6
えっと、自分は複数のテキストエディタに詳しいわけではないので分かる範囲で一つずつ答えます。

マクロについて
自分は、ほぼわからないレベルです。

秀丸エディタについて
前に少しだけ使っただけなので、詳しいことはわかりません。
正規表現が使えるならテキストの置換自体は可能だと思いますが
(下記に続く)

テキストエディタの正規表現を使用してテキストの置換について
機能的には、出来ます。

補足
自分が使ったソフト(3種類ぐらい)でも、正規表現のルールが微妙にちがいました。
ルールが違うと思った通りの置換が出来ませんので、ReplaceWordRegexの正規表現は他のソフトなどには思ったように流用できません。
一応、自分が使ったテキストエディタはEmEditorですが、朗読動画作成用のEmEditorの正規表現だったら
(http://ch.nicovideo.jp/saikai/blomaga/ar788688)
に動作説明と一緒にダウンロード用のURLがあります。
ReplaceWordRegexの正規表現は、朗読動画作成用のEmEditorの正規表現を改変・削除したものなので似たようなテキスト置換を行いますが別物です。

テキストエディタではないですが、青空文庫の傍点やルビを変換できる
RubyMate(http://www.forest.impress.co.jp/article/2008/10/20/okiniiri.html)
と言うのもあります。
45ヶ月前
×
棒読みちゃんの辞書で正規表現の欄にAからZを選択する時A-Zと書くのですが、漢字全文字を選択する時は亜-把ではダメです。
どうすればいいでしょうか。
あと、//の後の文字(漢字も含む)を全て読ませない方法などはありますか?
29ヶ月前
×
>>9
うーん、自分はソフト開発者や正規表現の専門家ではないので、
コレが正しいやり方だとは断言できません。
つまり、正規表現のルールを完全にわかってるわけではないです。
(漢字の全一致は自分が教えてほしいぐらいです)

Googleなどで、【正規表現入門】などで検索して、
表示されたサイトなどを見たほうがわかりやすく、間違いが少ないかと

このへんが解れば上記のことは、ある程度可能かな・・・とは思います。
(ただソフトによって正規表現の挙動が微妙に違ったりする可能性があります)

https://www.mnet.ne.jp/~nakama/

https://so-zou.jp/software/tech/programming/tech/regular-expression/meta-character/variable-width-encoding.htm

https://crocro.com/pc/write/hide/chimarl09_03.html
29ヶ月前
×
一応、自分が出来るだけ漢字に一致するように作ったのがコレです。
(そもそも環境によっては文字自体が表示できるかどうかもわかりませんが・・・)
ここページでは、表示できなかったので
ダウンロード用
https://www.axfc.net/u/3943825.zip

(内容例)
一-龥朗-鶴一-龠欄廊侮僧免勉勤卑喝嘆器塀墨層屮悔慨憎懲敏既暑梅海渚漢煮爫琢碑社祈祉祐祖祝禍禎穀突節練縉繁署者臭艹著褐視謁謹賓贈辶逸難響頻龸㐂㐆㐌㐬㐮㑨㑪㒒㒵㒼㓁㓇㓐㓛㔟㕒㕝㕞㕣㕮㖦㖨㖭㗅㗙㗚㗲㗴㘅㘝㘞㙊㚑㚖㚙㛏㜊㝠㝡㝢㝫㝬㝵㞍㟁㟛㟢㟨㟴㟽㠀㠔㠝㠯㠶㡀㡜㡡㡧㢧㣺㤉㤗㤚㥯㥿㦣㦸㧞㨻㩅㩮㩳㫋㫖㫗㫟㫪㬅㬎㬚㬜㬢㭭㭷㮇㮈㮍㮤㮶㯃㯉㯍㯰㯿㰏㰦㲓㲪㳃㳒㳽㴑㴞㴶㵤㶚㷀㷔㷲㸅㸿㹀㹠㹦㹨㺃・・・表示できず
29ヶ月前
コメントを書く
コメントをするには、
ログインして下さい。