- 秀丸では、メタ文字を利用して正規表現を実行しますが、では、[メタ文字自体をキーワードとして指定したい]場合にはどうすればよいのでしょうか?
- その場合に利用するのがエスケープシーケンスです。
- エスケープシーケンスとは、[エスケープコード+制御文字]の組み合わせを指します。
- 正規表現を使い倒すためには、メタ文字のみならず、エスケープシーケンスの理解も欠かせません。
エスケープコード
- 半角の円記号 は、秀丸では と呼ばれ、通常の文字とは異なる働きをします。
- フォントによっては と表示される場合もあります。
- エスケープコードとは、コンピュータに特殊な振る舞いをさせるための文字である制御文字を、通常の文字列と識別するために利用する仕組みです。
- を利用する事で、正規表現中にメタ文字それ自体を文字として指定したり、制御文字や文字コードを指定したり出来るようになります。
- 制御文字については、こちらの説明を参照してください。
↑ ページ先頭
メタ文字を文字として指定
- メタ文字それ自体をキーワードとして指定する場合は、各メタ文字の直前に\を半角で入力します。
- \自体を指定する場合は、\\と入力します。
メタ文字 | メタ文字を文字として指定 |
---|---|
^ | \^ |
$ | \$ |
[ ] | \[ \] |
( ) | \( \) |
. | \. |
+ | \+ |
* | \* |
? | \? |
- | \- |
| | \| |
↑ ページ先頭
文字コードを指定
- 文字コード番号(Shift-JISのコードポイント)を指定する正規表現です。
\ooo
- に8進数で文字コードを指定します。 は1〜3桁
あ→\101\240
\xhh
- に16進数で文字コードを指定します。 は1〜2桁
あ→\x82\xA0
↑ ページ先頭
英単語関連
- ここでの とは、 を指します。
\<
- 英単語の始まりを表します。
→ で始まる英単語
\>
- 英単語の終わりを表します。
→ で終わる英単語
\w
- 英単語を表します。
↑ ページ先頭
タグ付き正規表現
↑ ページ先頭
制御文字
- とは、文字集合には割り当てられているものの、通常の文字としては扱われない文字です。
- では は何をするかと言うと、制御文字の割り当てられているコードポイントをコンピュータに送ることによって、 や などの通常の文字では不可能な特殊な振る舞いをさせるために存在します。
- そのため は というよりも、特殊な の組み合わせと言った方が適切かもしれません。
- 秀丸の正規表現では、 は上述の とペアで利用されます。
- 上にも書きましたが、 + の組み合わせは、 と呼ばれます。
- 制御文字は厳密に言うと文字ではないので、表記することは出来ません。
- 秀丸のウィンドウでは、文字ではない事を示すために、通常の文字列とは異なる色で表記されます。
- もし、これらの表記が見えなければ、以下の手順を実行してください。
- 秀丸のメニューの を選択します。
- のダイアログボックスが開きます。
- 以下のの画面を参照にしてチェックを入れてから を左クリックしてください。
- 正規表現では、便宜的に幾つかの文字を組み合わせて を表記します。
- 秀丸では、以下に挙げた通りになります。
エスケープシーケンス | 意味 |
---|---|
\n | 改行(ニューライン) |
\t | 水平タブ |
この二つはよく利用されます。 | |
\a | ベル |
\b | バックスペース |
\r | キャリッジリターン |
\v | 垂直タブコード |
\e | エスケープコード |
\z | エンドオブファイル(EOF:) |
↑ ページ先頭