トップ 正規表現とは 基本のメタ文字 練習問題

1.正規表現の基本

 正規表現を使用するには、”メタ文字”という文字を使用し、条件を設定する必要があります。メタ文字と聞くと難しそうな感じがしますが、要するに「文字列がアルファベットの組み合わせか」や「対象の文字列が行の先頭にあるか」など、条件を表す特殊な機能を持った文字であるといえます。

では、実際に試してみましょう。

[検索対象文字列]

下記のフォーム欄に

[ア-ン]{3}ボール

と入力し、[回答]ボタンを押してください。

[回答]

[結果]

正しく入力されていれば、ハンドボールとソフトボールが[結果]欄に表示されます。

 少し詳しく見ていきましょう。(この段階では、正規表現の基礎的な考え方を何となくでも理解していただければ結構です。個々のメタ文字の意味や用法はまだ覚えなくてもかまいません。)

 まず、最初の括弧内の[ア-ン]は文字コードでカタカナを表しています。次の{3}は三文字であることを表しています。この{3}は先ほどの括弧[ア-ン]にかかっています。そして、最後のボールは特に何もついていないので、通常の検索と同じくボールという文字列を検索します。

 つまり、この正規表現全体が意味するのは、カタカナ三文字+ボールという文字列を[検索対象文字列]から検索し、表示するというものです。

 そのため、先頭にカタカナ三文字で”ハンド”と”ソフト”がついているハンドボールとソフトボールが表示され、カタカナ二文字である”ハイ”と”ゴム”がつくハイボールとゴムボールは表示されないのです。

 なお、正規表現を用いて文書を検索して、なんらかの単語にヒットすることを「マッチ(match)する」といいます。

ページの一番上へ トップへ戻る