正規表現 - 非エンジニアのエンジニア道

なんとなく使ってたので、改めて。

文字列のパターンを表現する表記法で、文字列の検索や置換を行うときに利用される。
通常の文字と、特別な意味を持った記号(メタ文字)を組み合わせて表記する。

文字列の中から正規表現に一致する部分文字列を抜き出す

sedやgrepをオプションなしで使おうとすると、下記で\が必要となる
「+」「?」「{」「}」「(」「)」「|」

Portable Operating System Interface
「sed -r」「grep -E」とオプションをつけると、上記\が不要となり、すっきりする

文法がさらに追加。最長マッチを行うかも指定できる
代表的なものは下記

記号	意味
\d	数字にマッチ = [0-9]
\D	数字以外の文字にマッチ = [^\d]
\w	アルファベット、数字またはアンダーバーにマッチ = [a-zA-Z_0-9]
\W	アルファベット、数字やアンダーバー以外の文字にマッチ = [^\w]
\s	空白文字、\f、\n、\r、\t や \vにマッチ
\S	空白文字以外の文字にマッチ = [^\s]

ファイルに対してパターンマッチングを行い、マッチする行を出力する。

grep option searchword targetfile

オプション -n で行番号も表示する

grep -n え test.txt

文字列の置換，行の削除を行う

sed option targetfile

オプション -e で置換処理
オプション -f でファイルを指定して、そのファイル内に記載されている処理を行う

sed -e "s/だめ/いいよ/g" test.txt