2013-04-11から1日間の記事一覧

2013-04-11

後方参照

正規表現

こんなHTMLがあって、bタグもしくはiタグに引っ掛るものをマッチする正規表現を書くとする。後方参照を使うとb要素の中にi要素がある場合でも正しくマッチする <[bi][\s\S]*?>[\s\S]*?</[bi]>って書くと、以下までしかマッチしない。最後のb閉じタグがマッチしない…

2013-04-11

最長一致と最短一致

正規表現

このようなHTMLがあったとして、 p要素です。 .... </html> このHTMLにだけマッチする正規表現を書きたいとする。 でも、 <p[\s\S]*>と書いたら、全てのHTMLにマッチしてしまう。\s\Sが全ての文字にマッチするので、 hogefuga の最初のにマッチしてしまうからである。や*な</p[\s\s]*>…

2013-04-11

文字列の先頭/最後にマッチ

正規表現

^と$を使う。An apple falled from the tree.という文章について、 ^AnはAn appleのAnにマッチするし、 tree\.$は、最後のtree.にマッチする。

2013-04-11

特殊文字をちょろっと

正規表現

<tr> <td>hoge</td> <td>fuga</td> </tr> </td>\n<td>だと、最初のとにマッチする。</td>

2013-04-11

どれかのパターンにマッチ

正規表現

(this|that)this か thatにマッチ。 ([Tt]his|[Tt]hat)で、This this That thatのどれかにマッチ。 ([Tt]his|[Tt]hat) (is|was)とする事で複数回利用が可能となる。

2013-04-11

否定

正規表現

a/b/c以外の文字にマッチという風にするなら、 [^abc]と書く。abc abd abeなら、ab[^cd]でabeにマッチする。

2013-04-11

文字クラス

正規表現

「-」の文字を使って、ある範囲に入る全ての文字を指定できる。これを文字クラスという。 [a-zA-Z][0-9]で、a-zか、A-Zのどれか一文字+0-9のどれか一文字という風になる。 A0 とか z8とか。

プロフィール

id:shigemk2 はてなブログPro

最終更新: 2024-04-18 20:07

web系エンジニアの速記的備忘録。メモ書き故、中身については保証致しません。また実在している団体等とは一切関係ありません。

@shigemk2をフォロー

このブログについて

月別アーカイブ

ブックマーク数

by shigemk2

当面は技術的なことしか書かない

2013-04-11から1日間の記事一覧

後方参照

最長一致と最短一致

文字列の先頭/最後にマッチ

特殊文字をちょろっと

どれかのパターンにマッチ

否定

文字クラス