bookmarks of the day 09/17/2010

Posted by Toshi | | Posted On Sep 17, 2010 at 11:30 PM

  • tags: java regex regularexpression pattern class

    • 正規表現構文の要約










































      <!-- <tt>[\!"#\$%&'\(\)\*\+,\-\./:;\<=\>\?@\[\\\]\^_`\{\|\}~]</tt> <tt>[\X21-\X2F\X31-\X40\X5B-\X60\X7B-\X7E]</tt> -->

















































      <!-- Metachars: !$()*+.<>?[\]^{|} -->









      構文Matches
       
      文字
      x文字 x
      \\バックスラッシュ文字
      \0n8 進値 0n を持つ文字 (0 <= n <= 7)
      \0nn8 進値 0nn を持つ文字 (0 <= n <= 7)
      \0mnn8 進値 0mnn を持つ文字 (0 <= m <= 3、0 <= n <= 7)
      \xhh16 進値 0xhh を持つ文字
      \uhhhh16 進値 0xhhhh を持つ文字
      \tタブ文字 ('\u0009')
      \n改行文字 ('\u000A')
      \rキャリッジリターン文字 ('\u000D')
      \f用紙送り文字 ('\u000C')
      \a警告 (ベル) 文字 ('\u0007')
      \eエスケープ文字 ('\u001B')
      \cxx に対応する制御文字
       
      文字クラス
      [abc]ab、または c (単純クラス)
      [^abc]abc 以外の文字 (否定)
      [a-zA-Z]az または AZ (範囲)
      [a-d[m-p]]ad、または mp:[a-dm-p] (結合)
      [a-z&&[def]]def (交差)
      [a-z&&[^bc]]bc を除く az:[ad-z] (減算)
      [a-z&&[^m-p]]mp を除く az:[a-lq-z] (減算)
       
      定義済みの文字クラス
      .任意の文字 (行末記号とマッチする場合もある)
      \d数字: [0-9]
      \D数字以外: [^0-9]
      \s空白文字:[ \t\n\x0B\f\r]
      \S非空白文字:[^\s]
      \w単語構成文字:[a-zA-Z_0-9]
      \W非単語文字:[^\w]
       
      POSIX 文字クラス (US-ASCII のみ)
      \p{Lower}小文字の英字:[a-z]
      \p{Upper}大文字の英字: [A-Z]
      \p{ASCII}すべての ASCII 文字: [\x00-\x7F]
      \p{Alpha}英字: [\p{Lower}\p{Upper}]
      \p{Digit}10 進数字: [0-9]
      \p{Alnum}英数字: [\p{Alpha}\p{Digit}]
      \p{Punct}句読文字:!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~ のいずれか
      \p{Graph}表示できる文字:[\p{Alnum}\p{Punct}]
      \p{Print}プリント可能文字:[\p{Graph}\x20]
      \p{Blank}空白またはタブ:[ \t]
      \p{Cntrl}制御文字:[\x00-\x1F\x7F]
      \p{XDigit}16 進数字:[0-9a-fA-F]
      \p{Space}空白文字:[ \t\n\x0B\f\r]
       
      java.lang.Character クラス (単純な java 文字タイプ)
      \p{javaLowerCase}java.lang.Character.isLowerCase() と等価
      \p{javaUpperCase}java.lang.Character.isUpperCase() と等価
      \p{javaWhitespace}java.lang.Character.isWhitespace() と等価
      \p{javaMirrored}java.lang.Character.isMirrored() と等価
       
      Unicode ブロックとカテゴリのクラス
      \p{InGreek}ギリシャ語ブロックの文字 (単純ブロック)
      \p{Lu}大文字 (単純カテゴリ)
      \p{Sc}通貨記号
      \P{InGreek}ギリシャ語ブロック以外の文字 (否定)
      [\p{L}&&[^\p{Lu}]] 大文字以外の文字 (減算)
       
      境界正規表現エンジン
      ^行の先頭
      $行の末尾
      \b単語境界
      \B非単語境界
      \A入力の先頭
      \G前回のマッチの末尾
      \Z最後の行末記号がある場合は、それを除く入力の末尾
      \z入力の末尾
       
      最長一致数量子
      X?X、1 または 0 回
      X*X、0 回以上
      X+X、1 回以上
      X{n}Xn
      X{n,}Xn 回以上
      X{n,m}Xn 回以上、m 回以下
       
      最短一致数量子
      X??X、1 または 0 回
      X*?X、0 回以上
      X+?X、1 回以上
      X{n}?Xn
      X{n,}?Xn 回以上
      X{n,m}?Xn 回以上、m 回以下
       
      強欲な数量子
      X?+X、1 または 0 回
      X*+X、0 回以上
      X++X、1 回以上
      X{n}+Xn
      X{n,}+Xn 回以上
      X{n,m}+Xn 回以上、m 回以下
       
      論理演算子
      XYX の直後に Y
      X|YX または Y
      (X)X、前方参照を行う正規表現グループ
       
      前方参照
      \nマッチした n 番目の前方参照を行う正規表現グループ
       
      引用
      \正規表現ではないが、次の文字をエスケープする
      \Q正規表現ではないが、\E までのすべての文字をエスケープする
      \E正規表現ではないが、\Q で開始された引用をエスケープする
       
      特殊な構文 (前方参照を行わない)
      (?:X)X、前方参照を行わない正規表現グループ
      (?idmsux-idmsux) 正規表現ではないが、マッチフラグ idmsux のオン/オフを切り替える
      (?idmsux-idmsux:X)  X前方参照を行わないグループ。指定されたフラグ idmsux のオン/オフを切り替える
      (?=X)X、幅ゼロの肯定先読み
      (?!X)X、幅ゼロの否定先読み
      (?<=X)X、幅ゼロの肯定後読み
      (?<!X)X、幅ゼロの否定後読み
      (?>X)X、独立した前方参照を行わない正規表現グループ

Posted from Diigo. The rest of my favorite links are here.
blog comments powered by Disqus