memo.xight.org

日々のメモ

Unicode の Property を利用した正規表現

\p{Han}

  漢字にマッチ

\p{Hiragana}

  ひらがなにマッチ

\p{Katakana}

  カタカナにマッチ

Reference

  perl5.8のUnicodeサポート
  http://www.lr.pi.titech.ac.jp/~abekawa/perl/perl_unicode.html
  module.jp - 日本語に絡むUnicodeブロックとスクリプト (正規表現)
  http://module.jp/blog/regex_unicode_prop.html
  Script と実際のコードポイントとの対応表
  http://www.unicode.org/Public/UNIDATA/Scripts.txt