Memo - Regexp for TRON-code ~ メモ TRONコードの正規表現
Tuesday, 15. July 2008, 17:48:56
やっぱり素晴らしい。素人目には、Perlの正規表現に準じている印象だけど、クラス名による文字集合指定 ( [:classname:] ) で「日本基本、日本補助、GT、大漢和、中国、韓国、台湾、各国、JIS第1第2、JIS第3、JIS第4が使用できます。」ってのが便利やねぇ…。TRONコードは既に有る文字コードは何でも取り込む…という方針らしいけど、そうすると、当然CJKがごった煮になっているUnicodeも対象になっているわけで、内部的にはかなり面倒な事になっているんだろうなぁ…。それとも、Unicodeもあらかじめクラス分けして別のコードページ (TRONでは面というのかな?) にしていたりするんだろうか? どうもそんな感じだ→「TRONコード unicode面 CJK統合文字とハングルシラブルは除外」
unicode regexp についても似たような文字集合指定はあるらしい ( \p{classname} ) けど、これはあくまで Unicode の成り立ちに基づいている (つまり、Unicodeブロックによる文字集合) ようなので、基本ラテン文字を使用する国々の文字集合以外を特定するのは現段階では容易ではないようだ…。でもないよりはマシなので
Operaでこの手のチェックをするにはOpera Mailのフィルタを使う事になるんだけど、これが非常に時間がかかる上に負荷もかなりなものなのであまりやる気はおきない。メールパネル (メッセージパネルに名前変更した方が良いと思うが…) の「メッセージ検索」 (検索ツリー以下にぶら下がるヤツ)やメールウィンドウ (メッセージウィンドウ) の「クイック検索」でも同じ正規表現が使えるといいのに (そういうフィールドが別にあればいい)。






How to use Quote function: