* fix: convert non Shift_JIS character only
authormitty <mitty@7d2118f6-f56c-43e7-95a2-4bb3031d96e7>
Fri, 25 Jan 2013 17:18:36 +0000 (17:18 +0000)
committermitty <mitty@7d2118f6-f56c-43e7-95a2-4bb3031d96e7>
Fri, 25 Jan 2013 17:18:36 +0000 (17:18 +0000)
  * skip needless convert (such as U+8C37 -> U+7A40)

git-svn-id: https://lab.mitty.jp/svn/lab/trunk@199 7d2118f6-f56c-43e7-95a2-4bb3031d96e7

misc/findsimplified.pl

index 024e4cc..bb80414 100755 (executable)
@@ -19,9 +19,12 @@ sub match {
     my $str = shift @_;
     
     $str = $utf8->decode($str);
-    my $jtext = $ck->conv_c2j($str);
-    if ($str ne $jtext) {
-        return $utf8->encode($jtext);
+    my $sjis = encode("cp932", $str, Encode::FB_HTMLCREF);
+    if ($sjis =~ /&#\d{4,};/) {
+        my $jtext = $ck->conv_c2j($str);
+        if ($str ne $jtext) {
+            return $utf8->encode($jtext);
+        }
     }
     
     return '';