[perl] 斷開中英文

2005/12/27
By

懶,所以也不想去縮減了。

use encoding ‘utf8′;
my $CJK = "[x{3400}-x{FA20}]";
while (< STDIN >) {
  chomp; my @ss = split (/($CJK|[A-Za-z0-9]+)/, $_);
  print join (" ",@ss)."n";
}

測試句:

請問2001年3月第一家麥當勞飯店在何國成立?

結果

請 問 2001 年 3 月 第 一 家 麥 當 勞 飯 店 在 何 國 成 立 ?

若是要連續的,那麼在 $CJK 裡加個 + 就好:

my $CJK = "[x{3400}-x{FA20}]+";

結果

請問 2001 年 3 月第一家麥當勞飯店在何國成立?

Tags:

發表迴響

您的電子郵件位址並不會被公開。 必要欄位標記為 *

*


*