« 前一篇:馬前課
后一篇:六项精进 »

查找中文的正则表达式 @ 1/28/2013

转贴类
from: 那谁的技术博客

(".*[\u4E00-\u9FA5]+)|([\u4E00-\u9FA5]+.*")

在Visual Studio/Flash Builder中测试通过。
发布于 1/28/2013 17:00:36 | 评论:2
天魔 @ 1/28/2013 20:14:56
这个 Blog 的评论部分客户端验证也用到了中文检测,不过貌似范围不同:

if(/[^\u4E00-\u9FA0a-zA-Z0-9._ ]/.test(author_name)) {
    alert("名字中不能含有除中文、字母、数字、句点及下划线之外的字符!");
    return;
}
吴雨 @ 1/29/2013 1:14:47
关于unicode集合中的汉字,若干子区间如下定义:
03007              1  汉字“〇”
03400~04DB5    6582  ExtA      连续
04E00~09FCB  20940  基本集    连续,但9FBC~9FCB暂无字形
0E815~0E864      80  自定义区  连续,这些字符有两个unicode编码
0F900~0FAD9    470  兼容集    有洞,且[FA2E,FA2F,FA6E,FA6F]暂无字形
20000~2A6D6  42711  ExtB      连续
2F800~2FA1D    542  兼容补遗  连续
2A700~2B734    4149  ExtC      连续
2B740~2B81D    222  ExtD      连续

看帖要回帖...

categories
archives
links
statistics
  • 网志数:1168
  • 评论数:2011