查找中文的正则表达式 from: 那谁的技术博客(".*[\u4E00-\u9FA5]+)|([\u4E00-\u9FA5]+.*")在Visual Studio/Flash Builder中测试通过。
这个 Blog 的评论部分客户端验证也用到了中文检测,不过貌似范围不同: if(/[^\u4E00-\u9FA0a-zA-Z0-9._ ]/.test(author_name)) { alert("名字中不能含有除中文、字母、数字、句点及下划线之外的字符!"); return; }
关于unicode集合中的汉字,若干子区间如下定义:03007 1 汉字“〇”03400~04DB5 6582 ExtA 连续04E00~09FCB 20940 基本集 连续,但9FBC~9FCB暂无字形0E815~0E864 80 自定义区 连续,这些字符有两个unicode编码0F900~0FAD9 470 兼容集 有洞,且[FA2E,FA2F,FA6E,FA6F]暂无字形20000~2A6D6 42711 ExtB 连续2F800~2FA1D 542 兼容补遗 连续2A700~2B734 4149 ExtC 连续2B740~2B81D 222 ExtD 连续
这个 Blog 的评论部分客户端验证也用到了中文检测,不过貌似范围不同:
关于unicode集合中的汉字,若干子区间如下定义:
03007 1 汉字“〇”
03400~04DB5 6582 ExtA 连续
04E00~09FCB 20940 基本集 连续,但9FBC~9FCB暂无字形
0E815~0E864 80 自定义区 连续,这些字符有两个unicode编码
0F900~0FAD9 470 兼容集 有洞,且[FA2E,FA2F,FA6E,FA6F]暂无字形
20000~2A6D6 42711 ExtB 连续
2F800~2FA1D 542 兼容补遗 连续
2A700~2B734 4149 ExtC 连续
2B740~2B81D 222 ExtD 连续