16赞

Java:如何检查字符是否属于特定的unicode块？

作者：360691894_8a5c48 | 2023-09-01 14:29

如何解决《Java:如何检查字符是否属于特定的unicode块？》经验，为你挑选了2个好方法。

我需要确定我的输入所属的自然语言.目标是区分混合输入中的阿拉伯语和英语单词,其中输入是Unicode并从XML文本节点中提取.我注意到了这堂课Character.UnicodeBlock.它与我的问题有关吗？我怎样才能让它发挥作用？

编辑: 该Character.UnicodeBlock方法对阿拉伯语很有用,但显然不适用于英语(或其他欧洲语言),因为BASIC_LATINUnicode块包含符号和不可打印的字符以及字母.所以现在我正在使用带有正则表达式matches()的String对象的方法"[A-Za-z]+".我可以忍受它,但也许有人可以建议更好/更快的方式.

1> Dennis C..：

是的,你可以简单地使用Character.UnicodeBlock.of(char)

2> Alan Moore..：

如果[A-Za-z]+符合您的要求,您将找不到更快或更漂亮的东西.但是,如果要匹配Latin1块中的所有字母(包括带重音的字母和连字),可以使用:

Pattern p = Pattern.compile("[\\pL&&\\p{L1}]+");

这是所有Unicode字母集和所有Latin1字符集的交集.

推荐阅读

程序员
Azure表中查询结果大小的限制是多少？

如何解决《Azure表中查询结果大小的限制是多少？》经验，为你挑选了1个好方法。 ... [详细]
程序员
PySpark 1.5如何从几秒钟将时间戳截断到最近的分钟

如何解决《PySpark1.5如何从几秒钟将时间戳截断到最近的分钟》经验，为你挑选了1个好方法。 ... [详细]
程序员
seaborn heatmap y轴逆序

如何解决《seabornheatmapy轴逆序》经验，为你挑选了2个好方法。 ... [详细]
程序员
Safari不在服务器端的refresh/onbeforeunload上运行回调函数(调用客户端代码)

如何解决《Safari不在服务器端的refresh/onbeforeunload上运行回调函数(调用客户端代码)》经验，为你挑选了1个好方法。 ... [详细]
程序员
当A和B被排序时,找到最小A [i] ^ 2 + B [i] ^ 2

如何解决《当A和B被排序时,找到最小A[i]^2+B[i]^2》经验，为你挑选了3个好方法。 ... [详细]
程序员
流星：如何使用用户名或密码登录用户

如何解决《流星：如何使用用户名或密码登录用户》经验，为你挑选了1个好方法。 ... [详细]
程序员
添加Swift枚举大小写是否需要对主要semver版本进行更新？

如何解决《添加Swift枚举大小写是否需要对主要semver版本进行更新？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将BIGSERIAL转换为BIGINT

如何解决《将BIGSERIAL转换为BIGINT》经验，为你挑选了1个好方法。 ... [详细]
程序员
Scikit Learn TfidfVectorizer:如何获得具有最高tf-idf分数的前n个术语

如何解决《ScikitLearnTfidfVectorizer:如何获得具有最高tf-idf分数的前n个术语》经验，为你挑选了1个好方法。 ... [详细]
程序员
复杂化在定制时会冻结Apple Watch

如何解决《复杂化在定制时会冻结AppleWatch》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么在JS中你不能在原型上设置非函数

如何解决《为什么在JS中你不能在原型上设置非函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
静态只读字段和性能

如何解决《静态只读字段和性能》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何告诉析构函数不被调用？

如何解决《如何告诉析构函数不被调用？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在制作Swift Command line工具时使用carthage库？

如何解决《如何在制作SwiftCommandline工具时使用carthage库？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Tesseract在openCV Mat上失败(安装问题？)

如何解决《Tesseract在openCVMat上失败(安装问题？)》经验，为你挑选了1个好方法。 ... [详细]
程序员
声明具有相同类型的多个TypeScript变量

如何解决《声明具有相同类型的多个TypeScript变量》经验，为你挑选了2个好方法。 ... [详细]
程序员
基于相同的索引连接两个列表

如何解决《基于相同的索引连接两个列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
将行复制粘贴到Excel电子表格中,而不覆盖下面的现有内容

如何解决《将行复制粘贴到Excel电子表格中,而不覆盖下面的现有内容》经验，为你挑选了1个好方法。 ... [详细]
程序员
R中for循环的矢量化

如何解决《R中for循环的矢量化》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Web worker预加载图像是否有优势？

如何解决《使用Webworker预加载图像是否有优势？》经验，为你挑选了1个好方法。 ... [详细]

360691894_8a5c48

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章