多字节字符串的正则表达式字边界

作者：帆侮听我悄悄说星星 | 2023-08-29 16:14

如何解决《多字节字符串的正则表达式字边界》经验，为你挑选了1个好方法。

我在我的搜索应用程序上使用posix c正则表达式库(regcomp/regexec).我的应用程序支持不同的语言,包括使用多字节字符的语言.我在使用字边界元字符(\ b)时遇到了问题.对于单字节字符串,它工作得很好,例如:

"\ bpaper\b"匹配"纸"

但是,如果正则表达式和查询字符串是多字节的,它似乎无法正常工作,例如:

"\ b纸张\ b"与"纸张"不符

我错过了什么吗？任何帮助将受到高度赞赏.

请求的信息:

编程语言:C

正则表达式库:GNU C(regex.h)

谢谢.

1> bobince..：

如果正则表达式和查询字符串是多字节的,它似乎无法正常工作

在这种情况下什么是"多字节"？编码为UTF-8字节的字符串？特定于语言环境的多字节编码,例如GB？

如果您没有本地处理宽(Unicode)字符串,那么您不能指望对非ASCII字符的支持,而不仅仅是检测它们.POSIX正则表达式没有为ASCII范围之外的字节指定任何字符类,因此它不知道"\ xe7\xb4\x99"中的任何字节('纸'的UTF-8表示)都可以考虑字信件; 因此它没有看到任何字界.

Unicode中的字母或单词构成的问题比简单的ASCII正则表达式可以处理的问题更为复杂.(显然,用中文构成'单词'的内容本身就是可论证的.)如果你想要检测的只是普通的旧空间,你可以明确地做到这一点:

(\s|^)??(\s|$)

推荐阅读

程序员
无法读取配置节'entityFramework',因为它缺少节声明

如何解决《无法读取配置节'entityFramework',因为它缺少节声明》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在pre标签周围创建div

如何解决《如何在pre标签周围创建div》经验，为你挑选了1个好方法。 ... [详细]
程序员
ClassNotFoundException - com.microsoft.jdbc.sqlserver.SQLServerDriver

如何解决《ClassNotFoundException-com.microsoft.jdbc.sqlserver.SQLServerDriver》经验，为你挑选了0个好方法。 ... [详细]
程序员
是否有可能从std :: abort恢复？

如何解决《是否有可能从std::abort恢复？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Javascript中使用异步等待函数对象？

如何解决《如何在Javascript中使用异步等待函数对象？》经验，为你挑选了2个好方法。 ... [详细]
程序员
401在访问资源时未经授权以编程方式创建azure应用程序

如何解决《401在访问资源时未经授权以编程方式创建azure应用程序》经验，为你挑选了0个好方法。 ... [详细]
程序员
ReSharper自定义模式与多个成员定义不明确

如何解决《ReSharper自定义模式与多个成员定义不明确》经验，为你挑选了0个好方法。 ... [详细]
程序员
批量分配问题

如何解决《批量分配问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
添加Controller时SpringDataRest @RepositoryEventHandler未运行

如何解决《添加Controller时SpringDataRest@RepositoryEventHandler未运行》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Visual Studio的Node Tools调试Gulp任务？

如何解决《如何使用VisualStudio的NodeTools调试Gulp任务？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Flask/uWSGI抛出错误无法加载app 0(mountpoint ='')

如何解决《Flask/uWSGI抛出错误无法加载app0(mountpoint='')》经验，为你挑选了1个好方法。 ... [详细]
程序员
令人困惑的考试复习说明,java

如何解决《令人困惑的考试复习说明,java》经验，为你挑选了1个好方法。 ... [详细]
程序员
解构深层属性

如何解决《解构深层属性》经验，为你挑选了1个好方法。 ... [详细]
程序员
您如何访问已传递给CompletableFuture allOf的已完成期货？

如何解决《您如何访问已传递给CompletableFutureallOf的已完成期货？》经验，为你挑选了1个好方法。 ... [详细]
程序员
AdMob：使用测试横幅广告无法从任何Mediaton广告网络中填充广告

如何解决《AdMob：使用测试横幅广告无法从任何Mediaton广告网络中填充广告》经验，为你挑选了0个好方法。 ... [详细]
程序员
新的React Native项目与旧版本的本机反应

如何解决《新的ReactNative项目与旧版本的本机反应》经验，为你挑选了3个好方法。 ... [详细]
程序员
使用重置初始化unique_ptr是一个坏习惯吗？

如何解决《使用重置初始化unique_ptr是一个坏习惯吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
EntityFramework 6.1.3不支持visual studio 2015上的框架.NETPlatform,Version = v5.4

如何解决《EntityFramework6.1.3不支持visualstudio2015上的框架.NETPlatform,Version=v5.4》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用CSS从焦点选项卡中删除发光边框

如何解决《使用CSS从焦点选项卡中删除发光边框》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用IIf语法错误

如何解决《使用IIf语法错误》经验，为你挑选了1个好方法。 ... [详细]

帆侮听我悄悄说星星

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章