10赞

Unicode的换行规则是否要求最后一个字符是强制中断？

作者：爱唱歌的郭少文_ | 2023-09-11 08:41

如何解决《Unicode的换行规则是否要求最后一个字符是强制中断？》经验，为你挑选了1个好方法。

我正在尝试使用libunibreak(https://github.com/adah1972/libunibreak)来标记某些给定的unicode文本中可能的换行符.

Libunibreak在某些文本中为每个代码单元返回了四个可能的选项:

LINEBREAK_MUSTBREAK
LINEBREAK_ALLOWBREAK
LINEBREAK_NOBREAK
LINEBREAK_INSIDEACHAR

希望这些是自我解释的.我希望MUSTBREAK对应于像LF这样的换行符.但是,对于任何给定的文本,Libunibreak始终指示最后一个字符是MUSTBREAK

例如,使用字符串"abc",输出将是[NOBREAK,NOBREAK,MUSTBREAK].对于"abc \n",输出将是[NOBREAK,NOBREAK,NOBREAK,MUSTBREAK].我在绘制文本时使用MUSTBREAK属性开始一个新行,因此第一个案例("abc")创建了一个不应该存在的额外换行符.

这是Unicode指定的行为,还是我正在使用的库实现的怪癖？

1> nwellnhof..：

是的,这是Unicode换行算法指定的内容.UAX#14中的规则LB3 :Unicode断行算法,第6.1节"不可裁剪的断行规则"说:

总是在文本末尾打破.

该规范进一步解释:

[此规则]旨在处理退化情况,因此整个文本至少有一个换行符.

推荐阅读

程序员
Oauth2使用hd无法正常限制使用特定域名的电子邮件

如何解决《Oauth2使用hd无法正常限制使用特定域名的电子邮件》经验，为你挑选了1个好方法。 ... [详细]
程序员
在ACF选项菜单下添加我自己的自定义子页面

如何解决《在ACF选项菜单下添加我自己的自定义子页面》经验，为你挑选了1个好方法。 ... [详细]
程序员
JS&ES6:从类中访问静态字段

如何解决《JS&ES6:从类中访问静态字段》经验，为你挑选了1个好方法。 ... [详细]
程序员
在pickle中保存整数并调用它们

如何解决《在pickle中保存整数并调用它们》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么是？MODULE

如何解决《什么是？MODULE》经验，为你挑选了1个好方法。 ... [详细]
程序员
常规过程/方法指针

如何解决《常规过程/方法指针》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在LINQ查询的where子句中将方法/函数作为IEnumerable对象调用

如何解决《如何在LINQ查询的where子句中将方法/函数作为IEnumerable对象调用》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将此SQL语句转换为PostgreSQL？

如何解决《如何将此SQL语句转换为PostgreSQL？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在张量流中将3通道掩模应用于3通道Tensor

如何解决《在张量流中将3通道掩模应用于3通道Tensor》经验，为你挑选了1个好方法。 ... [详细]
程序员
安装自定义构建heroku并使用库路径发出问题

如何解决《安装自定义构建heroku并使用库路径发出问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
重载Extraction和Insertion << >> operator c ++

如何解决《重载Extraction和Insertion<<>>operatorc++》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何为TensorFlow变量赋值？

如何解决《如何为TensorFlow变量赋值？》经验，为你挑选了3个好方法。 ... [详细]
程序员
Flexbox调整复选框的大小(太小)

如何解决《Flexbox调整复选框的大小(太小)》经验，为你挑选了1个好方法。 ... [详细]
程序员
有没有办法在Visual Studio Code中生成JSDoc注释

如何解决《有没有办法在VisualStudioCode中生成JSDoc注释》经验，为你挑选了3个好方法。 ... [详细]
程序员
Visual Studio 2015 - 在重新启动Visual Studio之前,ASP.Net应用程序不会启动

如何解决《VisualStudio2015-在重新启动VisualStudio之前,ASP.Net应用程序不会启动》经验，为你挑选了1个好方法。 ... [详细]
程序员
模拟对象不起作用

如何解决《模拟对象不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用游标在不同的数据库中创建过程

如何解决《如何使用游标在不同的数据库中创建过程》经验，为你挑选了0个好方法。 ... [详细]
程序员
Elasticsearch搜索的结果多种多样

如何解决《Elasticsearch搜索的结果多种多样》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java字符串不可变

如何解决《Java字符串不可变》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Python和Regex提取不同格式的日期

如何解决《使用Python和Regex提取不同格式的日期》经验，为你挑选了0个好方法。 ... [详细]

爱唱歌的郭少文_

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章