2赞

格式化包含非ascii字符的列

作者：mobiledu2402852357 | 2023-09-08 10:53

如何解决《格式化包含非ascii字符的列》经验，为你挑选了1个好方法。

所以我想对齐包含非ascii字符的字段.以下似乎不起作用:

for word1, word2 in [['hello', 'world'], ['?????', '??']]:
    print "{:<20} {:<20}".format(word1, word2)

hello                world
?????      ??

有解决方案吗？

1> Martijn Piet..：

您正在格式化一个多字节编码的字符串。您似乎正在使用UTF-8编码文本，并且该编码在每个代码点使用多个字节（1到4之间，具体取决于特定字符）。格式化字符串会计算字节数，而不是代码点数，这是字符串最终未对齐的原因之一：

>>> len('hello')
5
>>> len('?????')
15
>>> len(u'?????')
5

而是将文本格式设置为Unicode字符串，以便您可以计算代码点，而不是字节：

for word1, word2 in [[u'hello', u'world'], [u'?????', u'??']]:
    print u"{:<20} {:<20}".format(word1, word2)

您的下一个问题是这些字符也比大多数字符宽。您有双倍宽的代码点：

>>> import unicodedata
>>> unicodedata.east_asian_width(u'h')
'Na'
>>> unicodedata.east_asian_width(u'?')
'W'
>>> for word1, word2 in [[u'hello', u'world'], [u'?????', u'??']]:
...     print u"{:<20} {:<20}".format(word1, word2)
...
hello                world
?????                ??

str.format()没有能力处理该问题；您必须先根据Unicode标准中注册的字符数来手动调整列宽，然后再进行格式化。

这很棘手，因为有多个可用宽度。参见东亚宽度 Unicode标准附件 ; 有狭窄，宽阔和模棱两可的宽度；窄是大多数其他字符打印的宽度，宽是我终端上的宽度的两倍。含糊不清...关于实际显示的宽度含糊不清：

模糊字符需要字符代码中未包含的其他信息，才能进一步解析其宽度。

取决于上下文如何显示它们。例如，希腊字符在西方文本中显示为窄字符，但在东亚语境中显示为宽字符。我的终端将它们显示为窄，但是其他终端（例如，配置为东亚语言环境）则可能会将它们显示为宽。我不确定是否有万无一失的方法来弄清楚它是如何工作的。

在大多数情况下，您需要将带有'W'或'F'值的字符计数unicodedata.east_asian_width()为占据2个位置；从您的格式宽度中减去1：

def calc_width(target, text):
    return target - sum(unicodedata.east_asian_width(c) in 'WF' for c in text)

for word1, word2 in [[u'hello', u'world'], [u'?????', u'??']]:
    print u"{0:<{1}} {2:<{3}}".format(word1, calc_width(20, word1), word2, calc_width(20,  word2))

然后在终端中产生所需的对齐方式：

>>> for word1, word2 in [[u'hello', u'world'], [u'?????', u'??']]:
...     print u"{0:<{1}} {2:<{3}}".format(word1, calc_width(20, word1), word2, calc_width(20,  word2))
...
hello                world
?????           ??

您可能在上面看到的轻微对齐错误是您的浏览器或字体对宽代码点使用了不同的宽度比率（不是很两倍）。

所有这些都带有一个警告：并非所有终端都支持East-Asian Width Unicode属性，并且仅以一个宽度显示所有代码点。

推荐阅读

程序员
计算字符串重复SCALA的次数

如何解决《计算字符串重复SCALA的次数》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Ruby 2.3中引入的Array#dig和Hash #dig？

如何解决《如何使用Ruby2.3中引入的Array#dig和Hash#dig？》经验，为你挑选了2个好方法。 ... [详细]
程序员
是否有任何常见的电子邮件客户端预取链接而不是图像？

如何解决《是否有任何常见的电子邮件客户端预取链接而不是图像？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在R中按组省略两个最高值和最低值的行

如何解决《如何在R中按组省略两个最高值和最低值的行》经验，为你挑选了1个好方法。 ... [详细]
程序员
集成在Python中返回数组的函数

如何解决《集成在Python中返回数组的函数》经验，为你挑选了0个好方法。 ... [详细]
程序员
Theano:更改`base_compiledir`以将编译的文件保存在另一个目录中

如何解决《Theano:更改`base_compiledir`以将编译的文件保存在另一个目录中》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何执行线程安全获取然后使用ConcurrentHashMap删除？

如何解决《如何执行线程安全获取然后使用ConcurrentHashMap删除？》经验，为你挑选了2个好方法。 ... [详细]
程序员
Express - 在中间件函数之间传递数据的更好模式

如何解决《Express-在中间件函数之间传递数据的更好模式》经验，为你挑选了1个好方法。 ... [详细]
程序员
Kotlin懒惰的默认属性

如何解决《Kotlin懒惰的默认属性》经验，为你挑选了1个好方法。 ... [详细]
程序员
输入文本框的jQuery悬停事件不起作用

如何解决《输入文本框的jQuery悬停事件不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在忽略文章（A，An，the）的同时对javascript数组进行排序？

如何解决《如何在忽略文章（A，An，the）的同时对javascript数组进行排序？》经验，为你挑选了1个好方法。 ... [详细]
程序员
当多个用户正在查看记录并且1个人更新记录时,如何通知其他记录更新？

如何解决《当多个用户正在查看记录并且1个人更新记录时,如何通知其他记录更新？》经验，为你挑选了0个好方法。 ... [详细]
程序员
UISearchController搜索栏动画第一次很慢

如何解决《UISearchController搜索栏动画第一次很慢》经验，为你挑选了0个好方法。 ... [详细]
程序员
pandas按另一列中的值对列进行排序

如何解决《pandas按另一列中的值对列进行排序》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用python旋转此列表列表

如何解决《如何使用python旋转此列表列表》经验，为你挑选了2个好方法。 ... [详细]
程序员
在向量中向前传递元素的一部分(不循环)

如何解决《在向量中向前传递元素的一部分(不循环)》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何取消评估所需的Ruby文件？

如何解决《如何取消评估所需的Ruby文件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
熊猫情节没有显示

如何解决《熊猫情节没有显示》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在课后删除空元素？(jQuery)

如何解决《如何在课后删除空元素？(jQuery)》经验，为你挑选了1个好方法。 ... [详细]
程序员
保持Ruby中重复元素的数组之间的差异

如何解决《保持Ruby中重复元素的数组之间的差异》经验，为你挑选了1个好方法。 ... [详细]

mobiledu2402852357

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章