18赞

如何在Python中读取Unicode输入并比较Unicode字符串？

作者：低调pasta_730 | 2023-08-31 15:32

如何解决《如何在Python中读取Unicode输入并比较Unicode字符串？》经验，为你挑选了2个好方法。

我在Python工作,想读取Unicode格式的用户输入(从命令行),即相当于Unicode的raw_input？

此外,我想测试Unicode字符串是否相等,看起来标准==不起作用.

1> tzot..：

raw_input()返回由OS或UI工具编码的字符串.困难在于知道哪个是解码.您可以尝试以下操作:

import sys, locale
text= raw_input().decode(sys.stdin.encoding or locale.getpreferredencoding(True))

哪些应该在大多数情况下正常工作.

我们需要更多关于不使用Unicode比较的数据来帮助您.但是,这可能是一个正常化的问题.考虑以下:

>>> a1= u'\xeatre'
>>> a2= u'e\u0302tre'

a1和a2是等价的,但不等于:

>>> print a1, a2
être être
>>> print a1 == a2
False

所以你可能想要使用这个unicodedata.normalize()方法:

>>> import unicodedata as ud
>>> ud.normalize('NFC', a1)
u'\xeatre'
>>> ud.normalize('NFC', a2)
u'\xeatre'
>>> ud.normalize('NFC', a1) == ud.normalize('NFC', a2)
True

如果您向我们提供更多信息,我们可能会为您提供更多帮助.

`text = raw_input().decode(sys.stdout.encoding)`应该是`text = raw_input().decode(sys.stdin.encoding)`它读得更好;)

2> dF...：

它应该工作.raw_input返回一个字节字符串,您必须使用正确的编码对其进行解码以获取unicode对象.例如,以下适用于我在Python 2.5/Terminal.app/OSX下:

>>> bytes = raw_input()
??? ????????
>>> bytes
'\xe6\x97\xa5\xe6\x9c\xac\xe8\xaa\x9e \xce\x95\xce\xbb\xce\xbb\xce\xb7\xce\xbd\xce\xb9\xce\xba\xce\xac'

>>> uni = bytes.decode('utf-8') # substitute the encoding of your terminal if it's not utf-8
>>> uni
u'\u65e5\u672c\u8a9e \u0395\u03bb\u03bb\u03b7\u03bd\u03b9\u03ba\u03ac'

>>> print uni
??? ????????

至于比较unicode字符串:你能发布一个比较不起作用的例子吗？

推荐阅读

程序员
如何使用Email :: Send :: SMTP :: Gmail向多个收件人发送电子邮件

如何解决《如何使用Email::Send::SMTP::Gmail向多个收件人发送电子邮件》经验，为你挑选了1个好方法。 ... [详细]
程序员
字段上的@ConfigurationProperties

如何解决《字段上的@ConfigurationProperties》经验，为你挑选了0个好方法。 ... [详细]
程序员
你如何在Kubernetes上设置Mongo副本？

如何解决《你如何在Kubernetes上设置Mongo副本？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何定义S4方法取对象的反面？

如何解决《如何定义S4方法取对象的反面？》经验，为你挑选了1个好方法。 ... [详细]
程序员
创建一个按钮来运行Javascript

如何解决《创建一个按钮来运行Javascript》经验，为你挑选了1个好方法。 ... [详细]
程序员
jQuery在.hover上获取类的元素

如何解决《jQuery在.hover上获取类的元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么时候文件"可拆分"？

如何解决《什么时候文件"可拆分"？》经验，为你挑选了1个好方法。 ... [详细]
程序员
共享库的cpp文件中的内联函数

如何解决《共享库的cpp文件中的内联函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么不能在箭头功能中访问`this`？

如何解决《为什么不能在箭头功能中访问`this`？》经验，为你挑选了1个好方法。 ... [详细]
程序员
" - +"运算符c#MONO 2.10.12

如何解决《"-+"运算符c#MONO2.10.12》经验，为你挑选了1个好方法。 ... [详细]
程序员
你如何在函数式语言中形式化数字塔？

如何解决《你如何在函数式语言中形式化数字塔？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用map reduce作业将hdfs文本文件转换为镶木地板格式

如何解决《使用mapreduce作业将hdfs文本文件转换为镶木地板格式》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Visual Studio 2015时,TaskAwaiter不实现INotifyCompletion

如何解决《使用VisualStudio2015时,TaskAwaiter不实现INotifyCompletion》经验，为你挑选了1个好方法。 ... [详细]
程序员
R在同一图中绘制多条生存曲线

如何解决《R在同一图中绘制多条生存曲线》经验，为你挑选了1个好方法。 ... [详细]
程序员
Tensorflow多元线性回归不收敛

如何解决《Tensorflow多元线性回归不收敛》经验，为你挑选了0个好方法。 ... [详细]
程序员
模型设计:用户有朋友是用户

如何解决《模型设计:用户有朋友是用户》经验，为你挑选了2个好方法。 ... [详细]
程序员
CMake似乎忽略了CMAKE_OSX_DEPLOYMENT_TARGET

如何解决《CMake似乎忽略了CMAKE_OSX_DEPLOYMENT_TARGET》经验，为你挑选了1个好方法。 ... [详细]
程序员
Mongolab连接错误

如何解决《Mongolab连接错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
ASP.net 5 Web API Post CreatedAtRoute始终返回500内部服务器错误

如何解决《ASP.net5WebAPIPostCreatedAtRoute始终返回500内部服务器错误》经验，为你挑选了0个好方法。 ... [详细]
程序员
numpy,获得最大的子集

如何解决《numpy,获得最大的子集》经验，为你挑选了0个好方法。 ... [详细]

低调pasta_730

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章