在ASCII中,验证名称并不太难:只需确保所有字符都是按字母顺序排列的.
但是在Unicode(utf-8)中呢?如何确保给定字符串中没有逗号或下划线(ASCII范围之外)?
(理想情况下是Python)
也许unicodedata模块对此任务很有用.特别是category()
功能.有关现有的unicode类别,请查看unicode.org.然后,您可以过滤标点字符等.
只需将bytestring(你的utf-8)转换为unicode对象,并检查所有字符是否都是字母的:
s.isalpha()
此方法依赖于语言环境的字节串.