在Python中创建按字母顺序排序的列表的最佳方法是什么?
基本答案:
mylist = ["b", "C", "A"] mylist.sort()
这会修改您的原始列表(即就地排序).要获取列表的排序副本,而不更改原始列表,请使用以下sorted()
函数:
for x in sorted(mylist): print x
但是,上面的示例有点天真,因为它们不考虑区域设置,并执行区分大小写的排序.您可以利用可选参数key
来指定自定义排序顺序(替代,使用cmp
,是不推荐使用的解决方案,因为它必须多次评估 - key
每个元素只计算一次).
因此,要根据当前区域设置进行排序,请考虑特定于语言的规则(cmp_to_key
是functools的辅助函数):
sorted(mylist, key=cmp_to_key(locale.strcoll))
最后,如果需要,您可以指定用于排序的自定义区域设置:
import locale locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale assert sorted((u'Ab', u'ad', u'aa'), key=cmp_to_key(locale.strcoll)) == [u'aa', u'Ab', u'ad']
最后一点:您将看到使用该lower()
方法的不区分大小写的排序示例- 这些不正确,因为它们仅适用于ASCII字符子集.对于任何非英语数据,这两个都是错误的:
# this is incorrect! mylist.sort(key=lambda x: x.lower()) # alternative notation, a bit faster, but still wrong mylist.sort(key=str.lower)
值得注意的还有这个sorted()
功能:
for x in sorted(list): print x
这将返回列表的新排序版本,而不更改原始列表.
list.sort()
它真的很简单:)
对字符串进行排序的正确方法是:
import locale locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale assert sorted((u'Ab', u'ad', u'aa'), cmp=locale.strcoll) == [u'aa', u'Ab', u'ad'] # Without using locale.strcoll you get: assert sorted((u'Ab', u'ad', u'aa')) == [u'Ab', u'aa', u'ad']
前面的示例mylist.sort(key=lambda x: x.lower())
将适用于仅限ASCII的上下文.
请在Python3中使用sorted()函数
items = ["love", "like", "play", "cool", "my"] sorted(items2)
但是,它如何处理特定于语言的排序规则?是否需要考虑区域设置?
不,list.sort()
是一个通用的排序功能.如果要根据Unicode规则进行排序,则必须定义自定义排序键功能.您可以尝试使用pyuca模块,但我不知道它有多完整.