17赞

Python,从字符串中删除所有非字母字符

作者：oDavid_仔o_880 | 2023-06-15 17:26

如何解决《Python,从字符串中删除所有非字母字符》经验，为你挑选了4个好方法。

我正在编写一个python MapReduce字数统计程序.问题是数据中散布着许多非字母字符,我发现这篇文章从Python中的字符串中删除除字母数字字符之外的所有字符,这显示了使用正则表达式的一个很好的解决方案,但我不知道如何实现它

def mapfn(k, v):
    print v
    import re, string 
    pattern = re.compile('[\W_]+')
    v = pattern.match(v)
    print v
    for w in v.split():
        yield w, 1

我担心我不确定如何使用库re甚至正则表达式.我不确定如何正确地将正则表达式模式应用于传入的字符串(书的行)v以检索没有任何非字母数字字符的新行.

建议？

1> limasxgoesto..：

使用 re.sub

import re

regex = re.compile('[^a-zA-Z]')
#First parameter is the replacement, second parameter is your input string
regex.sub('', 'ab3d*E')
#Out: 'abdE'

或者,如果您只想删除某组字符(因为撇号在您的输入中可能没问题......)

regex = re.compile('[,\.!?]') #etc.

2> Tad..：

如果您不想使用正则表达式,您可以尝试

''.join([i for i in s if i.isalpha()])

3> Kevin..：

您可以使用re.sub()函数删除这些字符:

>>> import re
>>> re.sub("[^a-zA-Z]+", "", "ABC12abc345def")
'ABCabcdef'

re.sub(MATCH PATTERN,REPLACE STRING,STRING TO SEARCH)

"[^a-zA-Z]+" - 寻找不是a-zA-z的任何字符组.

"" - 用""替换匹配的字符

4> Don..：

尝试:

s = filter(str.isalnum, s)

推荐阅读

程序员
Mulesoft转换消息错误:"当前类路径中存在一些错误"

如何解决《Mulesoft转换消息错误:"当前类路径中存在一些错误"》经验，为你挑选了0个好方法。 ... [详细]
程序员
从字符串列表中的拆分字符串创建字典

如何解决《从字符串列表中的拆分字符串创建字典》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何计算Spark SQL中的总百分比

如何解决《如何计算SparkSQL中的总百分比》经验，为你挑选了1个好方法。 ... [详细]
程序员
获取Siri Remote方向(或获取更改通知？)

如何解决《获取SiriRemote方向(或获取更改通知？)》经验，为你挑选了0个好方法。 ... [详细]
程序员
在string []中返回用户所属的所有Active Directory组的列表

如何解决《在string[]中返回用户所属的所有ActiveDirectory组的列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
Xamarin中的Azure移动服务412失败

如何解决《Xamarin中的Azure移动服务412失败》经验，为你挑选了1个好方法。 ... [详细]
程序员
线程参数被更改

如何解决《线程参数被更改》经验，为你挑选了1个好方法。 ... [详细]
程序员
Matlab:消除数据集中的怪异值

如何解决《Matlab:消除数据集中的怪异值》经验，为你挑选了1个好方法。 ... [详细]
程序员
SQL计划编译和真值表

如何解决《SQL计划编译和真值表》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用PHP将单个数组项目推送到另一个数组？

如何解决《如何使用PHP将单个数组项目推送到另一个数组？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在OSX上使用蓝牙LE设备

如何解决《在OSX上使用蓝牙LE设备》经验，为你挑选了0个好方法。 ... [详细]
程序员
原型/对象语句和链遍历需要澄清

如何解决《原型/对象语句和链遍历需要澄清》经验，为你挑选了0个好方法。 ... [详细]
程序员
R - 当我绘制xts和zoo对象时,如何更改日期格式？

如何解决《R-当我绘制xts和zoo对象时,如何更改日期格式？》经验，为你挑选了1个好方法。 ... [详细]
程序员
具有格式化程序的Python日志记录模块会导致AttributeError

如何解决《具有格式化程序的Python日志记录模块会导致AttributeError》经验，为你挑选了1个好方法。 ... [详细]
程序员
与HashMap序列化的NotSerializableException

如何解决《与HashMap序列化的NotSerializableException》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Akka HTTP中将`text/plain`解组为JSON

如何解决《如何在AkkaHTTP中将`text/plain`解组为JSON》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何解决编译器枚举重新声明冲突

如何解决《如何解决编译器枚举重新声明冲突》经验，为你挑选了1个好方法。 ... [详细]
程序员
根据课程对<div>执行操作

如何解决《根据课程对<div>执行操作》经验，为你挑选了1个好方法。 ... [详细]
程序员
application.cfc的问题显示数据源的消息"变量PRIMARYDATASOURCE未定义"

如何解决《application.cfc的问题显示数据源的消息"变量PRIMARYDATASOURCE未定义"》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用带有HttpComponentsClientHttpRequestFactory和RestTemplate的Proxy

如何解决《使用带有HttpComponentsClientHttpRequestFactory和RestTemplate的Proxy》经验，为你挑选了1个好方法。 ... [详细]

oDavid_仔o_880

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章