7赞

读取数据时如何删除unicode？

作者：凹凸曼00威威_694 | 2023-09-09 10:17

如何解决《读取数据时如何删除unicode？》经验，为你挑选了1个好方法。

我有以下几行Python代码：

trans = data.map(lambda line: line.strip().split())

产生Unicode字符串，例如：

u'Hello',u'word'

我想获取普通的UTF-8或ASCII字符串

'Hello','word'

我试图将字符串转换为UTF-8，例如

trans = data.map(lambda line: line.strip().split().encode("utf-8"))

要么

trans = data.map(lambda line: line.strip().split().encode('ascii','ignore'))

但这给出了一个错误：

AttributeError: 'list' object has no attribute 'encode'

谁能告诉我该怎么做？

更新：

数据是scv文件，trans是RDD

1> zero323..：

为什么不简单地编码和拆分：

data = sc.textFile("README.md")
trans = data.map(lambda x: x.encode("ascii", "ignore").split())
trans.first()
## ['#', 'Apache', 'Spark']

推荐阅读

程序员
在Logstash中解析JSON消息

如何解决《在Logstash中解析JSON消息》经验，为你挑选了0个好方法。 ... [详细]
程序员
将JSON字符串粘贴到Visual Studio中

如何解决《将JSON字符串粘贴到VisualStudio中》经验，为你挑选了1个好方法。 ... [详细]
程序员
从data.frame或data.table构建一个方形邻接矩阵

如何解决《从data.frame或data.table构建一个方形邻接矩阵》经验，为你挑选了2个好方法。 ... [详细]
程序员
大文件和散列 - 性能问题

如何解决《大文件和散列-性能问题》经验，为你挑选了0个好方法。 ... [详细]
程序员
在RHEL中将Cassandra从2.2升级到3.0

如何解决《在RHEL中将Cassandra从2.2升级到3.0》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何设置数据表中的总页数

如何解决《如何设置数据表中的总页数》经验，为你挑选了0个好方法。 ... [详细]
程序员
调整下降区域的气泡破坏

如何解决《调整下降区域的气泡破坏》经验，为你挑选了0个好方法。 ... [详细]
程序员
MySql TIMESTAMP列是自动更新的。为什么？

如何解决《MySqlTIMESTAMP列是自动更新的。为什么？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何增加nodejs的默认内存？

如何解决《如何增加nodejs的默认内存？》经验，为你挑选了3个好方法。 ... [详细]
程序员
a.push()在数组中添加了什么值？

如何解决《a.push()在数组中添加了什么值？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在集合级别的pymongo中添加wiredTiger？

如何解决《如何在集合级别的pymongo中添加wiredTiger？》经验，为你挑选了1个好方法。 ... [详细]
程序员
IAM策略将用户限制为特定VPC中的实例

如何解决《IAM策略将用户限制为特定VPC中的实例》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法运行R代码以模拟随机样本

如何解决《无法运行R代码以模拟随机样本》经验，为你挑选了1个好方法。 ... [详细]
程序员
geom_raster()没有填充,也没有图例

如何解决《geom_raster()没有填充,也没有图例》经验，为你挑选了1个好方法。 ... [详细]
程序员
代码签名.framework时出错

如何解决《代码签名.framework时出错》经验，为你挑选了0个好方法。 ... [详细]
程序员
Tesseract OCR iOS图像格式

如何解决《TesseractOCRiOS图像格式》经验，为你挑选了0个好方法。 ... [详细]
程序员
Simulink模型.slx之间的差异

如何解决《Simulink模型.slx之间的差异》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何禁用VS代码中的代码？

如何解决《如何禁用VS代码中的代码？》经验，为你挑选了4个好方法。 ... [详细]
程序员
如何使用web.config从iis中删除扩展

如何解决《如何使用web.config从iis中删除扩展》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用msbuild从命令行创建应用程序包

如何解决《使用msbuild从命令行创建应用程序包》经验，为你挑选了1个好方法。 ... [详细]

凹凸曼00威威_694

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章