pandas.read_csv中dtype和转换器之间有什么区别？

作者：360691894_8a5c48 | 2023-09-10 19:49

如何解决《pandas.read_csv中dtype和转换器之间有什么区别？》经验，为你挑选了1个好方法。

pandas函数read_csv()读取.csv文件.它的文档在这里

根据文件,我们知道:

dtype:列的类型名称或字典 - > type,default无数据或列的数据类型.例如{'a':np.float64,'b':np.int32}(不支持engine ='python')

和

converter:dict,default无用于转换某些列中的值的函数的字典.键可以是整数或列标签

使用此功能时,我可以调用 pandas.read_csv('file',dtype=object)或pandas.read_csv('file',converters=object).显然,转换器,它的名字可以说数据类型将被转换,但我想知道dtype的情况？

1> EdChum - Rei..：

语义差异dtype允许您指定如何处理值,例如,数字或字符串类型.

转换器允许您使用转换函数解析输入数据以将其转换为所需的dtype,例如,将字符串值解析为datetime或其他所需的dtype.

在这里,我们看到pandas试图嗅探类型:

In [2]:
df = pd.read_csv(io.StringIO(t))
t="""int,float,date,str
001,3.31,2015/01/01,005"""
df = pd.read_csv(io.StringIO(t))
df.info()


Int64Index: 1 entries, 0 to 0
Data columns (total 4 columns):
int      1 non-null int64
float    1 non-null float64
date     1 non-null object
str      1 non-null int64
dtypes: float64(1), int64(2), object(1)
memory usage: 40.0+ bytes

您可以从上面看到001并被005视为int64但日期字符串保持为str.

如果我们说一切都object基本上一切都是str:

In [3]:    
df = pd.read_csv(io.StringIO(t), dtype=object).info()


Int64Index: 1 entries, 0 to 0
Data columns (total 4 columns):
int      1 non-null object
float    1 non-null object
date     1 non-null object
str      1 non-null object
dtypes: object(4)
memory usage: 40.0+ bytes

在这里,我们强制int列str并告诉parse_dates使用date_parser来解析日期列:

In [6]:
pd.read_csv(io.StringIO(t), dtype={'int':'object'}, parse_dates=['date']).info()


Int64Index: 1 entries, 0 to 0
Data columns (total 4 columns):
int      1 non-null object
float    1 non-null float64
date     1 non-null datetime64[ns]
str      1 non-null int64
dtypes: datetime64[ns](1), float64(1), int64(1), object(1)
memory usage: 40.0+ bytes

同样,我们可以传递to_datetime函数来转换日期:

In [5]:
pd.read_csv(io.StringIO(t), converters={'date':pd.to_datetime}).info()


Int64Index: 1 entries, 0 to 0
Data columns (total 4 columns):
int      1 non-null int64
float    1 non-null float64
date     1 non-null datetime64[ns]
str      1 non-null int64
dtypes: datetime64[ns](1), float64(1), int64(2)
memory usage: 40.0 bytes

推荐阅读

程序员
Android:我们如何在xml布局中隐藏/显示浮动操作按钮(fab)

如何解决《Android:我们如何在xml布局中隐藏/显示浮动操作按钮(fab)》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用phonegap或cordova获取当前电池电量？

如何解决《使用phonegap或cordova获取当前电池电量？》经验，为你挑选了0个好方法。 ... [详细]
程序员
IE 11上的鼠标事件属性未定义

如何解决《IE11上的鼠标事件属性未定义》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在CMake中检测到ffmpeg vs libav？

如何解决《如何在CMake中检测到ffmpegvslibav？》经验，为你挑选了1个好方法。 ... [详细]
程序员
MySQL - 选择列+ X>列的行

如何解决《MySQL-选择列+X>列的行》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何确保我的Android应用不会同时访问文件？

如何解决《如何确保我的Android应用不会同时访问文件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何告诉PIT不要改变代码的某些特定部分？

如何解决《如何告诉PIT不要改变代码的某些特定部分？》经验，为你挑选了1个好方法。 ... [详细]
程序员
MPAndroidChart图表填充

如何解决《MPAndroidChart图表填充》经验，为你挑选了1个好方法。 ... [详细]
程序员
数据库文本在PHP while循环中打印两次

如何解决《数据库文本在PHPwhile循环中打印两次》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何覆盖Play的默认Ebean服务器配置？

如何解决《如何覆盖Play的默认Ebean服务器配置？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使phpunit捕获php7 TypeError

如何解决《使phpunit捕获php7TypeError》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在whatsapp中对图像进行子采样/调整大小

如何解决《如何在whatsapp中对图像进行子采样/调整大小》经验，为你挑选了1个好方法。 ... [详细]
程序员
MAX函数与GROUP BY子句一起使用

如何解决《MAX函数与GROUPBY子句一起使用》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在指令中的节点中添加rst格式？

如何解决《如何在指令中的节点中添加rst格式？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用核心javascript时在ajax调用中设置超时

如何解决《使用核心javascript时在ajax调用中设置超时》经验，为你挑选了0个好方法。 ... [详细]
程序员
实体框架6在代码中设置连接字符串

如何解决《实体框架6在代码中设置连接字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
Spring在运行时选择bean实现

如何解决《Spring在运行时选择bean实现》经验，为你挑选了3个好方法。 ... [详细]
程序员
Laravel 5 Auth - 如何在密码重置页面发送电子邮件后输出状态消息

如何解决《Laravel5Auth-如何在密码重置页面发送电子邮件后输出状态消息》经验，为你挑选了1个好方法。 ... [详细]
程序员
连接被拒绝 - 使用DigitalOcean连接(2)"localhost"端口9200

如何解决《连接被拒绝-使用DigitalOcean连接(2)"localhost"端口9200》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在linq where子句中将int与字符串进行比较

如何解决《如何在linqwhere子句中将int与字符串进行比较》经验，为你挑选了1个好方法。 ... [详细]

360691894_8a5c48

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章