pandas - 在DataFrame中搜索字符

作者：jerry613 | 2023-09-07 10:49

如何解决《pandas-在DataFrame中搜索字符》经验，为你挑选了1个好方法。

我有一个pandas DataFrame(df),我需要搜索分号.我第一次尝试

semicolon_check = df.to_string().__contains__(';'),

但它非常慢,如果是大型DataFrame,我会遇到内存错误.然后我尝试循环遍历列.str,但不是所有列都是字符串,所以每当我到达数字列时,我收到一个错误

AttributeError: Can only use .str accessor with string values, which use np.object_ dtype in pandas

所以我最终得到了这段代码

for col in df.columns: if df[col].dtype == 'O': if df[col].str.contains(r';').any(): print 'found in ' + col

是否有更简单的方法来实现目标？上面的内容虽然按预期工作,但对于像价值搜索这样的基本任务来说似乎有点过分了.

1> EdChum - Rei..：

您可以使用过滤只是字符串列select_dtypes,然后调用apply并传递一个lambda叫str.contains同any:

In [33]:
# create a test df
df = pd.DataFrame({'int':np.arange(5), 'str':['a','a;a',';','b','c'], 'flt':np.random.randn(5), 'other str':list('abcde')})
df

Out[33]:
        flt  int other str  str
0  1.020561    0         a    a
1  0.022842    1         b  a;a
2 -1.207961    2         c    ;
3  1.092960    3         d    b
4 -1.560300    4         e    c

In [35]:
# filter on dtype
test = df.select_dtypes([np.object]).apply(lambda x: x.str.contains(';').any())
test

Out[35]:
other str    False
str           True
dtype: bool

我们可以使用过滤后的df中的columns数组和掩码来过滤cols:

In [36]:
# we can use the above to mask the columns
str_cols = df.select_dtypes([np.object]).columns
str_cols[test]

Out[36]:
Index(['str'], dtype='object')

推荐阅读

程序员
Heroku:运行npm install和gulp build for Django app

如何解决《Heroku:运行npminstall和gulpbuildforDjangoapp》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Browserify在ES6中使用Bootstrap和jQuery包时出错

如何解决《使用Browserify在ES6中使用Bootstrap和jQuery包时出错》经验，为你挑选了1个好方法。 ... [详细]
程序员
Emgu CV 3 findContours和Vec4i类型的层级参数是否等效？

如何解决《EmguCV3findContours和Vec4i类型的层级参数是否等效？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何将constexpr作为模板参数传递？

如何解决《如何将constexpr作为模板参数传递？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android PC上的Android工作室更快吗？

如何解决《AndroidPC上的Android工作室更快吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在class属性中引用类名的最佳方法是什么？

如何解决《在class属性中引用类名的最佳方法是什么？》经验，为你挑选了0个好方法。 ... [详细]
程序员
将Android Studio更新为1.5后出现Gradle错误

如何解决《将AndroidStudio更新为1.5后出现Gradle错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
实际上是否可以从构造微积分中删除"Pi"？

如何解决《实际上是否可以从构造微积分中删除"Pi"？》经验，为你挑选了1个好方法。 ... [详细]
程序员
电话号码正则表达式不适用于swift

如何解决《电话号码正则表达式不适用于swift》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何使docker-compose从远程git存储库构建映像？

如何解决《如何使docker-compose从远程git存储库构建映像？》经验，为你挑选了2个好方法。 ... [详细]
程序员
Swift无法找到并读取属性列表(.plist)文件

如何解决《Swift无法找到并读取属性列表(.plist)文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用BCrypt和Sequelize Model

如何解决《使用BCrypt和SequelizeModel》经验，为你挑选了3个好方法。 ... [详细]
程序员
UICollectionView的自定义焦点引擎行为

如何解决《UICollectionView的自定义焦点引擎行为》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何禁用导航控制器（Swift）中特定视图控制器的自动旋转？

如何解决《如何禁用导航控制器（Swift）中特定视图控制器的自动旋转？》经验，为你挑选了0个好方法。 ... [详细]
程序员
F#通用函数筛选受歧视联合的列表

如何解决《F#通用函数筛选受歧视联合的列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
Visual Studio认为一切都是TypeScript资源

如何解决《VisualStudio认为一切都是TypeScript资源》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在windows中删除sublime中的整行

如何解决《如何在windows中删除sublime中的整行》经验，为你挑选了3个好方法。 ... [详细]
程序员
我相信这是一个与其构造函数抛出的放置new-expression相关的clang中的错误

如何解决《我相信这是一个与其构造函数抛出的放置new-expression相关的clang中的错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
GSON JsonElement.getAsString与JsonElement.toString？

如何解决《GSONJsonElement.getAsString与JsonElement.toString？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么jsfiddle给我错误"SyntaxError:Unexpected token:"？

如何解决《为什么jsfiddle给我错误"SyntaxError:Unexpectedtoken:"？》经验，为你挑选了1个好方法。 ... [详细]

jerry613

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章