我想检查数据框中的列是否由字符串组成,因此我可以用数字标记它们以用于机器学习目的.有些列由数字组成,我不想更改它们.列示例如下所示:
TRAIN FEATURES Age Level 32.0 Silver 61.0 Silver 66.0 Silver 36.0 Gold 20.0 Silver 29.0 Silver 46.0 Silver 27.0 Silver
谢谢=)
是的,它可能.你用dtype
import pandas as pd import numpy as np df = pd.DataFrame({'a': ['a','b','c','d']}) if df['a'].dtype != np.number: print('yes') else: print('no')
您也可以使用dtype选择列 select_dtypes
df_subset = df.select_dtypes(exclude=[np.number]) # Now apply you can label encode your df_subset