我正在尝试使用Google Datalab读取ipython笔记本中的文件,基本的pd.read_csv(),因为我无法找到该文件的路径.我在本地拥有它,并将其上传到桶中的谷歌云存储.
我运行以下命令来了解我的位置
os.getcwd()
给'/content/myemail@gmail.com'
os.listdir('/content/myemail@gmail.com')
给['.git','.gitignore','datalab','Hello World.ipynb','.ipynb_checkpoints']
下面将对象的内容读入一个名为的字符串变量text
:
%%storage read --object "gs://path/to/data.csv" --variable text
然后
from cStringIO import StringIO mydata = pd.read_csv(StringIO(text)) mydata.head()
希望Pandas支持"gs://"
URL(就像s3://
目前允许直接从Google Cloud存储中读取一样).
我发现以下文档非常有用:
https://github.com/GoogleCloudPlatform/datalab/tree/master/content/datalab/tutorials
希望有所帮助(也只是开始使用Datalab,所以也许有人会很快采用更清洁的方法).