我想知道在caffe中使用的lmdb文件是否比包含原始图像的文件大得多的原因.你能帮我解释一下吗?
这是很难给出一个具体的答案,这样一个抽象的问题,但我会试试看:
图像文件通常被压缩:一个.png
或.jpg
尺寸的h
通过w
由3
时间比小得多的磁盘空间h*w*3
,由于压缩字节.另一方面,为了处理神经网络(或任何其他ML软件)中的图像,您需要使用图像的未压缩表示.因此,lmdb
,leveldb
,hdf5
在通过使用存储CAFFE输入图像数据集无压缩使用32位浮点数对于每个像素(而不是方式uint8
),因此在文件大小急剧增加.