当前位置:  开发笔记 > 大数据 > 正文

以下字段是什么:'totalSize'和'rawDataSize'在hive中的DESCRIBE EXTENDED查询输出中表示什么?

如何解决《以下字段是什么:'totalSize'和'rawDataSize'在hive中的DESCRIBEEXTENDED查询输出中表示什么?》经验,为你挑选了1个好方法。

如果在任何配置单元表上运行DESCRIBE EXTENDED命令,则结果会在输出结尾附近显示totalSize和rawDataSize值.

这些字段意味着什么?

例如:

hive > DESCRIBE EXTENDED 

Output Results:

Table(tableName:TablenameXXXXX, dbName:XXxXXX,
..........       .......................
numRows=116429472, totalSize=3835205544, rawDataSize=35040221600})

Durga Viswan.. 10

rawDataSize是原始数据集的大小,totalSize是它所需的存储量.它适用于ORC文件格式,因为它压缩数据totalSize将小于rawDataSize.



1> Durga Viswan..:

rawDataSize是原始数据集的大小,totalSize是它所需的存储量.它适用于ORC文件格式,因为它压缩数据totalSize将小于rawDataSize.


如果是Parquet格式,则rawDataSize仍小于totalSize,但是怎么可能呢?拼花格式应压缩原始数据。我很困惑
推荐阅读
可爱的天使keven_464
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有