这些术语遍布各地,我不知道清晰的定义.我很确定我知道数据集市是什么.我使用Business Objects和Cognos等工具创建了报表多维数据集.
我也有人告诉我,datamart不仅仅是一组立方体.
我也有人告诉我,datamart是一个报表多维数据集,仅此而已.
你理解的区别是什么?
Cube可以(并且可能应该)表示非常具体的东西 - 通过OLAP服务器(如MS Analysis Services或Oracle(nee Hyperion)Essbase)呈现的OLAP工件.但是,它也会被松散地使用.这种OLAP多维数据集使用多维数据集感知查询工具,这些工具使用与标准关系数据库不同的API.通常,OLAP服务器维护自己的优化数据结构(称为MOLAP),尽管它们可以作为关系数据源(称为ROLAP)的前端或各种混合模式(称为HOLAP)实现.
我尝试具体并使用'cube'专门用于引用OLAP服务器上的多维数据集,例如SSAS.
Business Objects的工作原理是通过一个或多个源(可能是关系数据库,OLAP多维数据集或平面文件)查询数据,并创建一个称为MicroCube的内存数据结构,用于支持交互式切片和骰子活动.Analysis Services和MSQuery可以创建一个多维数据集(.cub)文件,该文件可以由AS客户端软件或Excel打开,并以类似的方式切片和切块.IIRC最新版本的Business Objects也可以打开.cub文件.
为了迂腐,我认为Business Objects位于真正的OLAP系统(如ProClarity)和特殊报告工具(如Report Builder,Oracle Discoverer或Brio)之间的"半结构化报告"空间中.查询面板的往返使得它作为纯粹的思想流OLAP工具有点笨拙,但它确实提供了传统报告所没有的交互水平.我认为Business Objects的最佳位置在于两个地方:工作人员的临时报告不一定熟悉SQL,并提供以交互格式提供的预定报告,这些报告允许深入研究数据.
"数据集市"也是一个相当松散的术语,可以指数据仓库系统的任何面向用户的数据访问介质.该定义可能包括也可能不包括报告工具和元数据层,报告层表或其他项目,如多维数据集或其他分析系统.
我倾向于将数据集市视为完成报告的数据库,特别是如果它是整个数据仓库体系结构中易于定义的子系统.但是,将其视为面向用户的报告层是非常合理的,特别是如果存在允许最终用户直接获取数据的特定报告工具(如Business Objects或OLAP系统).
术语"数据集市"已变得有些含糊不清,但它传统上与组织信息系统的面向主题的子集相关联.数据集市并未明确暗示存在多维技术(如OLAP),数据集市并未明确暗示汇总数值数据的存在.
另一方面,立方体倾向于暗示使用多维命名法(通常是OLAP技术)呈现数据,并且数据通常被概括为多个层次结构的交叉点.(即你的家庭的净值与你的个人净值以及介于两者之间的所有东西)通常,"立方体"意味着非常具体的东西,而"数据集市"往往更为一般.
我想在OOP说你可以准确地说数据集市"有一个"立方体,"有一个"关系数据库,"有一个"漂亮的报告界面等等......但是说任何一个都不太正确那些单独的"是一个"数据集市.数据集市一词更具包容性.