我是商业智能的新手.
我刚刚被一家公司聘用,以完成他们的网络解决方案,实施BI模块.经过大量的阅读,我想我可以了解BI流程的样子,你会发现我对BI流程的看法.
您能告诉我这是否是对所有工作流程的正确看法?如果没有,请纠正我.另一个问题,我无法在架构中看到数据挖掘的位置,如果需要,我应该在哪里使用它?
非常感谢,
以下是您可能需要考虑的几点:
表示层是Excel还是Web服务是否正确?如果您想部署Web报告平台(如SSRS,Cognos,Business Objects,Microstrategy等),该怎么办?这些平台通常直接访问数据而无需Web服务.
您可能需要将其他数据输出到平面文件和下游数据库.数据可以基于OLAP多维数据集或原始源数据.因此,您可能希望将这些作为目标包含在主数据仓库级别和OLAP级别.
如果您实现Web表示层,它可能不仅仅是在OLAP多维数据集上.您可能会收到报告未包含在OLAP多维数据集中的数据的请求,并且可能不值得为了支持一些报告而添加它.如果是这种情况,那么您可能需要注意主数据仓库可能是Web报告平台的来源 - 而不仅仅是OLAP.
数据集市通常不包含聚合数据 - 它们通常包含详细级数据.OLAP多维数据集对详细数据执行聚合,但底层数据集市本身包含事务级事实.
您可以拥有ETL过程导入的其他数据源,例如Web服务.您可能还想强调有多个数据库和平面文件,就像您强调可以有多个数据集市和OLAP多维数据集一样.
您不一定需要OLAP多维数据集的单独数据集市.如果要构建一个中央数据仓库,则可以创建一个中央OLAP多维数据集,并根据多维数据集安全角色限制对维度和数据切片的访问.
您可能希望在加载数据仓库之前指示需要加载登台数据库.也许情况并非如此,但通常我建议使用单独的临时数据库,以便在合并到数据仓库之前有一个可以加载的地方.有些ETL进程可以直接进入数据仓库,因为它们可以在进入时合并,但是有很多实例在将数据合并到最终目标之前将数据加载到临时数据库中可能是有意义的.这也意味着ETL /存储过程可能应该是图中自己的实体,因为它是一种移动数据的方法,而不是目标或对象.如果查看图表,所有实体都是实际对象,而不是MDX等进程.
您可能希望通过ETL过程指示数据已加载到数据集市中.ETL不只是加载数据仓库 - 它是关于在任何阶段移动数据.即使处理多维数据集也需要ETL过程.
您的OLAP服务器不一定必须位于另一台物理服务器上 - 它可能是数据库服务器上的服务.它取决于您是通过扩展或扩展来解决性能问题,还是由于地理性能问题而打算将多维数据集发布到多个OLAP服务器.