客户问我"数据仓库"一词的含义是什么.
我想到了ETL,数据模型的细节,与NoSQL,云,"正常"DBMS,MDM(主数据管理)等的差异,但无法用几句话向他描述这个术语......(In事实上,我做了一些谈话,让他没有照亮.)
如何在1-3(或多一点)句子中描述"数据仓库"?
对于非技术人员来说,最好将其描述为"存储在专用计算机系统中的大量数据.数据通常与某些特定域相关,整个系统设计为快速并针对某些特殊任务进行优化.数据存储在数据中仓库主要用于分析或决策过程."
不确定这是否足够:)互联网上有很多关于这个主题的引用,但如果有人问我快速定义,我会使用类似于我上面写的内容.
来自维基:
数据仓库是组织电子存储数据的存储库,旨在促进报告和分析1.
数据仓库的这个定义侧重于数据存储.但是,检索和分析数据,提取,转换和加载数据以及管理数据字典的方法也被认为是数据仓库系统的基本组成部分.许多对数据仓库的引用都使用了这种更广泛的上下文.因此,数据仓库的扩展定义包括商业智能工具,提取,转换和加载数据到存储库的工具,以及管理和检索元数据的工具.
至少在理论上,数据仓库的想法是提供来自各种现有系统的数据的统一视图,通常认为这些数据不能直接合并数据进行重写.因此,数据仓库从那些现有系统收集数据,并提供(至少是幻觉)所有数据在一个地方,因此可以以一种方式查询.
主要目的是(通常)允许来自现有系统的数据之间的相关性.例如,您可以比较销售人员与客户X(存储在一个系统中)花费的时间与购买的客户X的数量(存储在第二个系统中)以及客户X对他们接收的内容的满意程度(存储,当然,在第三个系统中).
从实践的角度来看,它通常意味着客户的想法介于定义不明确和完全疯狂之间.成本和时间表几乎不可能被猜测,并且显然不可能做出可靠的估计.提供他真正想要的东西几乎肯定是不可能的,找出一些有用的东西是需要花费足够的时间和工作,你的第一步就是让你所做的声音足够技术化他不会有一颗心当他了解成本和/或时间表时发动攻击.