昨天我和一位同事讨论过他使用SSIS(或类似的东西)用SSIS包做一些非常酷的事情的情况,他以"Reginald Williams博士"的名义传递了这个名字.并且基于一些加权方案,该系统足够聪明,可以弄清楚如何对其进行标记并将其存储在数据库中作为"Salutation- First Name - Last Name - Suffix".他抛出了一些流行语,如BI,SSIS,ETL和数据挖掘.我真的想要更多信息,但甚至不知道从哪里开始询问.
我是一名.Net开发人员,精通C#,Vb.Net,WPF等......但是我不知道这些技术是什么,如何将它们添加到我的技能组中,以及它是否是我真的应该关注.任何和所有方向都会有所帮助.
SSIS == SQL Server Integration Services,它是一个Extract Transform and Load(ETL)工具,它是SQL7,SQL2K时代SQL数据转换服务或DTS的优秀实现.它是表达工作流程的绝佳工具,其中数据从A点移动到B点(以及c和d等),并通过该过程进行更改,例如合并到非规范化设计或数据清理.
BI或商业智能是技术领域中整个类别的绰号,它现在是一个很好的地方.BI技能非常有价值且难以获得,其中一个原因是在实验室中很难重新创建真正的BI案例,因此教学几乎总是在现实世界中完成.
从高层次来看,BI项目通常涉及报告的终点.通常作为开发人员,我们习惯于交易报告编写,例如PO的详细信息,但BI可以进入非常广泛的报告,涵盖数十年的产品销售趋势并处理数亿条记录.我们为应用程序设计数据库的方式并不适合这种报告,因此其他工具和技术被发明并用于BI领域.像Cubes这样的东西,你经常听到称为OLAP立方体.OLAP多维数据集通常来自一个数据仓库,它只不过是另一个数据库 - 但是典型的仓库包含来自多个,通常是几十个其他应用程序数据库的数据.您的库存应用,购买应用,人力资源应用程序和其他一大堆都包含创建完整业务图像的大量数据,BI架构师将使用SSIS之类的东西从所有这些系统中提取数据,按摩它并将其存储在数据仓库中它采用不同类型的设计,更适合报告.一旦它进入仓库,他将使用Analysis服务在该数据上创建多维数据集,并使用Reporting Services来显示有关该数据的报告.
编辑:抱歉,忘了数据挖掘,这是另一个非特定的术语,描述和概念或过程,而不是一个工具.在一个简单的例子中,它是一种识别数据模式的有条理的方法.在过去,一个好的业务分析会查看趋势数据但是现代数据库中你所说的数据集太大而无法手动梳理 - 数据挖掘允许你指示计算机梳理这些数据并识别感兴趣的模式.
希望有所帮助