您的位置:首页 > 电脑网络 > 软件 > sap bw入门

sap bw入门

luyued 发布于 2011-06-03 14:24   浏览 N 次  

  感知艺术,理性品味。

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  今天开始我sap bw学习笔记的第一记,讲一下我这个菜鸟对sap bw的认识。 我以前做过一个bi的项目,其实只是参与开发了一个报表开发与展现的工具,当时对于指标、维度、星形结构、etl都不是很了解。对于sap bw就更加不懂了。经过几天的学习,我熟悉了下bw workbench。写一下我学到的建模初步知识。

  一,sap NetWeaver 和 bi 的概述

  sap NetWeaver是sap退出的soa的一个平台,他可以集成企业需要的应用服务,提供一个开放的服务。sap NetWeaver是所有sap solutions的基础。sap bw 就是该平台提供的一个核心功能。除此之外,他还提供了EP、sap Application server等,他可以提供java引擎,从而可以在上面进行java开发。

  sap bw介绍:sap bw可以处理sap系统的数据和外部系统的数据,他提供了OLAP和bex。bex提供了丰富的报表和分析工具,这些工具包括query、报表和OLAP功能。sap bw提取数据通过source system。ETL是所有bi系统的量比较大的工作,sap bw也不例外。外部数据(非sap系统数据,包括平面文件等)可以方便的抽取到sap bw中。sap bw也为抽取不同的数据,提供了几种接口,db connect,bapi,file,soap等。

  二,sap bw中的对象

  infoPriver:信息提供者是一个在BEx中可以为其创建或执行查询的对象。infoProvider是物理对象,有时是用于报表的逻辑"视图"。DSO和infocube都可以作为infoProvider。

  infocube包含数据表和维度表,数据表里面包含了关键值的值,最多包含233个值。infocube里面最少包含4个维度表,做多16个。其中三个是系统创建,包括:单位维度表、数据包维度表、时间维度表。用户创建的维度表里面放的是sid,这些sid最多与248个特性相连,这就构成了sap 的星形模式。

  sap的星形模式和传统的星形模式是不同的,传统的星形模式是一个事实表关联多高维表。而sap的星形模式是由关键值组成的数据表关联维表,维表里面放的是sid,再通过sid去关联文本,属性,层级主数据。sap 星形结构的优势:

  1,通过自动自动生成的int4类型的sid可以比阿拉伯数字主键更加快速的访问到数据。

  2,查询的性能提高了,因为关键值可以存储在他们自己的事实表里面。

  3,由于使用sid技术通过维表来查找主数据,使得多语言能力等模型成为可能。

  infoObject:信息对象是sap bw的基本单位。infoObject分为,关键值信息对象和特性信息对象。特性关键值可以有属性、文本、层级。特性可以带有导航属性,特性也可以定义为仅属性,仅属性不能作为其他特性的导航属性。sap bw里面的数据时如何从其他系统得到的,本次记录我对这个过程的认识。在sap bw中一个psa,psa是持久数据缓存区,里面放的是和源系统一样的表结构和数据。ETL的作用就是从源系统提取、转换、加载数据到psa中。infoPackage的作用便是执行这个ETL,在infoPackage执行完毕后,可以通过右击psa在管理中查看其内容。对比psa中的数据是否正确。

  在数据加载到psa之后,我们就可以通过转换往dso或者主数据属性、文本、层级里面添加数据了。转换定义了从psa到其目标对象,比如dso的转换规则。而用来执行这个转换的是dtp(data transport process),在一次dtp转换执行完成后我们同样可以通过右击管理目标对象查看其内容,如果目标对象是dso,我们需要对新数据有一个激活操作。在这个操作执行完成后,注意查看激活后对象的内容是否正确,并查看monitor里面是否有错误,有些时候在执行dtp的时候不报错,但在激活新数据的时候会有报错。

  在dww中的左侧菜单中有datasource选项,给出datasource的定义。datasource是用来从源系统中提取加载数据的bi对象。datasource将源系统中提供的数据细分为独立的业务领域。

  psa的相关定义:支持数据转换的存储和处理,通常是临时的,其构造不支持最终用户或工具访问,为ETL提供工作(或暂存)空间而专门创建。看了下EDW,很困惑它和DW的关系。一直以为EDW是DW的增强版,现在明白,原来EDW是DW的一种见面方法。 EDW有三层;

  1,运营数据存储层

  本层的作用是:存储一下实时的数据,里面的数据可以改变,通常由写优化的dso来作为该层。写优化的dso的特点是只有激活表,不需要激活,效率相对较高。

  2,企业数据仓库层

  该层作用:存储海量历史数据,通常不做update操作。由标准dso来做该层。

  3,架构式数据库层

  该层作用:通常由multiProvider和infoCube作为该层。该层可以作为数据集市向外提供数据。

  如果为整个公司建立了EDW层,EDW层可以视为公司的内存,作为整个公司的信息库。因此该层通常被看做企业数据仓库本身。

  EDW的目标:

  1,单点事实:可清晰追踪架构式数据库中评估的每个主数据记录和交易数据的数据流。所有数据必须从源中经过EDW层进入架构式数据库。

  2,完整性:数据未累计,因此以精确结构存储。未覆盖或更改旧版本,但是可添加其他相关信息。

  3,可控的提取和数据加载:仅可一次提取数据,然后用于几个数据库。通常共同使用的数据会一起处理。

  4,可重复的使用性,灵活性:未操作或更改数据,使其适合特定项目范围。数据应该可靠,在将来的项目中可以使用。

广告赞助商