SAP BusinessWarehouse,简称SAP BW,是SAP公司所推出的企业级数据仓库(Enterprise Data Warehouse,简称EDW)管理软件,其管理的对象是企业的各种业务交易类数据,以支持业务分析、报表展现、业务预测和计划等应用场景。随着大数据技术和解决方案的日益成熟,曾有人说:Enterprise data warehouse is dead, long live big data(企业数据仓库已死,大数据永生),似乎EDW就不再需要了。近年来,随着AI技术的兴起,又有人断言:Big data is dead, long live AI(大数据已死,AI永生)。这年头,吸引眼球也好,搞噱头也好,总是会有这样或那样的断言。对于数字化从业人员来说,我们应该用辩证的观点来看这些断言,而不要被断言所迷惑。实际上,判断EDW或大数据是否真的已经死了,我们首先要认识清楚企业运营会涉及到哪些数据,以及这些数据的特点。我们知道,从数据的存在形式和格式等方面看,企业经营所涉及到的数据有结构化数据、半结构化数据和非结构化数据,三者之间的差别可参考下表1:

如表1所示,简要来说,结构化数据在形式上比较单一和精确,其管理方式比较规范和死板,可以做精确型的统计性分析;非结构化数据则在形式上相对多样和模糊,其管理方式比较多变和灵活,只能做分类、特性、标签等模糊型计算;半结构化数据则居于结构化和非结构化数据之间。在企业运营中,结构化数据主要指的是业务交易型数据,企业通常用ERP、CRM、PLM等管理系统或数据仓库来管理结构化数据;非结构化数据的涉及面则更广,除了内部的会议纪要、技术资料、产品图片等文件数据,也包括外部的资讯、客户投诉、市场活动等数据;半结构化数据则包括通过设备的PLC、物联网传感器、社交媒体等所获得设备运行数据、智能互联资产数据、社交媒体流数据,等等。作为企业的数据仓库,SAPBW中所管理的主要是与企业运营有关的结构化数据,管理的方法或过程主要包括数据建模、数据获取、报表和分析,以及数据周期管理、数据安全管理,等等。数据建模就是定义某些规则和要求,以将数据实现结构化管理。以SAP BW/4HANA为例,数据建模的实体主要有InfoObjects、Advanced DSO(ADSO)、CompositeProviders和Open ODS View,后三者的功能基本类似,都是InfoProvider(信息提供者),所不同的是其数据管理的实现方式。InfoObjects是最基本的信息构件,是ADSO、CompositeProviders等其他数据建模实体的基础。在SAP BW/4HANA中,有四种类型的InfoObjects:特性(characteristic)、关键值(key figure)、单位(unit)和XXL。如果要做类比的话,特性描述的是业务背景或维度,类似于事物的when、where、what或who;关键值则代表业务交易或活动的度量,类似于事物的how many 或how much;单位用于度量比较的标准参考,类似于事物how many或how much的计量单位;XXL则用于长文本或字段的存储,类似于事物的balabalabalbala……ADSO类似于数据建模中的物理层,用于各种场景的数据保持。ADSO通常由三张表组成:内向表(inbound table)、活跃表(active table)和变更表(change table),SAP BW/4HANA可以根据数据保持的场景需求,来决定上述三张表是如何生成及相互影响的。Open ODS View是SAP BW/4HANA中代表外部数据源的元数据对象,它主要充当数据的虚拟层(外部数据源的数据虚拟化),在外部数据源和InfoObjects等之间建立联系。Open ODS View的外部数据源可以是多样的,可以是SAP HANA表,也可以是存储在外部数据库的第三方表。CompositeProvider类似于数据建模中的逻辑层,其作用是将来自不同数据集的数据组合起来;比如,部分数据来自ADSO型的数据集,部分数据来自Open ODS View型的数据集。为了用于报表和分析,CompositeProvider所用到的组合方法有union或join等SQL操作。除了使用上文所述的InfoObjects为基本单元或构件来进行数据建模,SAP BW/4HANA还支持基于字段(field-based)的数据建模,以拿来即用(as-is)的方式,灵活、敏捷地使用外部数据源的数据,而无需做数据的提取或集成。SAP BW/4HANA中数据建模的原则是less is more(少即多),并采用基于Eclipse的UI界面,以贴合大多数软件工程师的操作习惯。这里说句题外话,SAP近10年的技术路线日渐开放,在程序开发等方面都支持JAVA等主流语言,笔者有时在想,HANA的名称也许就是SAP公司的技术大牛从JAVA中得到的灵感(JAVA à HANA)。大体上,数据建模类似于盖房子时的框架搭建,数据获取类似于墙体砌砖、空间布局、硬装、软装,等等。数据获取的过程主要就是所谓的ETL。不管是数据的全量提取还是增量更新,有了数据后就可以针对数据做分析和报表展现,以及数据使用中的安全管理,等等,这其实也是BI的部分工作。本文不是专门的技术贴,就不对SAP BW/4HANA中数据获取、报表和分析等技术和操作细节做详细的介绍。企业之所以对各种数据进行有效管理,就是希望通过数据的运算和分析,从数据中“挖矿”,这就牵涉到两种形式的数据分析:因果性分析和相关性分析。因果性分析,指的是通过数据分析,以找到事物与事物之间的因果关系。假设有两个事物:A 和B,事物A发生或出现后,事物B就一定会发生或出现;或者说,如果 A 为真,B为真的概率为100%;那么,A与B之间就存在因果关系,A是因,B是果。在企业的经营管理活动中,事物之间的因果关系可以用于业务预测和业务计划;换句话说,只有A和B之间存在因果关系,企业才有可能通过A的发生来预测或计划B的发生。在实践中,A类似于企业的经营管理活动,B类似于企业所期望的经营结果。相关性分析,指的是通过数据分析,以找到事物与事物之间的相关关系。假设有两个事物:A和B,它们有的时候会同时存在;有时先发现了A的存在,然后又发现了B的存在;有时是先发现B的存在,然后又发现了A的存在;或者说虽然分不清楚孰先孰后,但两者会有伴随关系。虽然分不清孰先孰后,或者说这种伴随现象不必是100%的概率,我们就说A和B存在相关性;如果伴随的概率比较大,达到超过50%,那就可认为A和B之间存在强相关。相关性分析也可以帮助企业做业务建议、预测和计划,只不过确定性不如因果关系那么确定。如果将结构化数据、半结构化数据和非结构化数据等三种数据类型,与因果性分析和相关性分析等两种数据分析方法进行联系,我们会发现,因果性分析一般需要有结构化数据或半结构化做支撑,而相关性分析在半结构化或非结构化数据的基础上就可以进行。另外,还应该看到,作为数据分析的两种方法,因果性分析和相关性分析之间不是替代关系,不是说有了因果性分析就不需要相关性分析,或者说有了相关性分析就不需要因果性分析。实际上,因果性分析和相关性分析是现实实践中数据分析在可行性等方面的不同权衡和现实选择,两者更应该是相互补充。根据数据的DIKW(Data-Information-Knowledge-Wisdom)价值路径,企业数据管理的首要目标是“知”,即,对自己、对环境、对市场、对同行知道得越准确、越具体、越全面和越及时,企业做出高质量经营管理决策的可能性就越大。另外,企业要获得所谓的“知”,还要考虑其是否经济的问题,因为任何企业都做不到不计成本地去做数据的收集和分析等数据管理工作。在实践中,企业的“知”在准确性、够具体、全面性、及时性和经济性等方面不可得兼。举例来说,为了做到尽可能地准确、具体和全面,在及时性和经济上就可能打折扣;尤其是及时性太差的“知”,即使很准确、很具体、很全面,其价值可能还远远不如相对准确、相对具体、相对全面但及时性很好的“知”。因此,企业的“知”,必须针对不同的应用场景,在准确、具体、全面、及时和经济等方面做适当的权衡。一般来说,企业对于自身的“知”,对于自身的产品、研发、销售、生产、物流、财务等的“知”,在有PLM、ERP、CRM、MES等IT系统的应用和支持下,可以在“知”的准确、具体、全面和及时等方面做到更高程度的得兼;而企业对于外部环境、市场、对同行的“知”,因为数据获取和分析的难度比内部要大得多,那就要首先确保“知”的准确、具体和及时,再寻求尽可能地全面和经济。如果将数据的类型、因果性分析和相关性分析、“知己”和“知彼”等数据管理的不同角度综合起来看,我们基本可以明确的是,企业可以通过以结构化数据为主的因果性数据分析,以实现更好地“知己”;可以通过以非结构化数据为主的相关性分析,以实现更好地“知彼”。如上所述,作为企业数据仓库,SAPBW主要以结构化数据的建模、获取、分析和应用为主,在因果性分析和企业的“知己”型应用场景上应该大有作为。那种认为Enterprise Data Warehouse is deal, long live big data;或是big data is data, long live AI之类的论调,如果不是为了吸引眼球的炒作,那就是娶了媳妇忘了娘,就是看到了“矛”却忘记了“盾”。另一方面,必须看到的是,大多数企业的SAP BW项目都没有完全发挥出其应有的价值,尤其是她们大多只把SAP BW作为报表和分析的平台,而没有将之用于业务计划和预测等高价值的商业场景,没有把SAP BW作为企业数据资产管理的平台,没有从数据资产化,资产服务化,服务价值化的角度去使用已经掌握的数据。也许正因为此,SAP公司才把SAP BW作为SAPIBP、SAP BPC等商业套件的技术和数据支撑,那其实也为SAPBW的应用深化指明了方向。尺有所长,寸有所短;一寸一寸强,一寸短一寸险。任何事物都有其两面性,都有其擅长和不擅长的,我们不能片面或走极端,而是要辩证地看问题,那也就不会被Xxx is dead,long live xxx之类的论调所迷惑。随着时代的发展和技术的进步,在企业的数字化建设征程中,肯定会不断涌现出各种各样的新技术、新工具,我们也要定期地更新自己的数字化技术栈。但是,更新技术栈时,不是一味地抛弃已有的,而是要合理地继承,并在继承的基础做创新。作为企业级数据仓库,SAP BW也在不断地演进,如果能将其用在合适的场景,用在企业的因果性分析、业务规划和预测等领域,就一定能起到其应有的、更好的效果。
免责声明:文章报告仅代表作者观点,版权归原作者所有。因转载众多,或无法确认真正原始作者,故仅标明转载来源,部分文章报告推送时未能与原作者取得联系,十分抱歉。如来源标注有误,或涉及作品版权问题烦请告知,我们及时予以更正/删除。