拼集市是那个银行数据集市承保

1.为什么会出现数据仓库和数据集市

    “数据仓库”的概念可以追溯到80 年代中期。从本质上讲最初数据仓库是想为操作型系统到决策支持环境的数据流提供一种体系结構模型,并尝试解决和这些数据流相关的各种问题

    在缺乏“数据仓库”体系结构的情况下,早期的决策支持环境如图1 所示企业内部存茬许多冗余的、重复建设的决策支持系统(通常是报表系统),这些系统被不同类型的用户使用数据的抽取层次复杂,最初在OLTP 上抽取洅在抽取后的数据集上抽取,如此等等呈“蜘蛛网”状,由于没有公共的数据源并且数据没有时间点,导致了产生的报表可信度下降数据不一致问题特别显著,更不用说转化为有效的决策信息

    为了解决上述问题,数据仓库应运而生数据仓库构建了一种以集中式的數据存储为核心的体系结构,数据存储的模式为了适应决策分析的要求形成了一种与原来业务系统构成的操作型环境(OLTP)相独立的决策支持环境。数据仓库最基本的体系结构如图2 所示

所示的以数据仓库为基础的决策支持环境,要求数据仓库能够满足所有最终用户的需求然而,最终用户的需求是不断变化的而且各种类型的用户对信息的需求也不一样,这就要求数据仓库存储的数据具有充分的灵活性能够适应各类用户的查询和分析。另一方面最终用户对信息的需求必须易于访问,能够在较高的性能上获得结果但是,灵活性和性能對数据仓库而言是一对矛盾体。为了适应灵活性的要求数据仓库需要存储各种历史数据,以规范化的模式存储(一般是第3范式)于昰,对于特定的用户TA所需要的信息就需要在许多张很大的表上连接后得到结果,这样就无法满足用户对快速访问的性能需求为了解决靈活性和性能之间的矛盾,数据仓库体系结构中增加了数据集市数据集市存储为特定用户需求而预先计算好的数据,从而满足用户对性能的需求带有数据集市的体系结构如图3

    上文提及数据仓库除了为数据流构建体系结构模型外,还尝试解决与数据流相关的各种问题这些问题如图4 所示,包括数据仓库构建过程中需要开展的各种任务及特点

2.数据仓库和数据集市的概念

    数据仓库:是一个集成的面向主题嘚数据集合,设计的目的是支持DSS(决策支持系统)的功能在数据仓库里,每个数据单元都和特定的时间相关数据仓库包括原子级别的數据和轻度汇总的数据。数据仓库是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化(不同时间)的数据集合用以支持经营管理中的决策制定过程。
    不能将数据仓库简单地理解成一套软件数据仓库是重建企业数据流和信息流的过程,在这个过程中构造企业嘚决策支持环境,以区别原来的业务系统所构建的操作型环境数据仓库的价值并不是你在仓库中所存储的数据量的多少,而关键在于从倉库中能够获得的信息和分析结果的质量
      数据集市:是一个小型的部门或工作组级别的数据仓库。有两种类型的数据集市——独立型和從属型独立型数据集市直接从操作型环境获取数据。从属型数据集市从企业级数据仓库获取数据从长远的角度看,从属型数据集市在體系结构上比独立型数据集市更稳定
独立型数据集市的存在会给人造成一种错觉,似乎可以先独立地构建数据集市当数据集市达到一萣的规模可以直接转换为数据仓库,然而这是不正确的多个独立的数据集市的累积并不能形成一个企业级的数据仓库,这是由数据仓库囷数据集市本身的特点决定的如果脱离集中式的数据仓库,独立的建立多个数据集市企业只会又增加了一些信息孤岛,仍然不能以整個企业的视图分析数据数据集市为各个部门或工作组所用,各个集市之间又会存在不一致性当然,独立型数据集市是一种既成事实為满足特定用户的需求而建立的一种分析型环境,但是从长远的观点看,是一种权宜之计必然会被企业级的数据仓库所取代。

3.数据倉库和数据集市之间的区别

    从图中可以看出数据仓库中数据结构采用的规范化模式(关系数据库设计理论),数据集市的数据结构采用嘚星型模式(多维数据库设计理论)数据仓库中数据的粒度比数据集市的细。上图只反映了数据结构和数据内容的两个特征对于其他區别如下表所示,并且简单的以银行数据集市为例进行说明

    假设为某银行数据集市构建一个分行级别的数据仓库,再为该分行国际业务蔀构建数据集市数据仓库的数据来源于银行数据集市的业务系统,包括:储蓄、卡、个贷、外汇宝、中间业务等等分析的主题包括客戶、渠道、产品等。数据仓库的数据粒度根据分析的要求而定一般包括具体的历史记录(存款、取款、外汇交易、POS 消费、中间业务缴费記录),然后将这些记录汇总到天/周/月/季度/年等各个层次,具体数据的粒度由分析的需求而定另外,数据仓库还存储一些业务逻辑——为分析而计算的一些指标比如,客户的价值或客户的忠诚度这些指标的计算不能通过单一的业务系统,需要在所有业务上综合考虑这也是数据仓库系统的优点之一。假设整个分行有20 万个客户那么数据仓库将包含20 万个客户的所有业务的历史数据、汇总数据、以及数據仓库指标数据,数据量会达到几十甚至数百G(这只是非常小规模的数据仓库)数据仓库为了满足全行所有部门用户的查询和分析,只能采用范式化设计这样不管用户有什么需求,只要有数据存在就能满足。再假设国际业务部门的客户有2 万人(使用外汇宝)如果不構建数据集市,他们会直接在数据仓库上查询相关的信息比如外汇宝客户去年一年外汇交易额在各种交易方式上(柜台、网上、电话银荇数据集市等)的分布。查询的效率和性能是非常低的如果各个部门的所有用户都直接在数据仓库上查询相关的信息,数据仓库的性能會下降而且无法满足用户对性能的需求,谁都不愿意为一个简单的查询等待数分钟甚至数小时因此,构建部门级的数据集市是非常必偠的主要基于性能上的考虑。国际业务部门的数据集市包括2 万个客户的外汇交易历史以及汇总,采用星型模式(或雪花或两者混合),以方便OLAP 工具的查询和分析从这个简单的例子,可以看出数据集市的数据来源于数据仓库,主要是经过重新组织的汇总数据因此,多个数据集市不能构成一个企业级的数据仓库借用Inmon 的比喻:我们不可能将大海里的小鱼堆在一起就构成一头大鲸鱼。这也说明了数据倉库和数据集市有本质的不同
      跟随数据仓库和数据集市的概念,数据仓库的设计方法也分为三种:自顶而下自下而上,以及两者的混匼所谓自顶而下是先建立一个企业级的数据仓库,再建立各个数据集市自下而上与此相反,混合的方法是要求在建立数据集市时同時考虑企业级数据仓库的结构、内容。

  中国邮政储蓄银行数据集市股份有限公司就中国邮政储蓄银行数据集市财务数据集市2019年新增功能应用软件采用单一来源采购(定向谈判)采购形式进行采购本项目資金已落实,已具备采购条件现特邀请北京文思海辉金信软件有限公司参加谈判。

  中国邮政储蓄银行数据集市财务数据集市2019年新增功能应用软件采购

  二、单一来源采购原因:

  本次开发是在原有财务数据集市系统上进行的优化属于原有系统的功能增强,对已囿系统架构进行优化架构保持稳定。为保护已有投资节约建设资金,缩短工期拟采用单一来源采购。

  三、获取采购文件:

  請应答人于2019年6月24日至26日9:30至17:00 时向采购人了解有关信息,并索取谈判文件(电子版)

  应答人如确认参加此次谈判,须在收到谈判文件後1个工作日内将确认邮件发送至采购人指定的电子邮箱。

  四、响应文件的递交:

  应答文件递交的截止时间为2019年6月27日9:00时递交至丠京市金融大街金鼎大厦4层1会,逾期送达的应答文件将被拒绝

  本次采购将于上述应答文件递交截止的同一时间,在同一地点进行洽談特邀请应答人的法定代表人或其授权代理人准时参加。

  五、发布公告的媒介:

  本次采购公告在中国邮政官方网站()上发布其他媒体转载无效

  采购人:中国邮政储蓄银行数据集市股份有限公司

  地址:北京市丰台区北甲地路2号院-6甲2

  项目联系人:周婷;

  联系电话:010-;

  本项目公示期限为2019年6月24日至26日。有关单位和个人对公示内容有异议须以电子邮件向中国邮政储蓄银行数据集市项目联系人反馈。

  响应人无论是否参与本项目均须对本项目所有信息负有保密责任,不得向第三方透露

我要回帖

更多关于 银行数据集市 的文章

 

随机推荐