网站首页 > 管理论文> 文章内容

会议论文]统计数据仓库中可视化决策支持系统的研究

※发布时间:2017-8-31 22:57:58   ※发布作者:habao   ※出自何处: 

  摘 要 在基于统计数据仓库的数据分析阶段,通过可视化决策支持系统(VDSS)的研究和设计,采用面向对象的方法,将VDSS分为方法层,模型层和应用层三个层次,本文通过对统计数据仓库体系中可视化决策支持系统的各层次定义和功能介绍,为数据仓库体系中可视化决策支持系统的建立提供了理论基础和实践依据。

  统计部门是一个重要职能部门,其最主要的任务就是综合统计国民经济的各项数据,作为宏观决策的依据。将大量的业务数据应用于分析和统计原本是一个非常简单和自然的想法,但在实际的操作中,要获得有用的信息非常困难。

  因为业务采用的联机事务处理(OLTP)强调的是密集的数据更新处能和系统的可靠性,并不关心数据分析的方便与快捷。联机分析(OLAP)和事务处理对系统的要求不同,同一个数据库在理论上都难以做到两全。其次业务数据被存放于分散的异构中,不易统一查询访问,而且还有大量的历史数据处于脱机状态,形同虚设。另外,业务数据的模式针对事务处理系统而设计,数据的格式和描述方式并不适合决策者的分析和统计。

  我们在“统计数据仓库”的研发过程中,将数据仓库作为可视化决策支持系统和联机分析应用体系,成功的解决了上述问题。数据仓库是面向主题的、集成的、非易失的、随时间积累的,适合用于为管理者决策过程提供支持的数据集合。

  “统计数据仓库”包括数据准备和处理,数据展示和数据分析三个阶段,前两阶段解决的主要问题是源数据的组织准备、数据抽取装载转换入库、数据在仓库中围绕主题以星型模式存放,通过联机分析服务器,可以转换为的数据立方体,为决策支持服务。数据分析阶段主要是为决策支持提供直接的工具,也可以定义为数据仓库系统的分析层。

  “统计数据仓库”的决策支持分析层由OLAP的查询分析型工具、数据挖掘的挖掘型工具、VDSS的分析预测型工具构成,它们各自的侧重点不同,适用范围和针对的用户也不相同。具备了这三种工具的数据仓库系统,才能真正高效地利用数据仓库中蕴藏的大量宝贵的信息。

  联机分析处理(OLAP)主要通过的方式来对数据进行分析、查询和报表。对用户当前及历史数据进行分析,辅助领导决策,是数据仓库应用的前端工具。数据挖掘是(DM)用非平凡的方法从数据中发现知识。我们在系统中将数据挖掘和数据仓库协同工作,了数据挖掘中数据来源的广泛性和完整性,提高了数据挖掘的工作效率。可视化决策支持系统(VDSS)执行的都是决策和趋势分析类的应用,我们将VDSS中的一些传统统计分析模型,智能决策技术集成到系统中,增强统计数据仓库的分析能力。如人工神经网络在发现行为模式、预测市场行为等方面显示了强大的功能。

  本文我们将重点就“统计数据仓库”体系中的可视化决策支持系统(VDSS)的相关研究进行详细的介绍。

  VDSS模块是“统计数据仓库”体系的重要组成部分,其主要目的是:基于数据仓库中丰富的各类经济数据,利用成熟的定量分析技术构成决策支持模块,对经济指标进行分析、预测和政策分析。

  方法层:在这一层中提供各种定量分析方法,有经济定量分析经验的用户可以自行采用,对数据仓库中大量的数据加以直接分析,构造合适的经济分析方案,这些方案可以构成知识库供模型层智能调用。

  模型层:自动、智能化地调用各种建模工具,配合分析者的经验,集成模型,构成供应用层使用的综合模型。

  应用层:利用综合模型进行经济分析、预测和政策分析,针对用户所需要完成的任务集成数据仓库中的各种数据和模型层中的各种模型,形成定量分析报告。以下对各层的主要内容加以说明。

  这一层次主要包括多种定量分析工具,包括线形回归分析、时间序列分析、神经网络分析、统计分析等目前已经成熟的标准经济定量分析工具,以及针对经济特定部分的特殊分析工具,例如人口数学模型、投入产出分析等等,要求能提供用户以方便易用的用户界面,供政策研究人员灵活应用。其中主要方法包括有:

  线性回归分析(LS):这是经济分析(计量经济学)中最为成熟的分析方法,主要思是:根据实际数据,估计在分析目标(被解释变量)的变动中各种影响因素(解释变量)所起到的作用。在这一领域形成了庞大而规范的数学,是经济学家最常使用的分析工具。这一方法(单方程分析)主要用在因素分析和政策分析上,构成联立方程系统后用来进行预测。

  时间序列分析(TS):这也是经济分析中最为常用的分析之一,利用分析目标(被解释变量)以往历史和主要影响因素(解释变量)的当前和前期水平来解释分析目标。其主要用途是预测,也可用来进行政策分析。

  神经元网络分析(BP):神经元网络分析是一种非参数估计方法,是利用人类神经元网络的工作原理对数据进行分析,构成最能拟和分析目标历史数据的解释方案。这一主要用于预测,工作流程分为两个阶段:学习(训练)和预测。由于神经元网络分析不需要对强的经济关系判断,所以常常用来进行数据挖掘,用来寻找新的经济关系。

  各种方法本身可以直接面对用户,有经验的用户可以借助这些工具对经济系统各方面数据进行深入详细的分析。各种方法的主要软件流程是相似的,可分为四步进行:

  在基本的分析工具上,模型层综合各种分析方法来智能化集成综合模型。其中包括联立计量经济模型(由线性回归的单方程集合构成),多方程时间序列系统以及各种方法构成的综合模型,例如为实现一种分析任务,可能需要构成的综合宏观经济分析模型包括计量经济方程、时间序列、神经元网络和投入产出模型,模型层的核心任务是将各种性质不同的方法综合起来,构成一种完整的整体。界面如下图所示。

  自动寻找对经济指标的最佳分析解释方案,为用户提供参考,并让用户在此基础上能够根据实践经验方便灵活地予以修正调整,构成用户认为最合适的解释方案,并由此得到丰富的分析预测结果。

  自动搜索解释方案库,对经济系统各个重要部分进行描述,综合构成整体经济模型,以描述经济中错综复杂的种种关系。利用构成的经济模型,对经济系统中各方面给出全面深入的各种分析结果,包括因素分析、预测和政策模拟。其中要求系统能自动调用和集成不同类型的分析工具,例如回归分析和投入产出的自动结合。

  利用基本建模工具,由用户或系统自行来对经济各方面定释方案,其中可能利用到彼此差异很大的建模分析方法。由用户指令来激活第一级解释方案,系统自行寻找为了实现这种解释方案而需要进行的更深层的解释方案,这种递归调用解释方案的过程可以由用户来加以控制、修改,以便结合用户经验形成最适当的综合经济模型。

  在这一层中,系统借助自动生成的各种综合模型,为决策支持提供多种分析结果,包括经济效果评估、指标预测、宏观经济形势分析、宏观经济监测、产业结构分析、竞争力评价、投入产出分析、经济增长因素分析以及其他用户感兴趣的分析类别,在自动建模基础上应可以让用户根据自己的需要动态定义新的分析任务和分析方案。主要界面如图所示。

  在这一层次中要进行最上层的任务集成,提供最综合的任务分析功能,在用户启动之后,全自动全智能向下搜索数据仓库中所有相关数据和模型,寻找仓库中最合适的与任务相关的经济系统各方面解释方案和综合模型,给出全面深入的分析结果,供决策者采用。例如,简单的用户命令“预测经济增长率”将全自动调用仓库内各种数据和模型,对相关因素(消费、投资、进出口、财政等等)综合考察,给出全面的分析报告。

  值得说明的是,在这一层中,借助各种建模工具要形成丰富的数据发掘方案,自动寻找经济系统中容易被忽视或者没有现成理论分析结果的关联关系,利用各种手段过滤、筛选大量的数据,给出具有理论和实践意义的关系,为用户提供具有性的分析结果,并提供智能化的数据挖掘界面。

  数据仓库是一项基于数据管理和利用的综合性技术和解决方案,其中在数据分析的关键阶段,最能够体现现有决策者主观能动性的有力工具就是VDSS分析预测型决策支持工具,而VDSS工具内涵过于丰富,直接使用比较笼统。采用我们在“统计数据仓库”体系VDSS的分层划分和定义方法,将会使得数据仓库系统的建设,完善和使用都有十分重要的意义。目前统计数据仓库已经在昆明市统计局正式运行,其中的可视化决策支持系统已经成为昆明市党政机关决策支持系统的重要组成部分。

  推荐:

  

关键词:仓储管理论文
相关阅读
  • 没有资料