八文_文档搜索
 
设为首页   |  加入收藏夹
 八文网 - 汇聚八方文档 - 做最优秀的免费文档下载网站
 

数据分析代理(DAA)模式研究与实践

文档类型: Adobe Acrobat PDF 文档 文档大小:101.05KB
数据分析代理(DAA)模式研究与实践潘旭伟1,顾新建1,邵晨曦1,韩永生2,程耀东1(1.浙江大学现代制造工程研究所杭州;2.中国科学院软件研究所北京)
摘要:在介绍了数据分析代理的概念后,提出了数据分析代理模式的体系结构,讨论了在不同类型企
业中数据分析代理的具体应用模式:企业内代理模式和企业外代理模式,对比分析了数据分析传统模式和代理模式二者之间特点、最后举例说明了数据分析代理模式在企业中的具体实践.
关键词:网络;数据仓库;数据分析代理;XML
0 引言计算机和信息技术的快速发展,企业建立了各种应用系统,如销售系统,库存系统,财务系统,人事系统等、积累了大量数据.随着市场竞争的日趋激烈,企业需要对积累的数据进行分析,为企业决策提供支持、以便获得竞争优势.目前为决策提供数据分析支持的通常方法是企业建立数据仓库,在数据仓库基础上进行OLAP分析,数据挖掘等数据分析应用,在此将这种方式称为传统数据分析模式[1.传统数据分析模式目前在金融[2,保险[3,电信[4]等行业的许多大型企业获得了较好应用.
但这种方法对企业来讲投入大,技术要求高,对于多数资金并非很雄厚,信息技术队伍不强的制造企业来说存在一定困难.数据分析代理(Data Analyze Agent, DAA)的概念就是在这样的背景下提出的.数据分析代理是通过第三方的数据分析提供商为各个客户(需数据分析的企业)提供数据分析服务的一种数据分析应用模式,客户只需向提供商提供基础数据和业务数据后就可获得分析之后的结果,而数据分析提供商则是进行所有的数据分析工作,其基本原理可用图1表示.网络技术的深入发展和应用,特别是统一数据交换语言XML(eXtensible Markup Language, XML)的出现[5,又为数据分析代理的实现提供了坚实技术基础.数据分析客户数据分析提供商初始数据分析结果图1 数据分析代理的基本原理
1 数据分析代理模式的体系结构数据分析代理支持各种不同客户的数据分析,所以其对应的技术体系结构应通过公共接口支持获取各种不同数据格式的数据并且以客户要求的数据格式将分析结果提交给客户.在强大的XML开放数据交换标准的支持下,数据分析代理体系结构应有效的获取和集成各种客户数据,并把数据及时的传递到目的地.为使用户更好的分析和利用数据,支持多维分析的OLAP工具应在合适的地方得以应用.图2是数据分析代理模式的体系结构.在该结构中、客户通过公共Web接口将数据提交给数据分析提供商,并获取他们所需的分析结果.下面对体系结构中的各个层次进行说明.
在客户应用层,客户一方面把需要分析的数据经过一定的处理(如从数据库中导出增量数据到一定格式的文件)提交给分析提供商,另一方面,他们通过浏览器(如IE)访问分析结果.客户与分析提供商通过公共的Web接口将二者有机的连接起来.为实现对客户各种不同的数据进行处理,需要数据的统一交互,而XML作为一种统一的数据
基金项目:国家自然科学基金资助项目国家863计划项目(2002AA
作者简介:潘旭伟(1977),男,浙江缙云,浙江大学现代制造工程研究所博士研究生,主要从事商务智能,知识管理,先进制造技交互格式,对数据的表示是与具体应用无关的.正是由于XML与应用无关的特性,使其日趋成为各种异构系统之间数据交互首选格式.为实现各种异构数据格式向XML数据格式的转换,需要XML转换器来实现.XML转换器包括二
部分:(1)从客户明细格式到统一格式的转换;(2) 从统一格式到客户明细格式的转换.总之,XML转换器的根本目的在于实现客户异构数据到统一数据格式的相互转换,从而便于代理商对数据的统一处理.为使客户数据得以保存不丢失,代理商需要构建大型数据(仓)库来存储数据.因此需要相关的数据加载工具将从客户处得到的XML格式的数据加载到数据(仓)库.为更有效的对数据进行如统计分析等数据分析处理活动,引入多维数据集市.多维数据模型将数据组织成为层次结构来表达各个层次的数据,这使得多维数据模型比目前大量使用的关系数据模型对数据的表达更为清晰.多维数据模型的主要应用是联机分析处理(On-Line Analyze Process, OLAP).OLAP支持下钻(drill down),上卷(roll up),切片(Slice)和旋转(dice)等基本的多维数据操作.数据预处理公共的Web接口Web服务器传入的客户格式数据传出的客户格式数据XML转换客户格式到统一格式的数据转换统一格式到客户格数据加载代理商数据仓库多维数据集市数据分析处理查询与处理结果客户分析应用客户应用客户与提供商的交互点数据格式转换处理数据分析查询处理数据存储与管理图2 数据分析代理模式的技术体系结构在从关系型数据模型和多维数据模型中查询数据的方法不尽相同.对于关系型数据库,查询数据通过结构化查询语言(Structured Query Language, SQL),如下所示:
select from and and and 而对于多维数据模型的查询可以采用多维表达式 eXpression, MDX)[6.MDX支持多维对象与数据的定义和操作.如同SQL 查询一样,每个MDX 查询都要求有数据请求(SELECT 子句),起始点(FROM 子句)和筛选(WHERE 子句).这些关键字以及其它关键字提供了各种工具,用来从多维数据集析取数据的特定部分.如上述的SQL功能在多维数据模型中可以
采用如下方式:
Select [Measures[Store Sales] on columns, [Store[Sales_country] on rows from sales where([Promotion[Media_Tpye[Internet[Region[Sales_country[China])在上述的二个表达式中可以看到,MDX比SQL表达式更加简单和清晰.当用户的要求变化时,在OLAP的数据立方体(Cube)中只有很少一部分需要变化以适应用户需求的改变.从这个角度来看,MDX只需作最少的改动,而SQL表达式则有可能需要完全更新以适应新的要求.
不管是从关系型模型还是多维模型中获取得到数据,都可能针对用户的需求作进一步的分析,如汇总分析,关联分析,聚类分析等.这些功能与查询数据一块交由数据分析处理模块来完成.
2 数据分析代理的应用模式数据分析代理在面对具体情况时,主要有二种应用模式:企业内代理模式和企业外代理模式.
2.1 企业内代理应用模式企业内代理模式一般在大中型企业中应用.一般大中型企业都有一些相对独立的分支机构,如企业在各地建立的销售公司、物流中心等、这些分支机构在一般业务处理上具有相对独立性.所谓企业内代理模式就是指总公司为这些分支机构提供数据分析代理服务,降低各个分支机构在数据分析上的巨大投入,同时保证更高的数据分析水平.此时,总公司成了数据分析服务提供商,而分支机构就是客户.这样,各个分支机构在获取各自数据分析结果同时,由于数据全部集中在总公司、分支机构还可以获得其他一些信息,如各个物流中心可以获得总公司的库存信息等.当然,在许可的情况下,还可以获得其他分支机构的信息,以利于更好的决策.
2.2 企业外代理应用模式企业外代理模式一般针对中小型企业.中小企业自身建立数据分析系统,由于资金,技术和人员等多方面的约束,存在一定难度.在这种情况下,通过第三方的数据分析服务提供商为自己进行数据分析,能够获得比较满意的结果.对于数据分析提供商,可以通过行业代理促进数据分析向深度方向发展,而通过区域代理促进数据分析的向广度方向发展,最终集成二种代理模式,形成数据分析代理模式的正反馈机制,促进数据分析代理模式的良性发展,见图3.
行业代理深度发展区域代理广度发展集成代理深度和广度同时发展图3 数据分析代理的深度和广度发展
3 数据分析代理模式的优势与挑战对用户来说,采用数据分析服务代理模式的优势是明显的,数据分析代理和传统数据分析模式的对比见表1.表1 数据分析代理和传统数据分析模式的对比比较内容传统模式代理模式应用范围大中型企业大中小企业应用模式自建分析系统由提供商建立分析系统投入高低技术要求高低建设周期长短维护复杂简单数据量大小对于表中的前面二点在上述已经有所阐述,在此对其他的几个方面进行说明:
(1) 投入:传统模式下,企业对数据分析系统的投入主要包括:①硬件系统;②软件系统;③开发投入;④维护投入.大量的中小企业在面对这些投入时望而却步.而采用代理模式之后,企业只需向提供商提供必要的分析服务代理费用即可.
(2) 建设周期:目前在一般的数据分析项目都需要1~2年的时间,原因是多方面的,其中很大一部分时间用于培养企业的一支数据分析团队来完成数据分析任务.而在采用代理模式之后,由于是一支专业队伍、其在数据分析领域的方法,技术方面相对成熟,当然其实施进度也就会极大的加快.
(3) 技术要求:数据分析是一项技术要求比较高的项目,其技术主要包括:①数据分析体系结构的规划和设计;②数据抽取,转换和加载(Extract, Transformer, Load, ETL)技术;③数据仓库设计和开发技术;④前端应用开发.采用数据分析代理模式之后,这些工作都交由提供商完成,所以对企业本身的技术要求明显降低.
(4) 维护:采用数据分析代理模式之后,企业本身只需对数据上传部分进行维护,而其他部分的维护工作都交给提供商.
(5) 数据量:采用代理模式之后,大量的分析数据交给了分析服务代理商.在这种情况下,企业一般只需保留半年到一年的业务数据量,其他的历史数据都交给了提供商存储和管理.而企业自建数据分析系统,则至少需要保存2~3年的历史数据.数据分析代理模式比传统模式具备上述的优势同时,也面临许多新的挑战:
(1) 信任与安全问题数据越来越成为企业的核心要素,并且是企业的重大机密.把涉及自身机密的数据交给一个代理商来管理和分析对企业来讲是一个重大的考验.这就关系到数据分析提供商的信用问题,如何向客户保证并实践着诚信这一基本商业原则是提供商能否赢得客户,也是数据分析代理模式能否得以推广和应用的重要保证.而在另一方面,企业分析之后的数据在网络上传输,如何使这些数据和信息不受非正常的网络攻击而使数据落入竞争者之手也是在数据信任和安全的另一个考验.
(2) 需求分析问题在数据分析和数据仓库的实践中、需求具有很强的不确定性,所以在总结数据分析和数据实施的经验中、强调开发过程的多次循环和迭代.而在采用代理模式之后,提供商与企业之间由于地理上位置,费用等因素影响、增加了多次迭代的难度困难,所幸的是,通信技术和协同工程的不断深入发展,应该为远程之间需求的迭代过程提供强有力的支持.
(3) 网络传输问题由于数据分析在网络上需要传输大量的数据和信息,客户也需要通过网络获取数据分析结果.而一般来讲,数据分析结果的数据量是比较大的,如何使这些分析结果能快速的返回给客户也是一个问题.过慢的速度会使客户不能接受.网络技术的快速发展,宽带逐渐的成为主要的网络传输方式之后,网络传输速度慢的问题有望不会成为数据分析代理的障碍.图4 基于DAA模式数据分析示例
4 应用实例宁波某大型服装公司、在我国男性服装、特别是西服和衬衫的生产和销售处于全国领先.该公司在多年的企业发展过程
中、在全国建立了30多个区域中心、一百五十几家分公司、二千多家销售网点、实现全国范围的物流配送和销售.2000年在各个网点、分公司和区域中心成功应用了分销管理系统,到目前积累了一定量的数据.为了进一步提高客户服务水平,降低库存,总公司决定为这些区域分公司提供数据分析支持.在数据分析代理思想的指导下,各个区域,分公司和网点将相关的数据传回到公司总部,由公司总部的数据分析部门对这些数据进行分析,并及时将分析结果反馈给下属的区域,分公司和网点.图4是基于Web的一个数据分析界面.目前该系统运作良好,并在该公司全国的区域,分公司和网点得到有效应用,正对物流配送和销售产生积极作用.
5 结论数据分析代理是通过第三方的数据分析提供商为各个客户企业提供数据分析服务的一种数据分析应用模式.该模式的技术体系结构主要包含公共Web接口,XML转换器,数据(仓)库,数据分析处理等模块.针对不同的企业,数据分析可以采用企业内和企业外代理二种模式.数据分析代理模式比传统的数据分析模式相比对企业在资金,技术和维护等多方面的投入有明显优势,但也存在信任与安全,需求分析和网络传输等新的挑战.数据分析代理要实现行业和区域的集成代理,促进数据分析代理向深度和广度二个方向同时发展,形成正反馈机制.
参考文献:
[1] Jiawei Han and Micheline Kamber. Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers, Inc.
[2] R.C. Higgins. Analysis for Financial Management. [3] Gabriel Fuchs and Martin Zwahlen. Whats So Special About Insurance Anyway. DM Review, August 2003.
[4]R.Mattison. Data warehousing and data mining for Artech house,1997[5] The World Wide Web Consortium (W3C). Extensible Markup Language (XML) 1.0 (Second Edition).
[6] Microsoft Corporation. MDX (Analysis Services (SQL Server)).
Research and Practice on Mode of Data Analysis Agent (DAA)
Pan Xu-wei1, Gu Xin-jian1, Shao Cheng-xi1, Han Yong-sheng2, Cheng Yao-dong1(1. Institute of Contemporary Manufacturing Eng, Zhejiang Univ, HangzhouChina;
2. Institute of Software, Chinese Academy of Science, BeijingChina)
Abstract: After the concept of Data Analysis Agent (DAA) was introduced, the architecture of DAA wasprovided and the application modes of DAA in different companies were discussed. Then the conventional mode and agent mode of data analyze were described. Finally, the practice of DAAin one company was demonstrated.
Key words: Network; Data Warehouse; Data Analysis Agent; XML
pdf文档的标签: 模式 实践 数据分析 研究 代理
更多推荐标签: 英文居住证明   手机设计论文   安全意识论文   园林预算   安全事故案例   个人独资企业   市场推广制度   频度英语   长期债权投资   农艺师   物理教学改革   监控可行性   商法学笔记   转正自我鉴定   电气报告   软件使用分析   虚拟现实技术   农村物价调查   性别问题论文   科技先进   体育调查表   科学与和平   设计文字   岗位职责大全   设计丙级资质   社会概论学   学英语的目的   性心理学概论   高压电气试验   劳务协议  
相关文档推荐
数据互联(金牌)代理合同
分析专栏:从美国制造业数据看
高中信息技术课程评价模式的研究
BB宽带业务模式案例分析
开放式实验教学模式的探索与实践
腾讯公司电子商务模式分析
"小公民道德银行运作模式的研究
萨提尔模式家庭探源团体疗效研究
科学数据库元数据分析与应用
电子商务商业模式的研究
电子商务商业模式的研究
希若数据虚拟主机--代理价格表
电子商务商业模式的研究
案例分析举例:贾厂长的管理模式
B2C模式下网络消费者满意的研究
基于网络的合作学习模式的研究方案
电影与学科课堂教学整合模式研究
需求分析2 模型数据处理界面
样本与数据分析初步
电子商务商业模式的研究
推荐文档下载
请用印刷体填写下列信息
云南民族大学物理与电子电气信息工程学院
合肥学院政治辅导员岗位职责
崛起大学城
最佳男歌手奖
中国冶勘总局一局党委保持员先进性教
计算机文化和应用技术
管理信息系统答疑精华
教学系统设计
Word之邮件合并基础教程
第六届全球智能控制与自动化大会
科建远程多媒体教学系统
天津天药药业股份有限公司
国立中央大学讲座设置办法
经济法试题
关于组织苏州科技学院校园网络短信大赛的通
研究所学位考试费用支付标准(校本部)
中共海南大学委员会组织部
劳动合同法出台背景下
初二(4)班
 
文档下载提示:
·最新免费文档下载、毕业论文免费下载、Word文档下载、Excel表格下载、PDF电子书下载、PowerPoint提案下载
·所有文档均为网友上传,仅供学习参考,用作其它用途时请征得相关权益人许可.
·八文网只提供文档共享平台,不对文档内容的正确性及相关内容所引发的后果负责.
·如此文档"数据分析代理(DAA)模式研究与实践"涉及您的权益,请附上网址来信告知web_8wen(#)126.com,本站将认真配合并改正。
Copyright ©2005-2008 八文网-  8Wen.com . All rights reserved.