聪明文档网

聪明文档网

最新最全的文档下载
当前位置: 首页> 一种基于JavaWeb的数据挖掘系统功能的设计与实现

一种基于JavaWeb的数据挖掘系统功能的设计与实现

时间:2015-07-28 08:30:22    下载该word文档
2014.No143摘 要 数据挖掘集成应用在现今的网络应用中,是一个非常普遍的课题。本文提出了一种可适用于小型网站的数据挖掘集成应用的系统,此系统是基于JavaWeb的基础而设计并结合实践进行了实际的应用。关键词 数据挖掘 系统集成 小型网站目前信息处理的需求日益增涨,比如电子商务需求,即使是只算中国在2012年Q3财报季度的数据,也都达到了2.05万亿的规模,同比增长38.51%,环比增长9.6%。其中,B2B电子商务市场交易规模达1.7万亿,同比增长30%,网络零售市场交易规模为2943亿元,同比增长36.9%[1]。这种增长率和实际应用的复杂性迫切需要我们去探索适当的、快速的和有效的信息处理解决方案。伴随如此迅猛互联网发展速度,出现了大量的互联网商家,做得大的如京东、凡客等,这些商家都有自己的公司,自己的团队和技术力量,他们不需要也不用从外部获得推广的途径。但还有很多的小商家,他们都是个人创业,没有技术力量,也没有多余的资金,依附于淘宝、ebay、qq网购等商家来发布自己的商品。但是在互联网上,同样的小商家千千万万个,小商家们如何从这些网站中脱颖而出使得购物的用户能够很容易的找到自己的店铺,这就成为小商家面临的最大的问题。现在有很多企业推广解决方案可供选择。但如何结合实际应用这些解决方案是一个具有挑战性的课题,很多完善的企业级推广系统虽然功能完善,集成功能丰富,但是价格非常昂贵,不适合于小型商家使用。本文提出了一种可适用于小型网站的数据挖掘集成应用的系统,主要是使用户能够针对性的找到自己需要的产品或者使商家能够针对性的找到自己的客户。此系统是基于JavaWeb的基础而设计并结合实践进行了实际的应用。1 国内外研究综述1.1 国外研究综述国外对Web服务技术的研究主要分为两个方面,一方面是对Web服务的相关技术和标准本身的研究。包括微软、IBM、SUN 等软件巨头对这一领域表现出了浓厚的兴趣,他们不仅参与了Web服务及其相关标准的制定,而且在Web服务的开发和相应的平台和工具支持方面也遥遥领先。目前己有许多有竞争力的Web 服务框架和开发平台出现,三个主要的竞争者是微软的.NET、IBM的WebServise和SUN的OpenNetEnvironment(NOE)。这些框架都有其自身的侧重点,但有着共同的基本Web服务定义和前景,所有的框架都共用一套技术,主要是SOAP、WSDL和UDDI 等。同时,他们都提供了Web服务应用的开发和集成环境。目前,这些公司正致力于在世界范围内推广Web服务应用。另一方面是对Web服务技术的应用实践,目前已有许多著名的网络企业采用了Web服务技术。著名网络销售商亚马逊发布了一套可以通过两种接口(基于SAOP和HTTP协议)访问的Web服务。通过这套一种基于JavaWeb的数据挖掘系统功能的设计与实现陈 凌(重庆正大软件职业技术学院 重庆巴南 400056)Web服务,用户可以使用程序获取亚马逊提供的各种商品信息,包括产品名称、价格、制造商等。其中集成谷歌搜索功能,搜索的接口是通过SOAP/WSDL实现的,也就是说谷歌己将搜索功能包装成了WEB服务。由此可见,在国外,Web服务技术的研究与应用己经进入了高速发展的阶段,越来越多的商务应用将Web服务作为基础架构,Web服务己成为商务应用解决方案的首选。1.2 国内研究综述信息集成自被提出以来就引起了国内外众多科研人员的关注,已成为当前数据库领域中的重要研究方向。很多研究项目是针对信息集成问题而开展的,如TSIMMIS、Information Manifold、Garlic等系统都对不同的信息源提供了一种统一的集成存取。目前国内外信息集成的主要研究集中在数据集成上,所使用的方法分为两种,一类是以数据仓库技术为核心的物化方法,另一类是以包装器(Wapper)和中间件(Mediators)为核心的虚拟方法。在前一类集成中,所有待集成的数据都被实际存储到数据仓库中,因而对于原有数据库的操作在集成后仍然可以直接使用。由于有实际大批数据的转换和集成过程,这种方法需要耗费较大的时间和空间资源,其最大的缺点是更新不及时和重复存储。在虚拟方法中,中间层不存储任何数据实例,只作为用户和信息源之间的接口,通过查询规划将全局查询转换成信息源上的查询命令。在处理查询时,由于需要访问信息源,所以响应查询一般比较费时,其查询代价较高。由于该方法不需要重复存储大量数据,并能保证查询到最新的数据,因此比较适合于高度自治、集成数量多且更新变化快的异构信息源集成。近年来,由于Web的飞速发展带来了网络信息大爆炸,信息集成开始关注如何集成Web上的信息。虽然Web上的信息从本质上来说结构性较弱,异构并且分散,集成困难度较大,然而由于这种信息载体覆盖的信息面之广、内容之全,超过以往任何一种形式,其信息集成的价值也非同小可,因而逐渐成为研究热点。现有的研究中极少将传统数据集成与Web信息提取结合,事实上这两种数据源对企业而言具有同等重要且优势互补的地位。此外,数据集成作为信息集成的基础受到过多的关注,而业务层次的集成鲜有学者深入。事实上,业务层的集成相对于数据集成而言成本更低,获得的数据更有效,在特定情况下取得的效果则更为显著,其最大的难点在于不同域、不同平台、不同架构之间的互操作。国内对Web服务及其相关技术的研究工作开展的较晚,尚未取得突出的阶段性成果。目前对Web 服务技术的研究主要集中在部分高校的科研机构内,也有一些官方组织如UDDI-China(中国UDDI技术联盟)正致力于在国内推广以UDDI/SOAP为核心的Web服务的实现和应用技术。在Web服务技术应用领域方面,国内目前主要集中在少数企业内部,如一些数据的查询、调用,而涉及跨组织边界的、高安全性、高可靠性的Web服务应用还很不成熟。2 系统设计思路
  • 29.8

    ¥45 每天只需1.0元
    1个月 推荐
  • 9.9

    ¥15
    1天
  • 59.8

    ¥90
    3个月

选择支付方式

  • 微信付款
郑重提醒:支付后,系统自动为您完成注册

请使用微信扫码支付(元)

订单号:
支付后,系统自动为您完成注册
遇到问题请联系 在线客服

常用手机号:
用于找回密码
图片验证码:
看不清?点击更换
短信验证码:
新密码:
 
绑定后可用手机号登录
请不要关闭本页面,支付完成后请点击【支付完成】按钮
遇到问题请联系 在线客服