聪明文档网

聪明文档网

最新最全的文档下载
当前位置: 首页> 正在进行安全检测...

正在进行安全检测...

时间:2023-09-22 06:50:30    下载该word文档
DBpedia知识库说明文档[摘要]在现有的语义网项目架构中,基于关联数据形式的知识库项目往往处于整个语义网络的核心,如何对于这些知识库的知识容进行组织、储存和查找就成为了决定整个语义网络运行效率的关键因素。在目前的关联数据知识库项目中,DBpedia是较为典型且成熟的一个,DBpedia使用本体的方法来对其条目容进行组织和存储。本文旨在通过对DBpedia现有本体结构的分析来说明知识库的本体结构对于知识库的组织、存储和查找有着怎样的影响,并试图从该例中分析归纳得出类似知识库容的本体构建的一般要点。[关键词]DBpedia关联数据本体本体构建1概述与相关简介1998年,WWW网络的发明者Berners-Lee提出了语义网的概念。这一概念的核心在于致力提高万维网络与其互联的资源的可用性和有效性,使得下一代的互联网更加智能和高效,能够有效处理目前网络中的大量信息容。这一概念和其具体的技术实现几经波折,从一开始的基于本体的构想到2006Berners-Lee提出的关联数据概念,在目前的语义网构想中,关联数据成为了其技术实现的核心概念。关联数据是一种推荐的最佳实践,用来在与以往中使用URIRDF发布、分享、连接各类数据、信息和只是,发布和部署实例数据和类数据,从而通过HTTP协议解释并获取这些数据同时强调数据的相互关联、相互联系以与有益于人际理解的语境信息。在目前的具体实践中,数据往往以RDF文件的形式发布到互联网络上,存储在关联数据知识库中。而大多数需要使用这些关联数据的可以直接从在线关联数据知识库的数据接口获取RDF文件并提取其中的相关信息反馈给用户,从而实现信息和数据的跨共享。从上面不难看出,在线关联数据知识库在当前的关联数据语义网构想中占据着核心位置。DBpedia就是这样一个在线关联数据知识库项目。它从维基百科的词条中抽取结构化数据,以提供更准确和直接的维基百科搜索,并在其他数据集和维基百科之间创建连接,并进一步将这些数据以关联数据的形式发布到互联网上,提供给需要这些关联数据的在线网络应用、社交或者其他在线关联数据知识库。同时,与一些同时期的关联数据知识库项目不同,DBpedia提供的关联数据知识容并不受限于某一较小的专业或学科领域,到2012年为止,DBpedia知识库项目已有超过3640000个条目,这些条目涉与人名、地名、音乐专辑、电影、组织、种族等等多个类目。在大数量和宽围的前提下,DBpedia知识库的条目组织就成为决定其运行效率的关键因素。DBpedia知识库以构建本体的形式对条目进行组织,起到了一定的效果。本体一词是指对客观世界存在的事物的系统描述,在信息科学的领域中,1991Neches等人最早给出的定义是:给出构成相关领域词汇的基本术语和关系,以与利用这些术语和关系构成,规定这些词汇外延规则。1993Gruber将其定义表述为“概念模型的明确的规说明”1997Borst进一步完善了该本体的定义,表述为“共享概念模型的形式化规说明”1/12
增加了“共享”和“形式化”两个限定语。1998Studer等人在对GruberBorst的定义进行了深入研究后,将本体进一步表述为“共享概念模型的明确的形式化规说明”并从此形成了目前信息学界对本体概念比较一致的看法。本文以DBpedia的本体结构为实例,从类与条目属性以与本体结构两个方面,分析DBpedia本体的构建思路。2DBpedia本体的类和条目属性分析如前所述,本体是对共享概念模型的明确的形式化规说明。根据斯坦福大学医学院发本体的构建七步法,构建本体有如下七个步骤:1确定本体的专业领域与畴2考察复用现有本体的可能性3列出本体中的重要术语4定义类和类的等级关系5定义类的属性6定义属性的分面7创建实例但以上所述的七步法仅适用于某一专业或学科领域本体的构建。在DBpedia知识库一例中,由于所需要构建本体的是维基百科条目,因此其专业领域与畴无法简单确定,因此在DBpedia的本体构建中,采用了类似于以叙词表为基础的自动化本体转换的方式。但同样的,维基百科的词条表并非规的叙词表,其类目划分也无法简单归于某一专业分类之下,词语的专指度不可避免的出现不足,因此,在DBpedia的本体构建中,类目划分和定义基本是人工完成,之后的条目转换才使用了自动转换的方式。2.1DBpedia类共有属性分析本体的体系结构主要包括3个要素:核心元素集、元素间的交互作用以与这些元素到规语义间的映射关系。对于本体的一般构造过程,可以用以下公式进行表示:本体=概念Concept+属性Property+公理Axiom+取值Value+名义Nominal从以上的一般公式中,我们还可以归纳出本体当中的基本关系类型,共有四类:1part-of关系,表达概念之间部分和整体的关系2kind-of关系,表达概念之间的集成关系3instance-of关系,表达概念的实例和概念之间的关系4attribute-of关系,表达某个概念是另一个概念的属性2/12

免费下载 Word文档免费下载: 正在进行安全检测...

  • 29.8

    ¥45 每天只需1.0元
    1个月 推荐
  • 9.9

    ¥15
    1天
  • 59.8

    ¥90
    3个月

选择支付方式

  • 微信付款
郑重提醒:支付后,系统自动为您完成注册

请使用微信扫码支付(元)

订单号:
支付后,系统自动为您完成注册
遇到问题请联系 在线客服

常用手机号:
用于找回密码
图片验证码:
看不清?点击更换
短信验证码:
新密码:
 
绑定后可用手机号登录
请不要关闭本页面,支付完成后请点击【支付完成】按钮
遇到问题请联系 在线客服