-
题名基于语义网的中文百科知识组织与集成
被引量:4
- 1
-
-
作者
付宇新
王鑫
冯志勇
吕雪栋
-
机构
天津大学计算机科学与技术学院计算机科学与技术系
天津市认知计算与应用重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2015年第14期120-126,169,共8页
-
基金
国家自然科学基金(No.61100049
No.61070202)
国家高技术研究发展计划(863)(No.2013AA013204)
-
文摘
通过从3个最大的中文百科全书(百度百科、互动百科、中文维基百科)所包含的大规模知识数据中识别重要的结构化特征生成RDF三元组,并将这些信息数据整合加入分布式大规模RDF数据存储系统,从而构成符合Linked Data要求的中文百科知识库RDF数据集。主要工作包括,通过配置网络爬虫对百度百科和互动百科的网页进行爬取,解析其中信息框等内容,生成RDF三元组并实现三元组的动态插入;下载需要的DBpedia中文三元组数据,将三元组进行整合并存储到课题组的大规模语义数据存储库Jingwei中;设计显示动态插入和三元组模式查询的页面,通过原型系统实验,验证了该方法的有效性。
-
关键词
语义网
资源描述框架(RDF)
中文百科全书
Linked
Open
Data
NUTCH
-
Keywords
semantic web
Resource Description Framework(RDF)
Chinese encyclopedia
Linked Open Data
Nutch
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-