-
题名基于多源异构数据的市政管理知识库构建
被引量:2
- 1
-
-
作者
佟明川
陈明锐
许斌
钟东来
张淑征
-
机构
海南大学信息科学技术学院
清华大学信息科学技术学院
-
出处
《海南大学学报(自然科学版)》
CAS
2016年第3期228-236,共9页
-
基金
国家863计划(2013AA01A607)
海南省社会发展科技专项(2015SF32)
-
文摘
为了满足市政管理领域对数据权威性和体系完备性的高要求,实现市政管理领域知识库的自动化构建,笔者提出了一种基于多源异构数据的市政管理知识库构建模型.采用自顶向下的构建模式,完成对结构化关系型数据、半结构化文本数据和互联网数据在内的多源异构数据自动化知识抽取,最后设计了一个轻量级示例系统,并对该方法的执行效果进行了评估.实验结果表明,本方法在市政管理领域的知识库构建上优势明显,能够实现对多种市政管理资源的自动化知识抽取,所生成的概念体系完整清晰,知识描述恰当准确.
-
关键词
智慧城市
市政管理
多源异构数据
自动化知识抽取
领域知识库构建
-
Keywords
smart city
municipal management
heterogeneous data
domain knowledgebase construction
auto-matic knowledge extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于句法分析的文本定义抽取方法
被引量:2
- 2
-
-
作者
张淑征
陈明锐
许斌
钟东来
佟明川
-
机构
海南大学信息科学与技术学院
清华大学计算机系
-
出处
《海南大学学报(自然科学版)》
CAS
2016年第2期105-111,共7页
-
基金
海南省社会发展科技专项(2015SF32)
国家863课题(2015AA015401)
-
文摘
提出了一种基于句法分析的特征提取方法,该方法将对句子成分进行分析,并将其作为特征集的一部分进行实验.实验证明,将句子成分分析结果加入特征集中进行定义的抽取,有较好的正确率和召回率.
-
关键词
特征提取
定义抽取
句法分析
-
Keywords
feature extraction
definition extraction
Syntactic analysis
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于非线性全局上下文的词嵌入
被引量:3
- 3
-
-
作者
刘永彬
欧阳纯萍
钟东来
李涓子
袁博志
李奇
-
机构
南华大学计算机学院
清华大学计算机科学与技术系
-
出处
《中国科学:信息科学》
CSCD
北大核心
2015年第12期1588-1599,共12页
-
基金
国家重点基础研究发展计划(973计划)(批准号:2014CB340504)
国家自然科学重点基金(批准号:61533018)
+2 种基金
国家自然科学青年基金(批准号:61402220)
国家自然科学基金中法合作项目(批准号:61261130588)
中国博士后基金(批准号:2014M550733)资助项目
-
文摘
针对当前词表示方法中的上下文的局限性,文章提出了一个基于非线性全局上下文的词表示方法.该方法主要分为两步骤,首先利用维基百科的排歧页,对文档中的当前词进行排歧处理,以此来提高词表示的效果.然后,再针对传统词表示方法中的线性局部上下文问题,利用依存和共指关系对语料进行分析,得出基于非线性全局上下文的词表示向量.文章选取英文维基百科数据集作为实验语料,在定性分析方面,该方法可以找到更接近当前词义的相关词,因对多义词进行了排歧处理,词表示结果上明显好于其他的方法.在定量比较方面,通过在Word Sim-353数据集上对比实验表明,该方法在Spearman相关系数上比其他方法高出5%~10%以上.
-
关键词
非线性全局上下文
共指消解
词义排歧
词向量
词嵌入
神经网络
深度学习
依存关系分析
-
Keywords
nonlinear global context
coreference resolution
word-sense disambiguation
word vector
word embedding
neural networks
deep learning
dependency parsing
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-