-
题名基于信息关联拓扑的互联网社交关系挖掘
被引量:3
- 1
-
-
作者
刘锦文
邢凯
芮伟康
张利萍
周慧
-
机构
中国科学技术大学计算机科学与技术学院
中国科学技术大学苏州研究院
苏州工业园区疾病防治中心
-
出处
《计算机应用》
CSCD
北大核心
2016年第7期1875-1880,共6页
-
基金
国家自然科学基金资助项目(61332004)
苏州市科技计划项目产业技术创新专项(民生科技)(SS201509)~~
-
文摘
针对目前基于监督学习的关系抽取方法需要标注大量训练数据和预先定义关系类型,提出了一种基于词语共现信息构建关联网络并在关联网络上进行图聚类分析的人物关系提取方法。首先,从新闻标题数据获得关联度较高的500个人物对用于关系抽取研究;然后,抓取关联人物对所在新闻数据,对其进行预处理,并利用词频—逆向文档频率(TF-IDF)得到人物对共现句子中的关键词;其次,基于词语共现信息得到词语之间的关联,进而建立关键词关联网络;最后,利用对关联网络进行图聚类分析以获得人物关系。在关系抽取的实验中,与传统基于词语共现和模式匹配的中文实体关系提取方法相比,所提方法在准确率、召回率和平衡F分数(F-score)上分别提升了5.5,3.7和4.4个百分点。实验结果表明,所提算法能够在没有标注训练数据的条件下,有效地从新闻数据中抽取丰富且高质量的人物关系数据。
-
关键词
社会关系抽取
共现统计
词语关联度
关联网络
图聚类
-
Keywords
social relation extraction
co-occurrence statistics
word correlation
correlation network
graph clustering
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于主题的Web人名抽取系统的设计与实现
- 2
-
-
作者
何婧瑗
尹美娟
金晓燕
-
机构
信息工程大学信息工程学院
[
-
出处
《信息工程大学学报》
2010年第6期700-704,共5页
-
文摘
从社会关系抽取的角度出发,设计了一个基于主题的Web人名抽取系统。该系统可根据给定的主题获取相应的Web文档,并从中抽取出与该主题相关的中英文人名,从而为基于主题的Web社会关系抽取提供有效的数据支撑。
-
关键词
社会关系抽取
Web文档获取
人名抽取
-
Keywords
society relation extraction
web documents obtainment
personal name extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-