-
题名基于网页文本依存特征的人名消歧
被引量:6
- 1
-
-
作者
杨欣欣
李培峰
朱巧明
-
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
-
出处
《计算机工程》
CAS
CSCD
2012年第19期133-136,共4页
-
基金
国家自然科学基金资助项目(60970056
61070123
+3 种基金
61003155)
江苏省自然科学基金资助项目(BK2008160)
高等学校博士学科点专项基金资助项目(20093201110006)
模式识别国家重点实验室开放课题基金资助项目
-
文摘
研究互联网中的人名消歧问题。抽取与网页文本中人名关键字实体相关的依存特征及命名实体等辅助特征,利用二层聚类算法,根据依存特征将可信度高的文档聚类,使用辅助特征将剩余文档加到现有聚类结果中,由此实现人名消歧。实验结果证明,该方法消歧效果优于其他人名消歧方法。
-
关键词
人名歧义
依存特征
人名消歧
命名实体
聚类
-
Keywords
name ambiguity
dependency feature
name disambiguation
named entity
clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名利用优化的DBSCAN算法进行文献著者人名消歧
被引量:10
- 2
-
-
作者
任景华
-
机构
武汉大学新闻与传播学院
昌吉学院中文系
-
出处
《图书馆理论与实践》
CSSCI
北大核心
2014年第12期61-65,共5页
-
文摘
通过对文本聚类算法DBSCAN算法优化对文献著者人名进行消歧,结果表明,相对标准文本聚类算法来说,优化后的算法能取得更好的人名消歧效果。
-
关键词
人名歧义
人名消歧
DB-SCAN
文献著者
-
分类号
G250.74
[文化科学—图书馆学]
-