-
题名基于合一句法和实体语义树的中文语义关系抽取
被引量:19
- 1
-
-
作者
虞欢欢
钱龙华
周国栋
朱巧明
-
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2010年第5期17-23,共7页
-
基金
国家863计划资助项目(2006AA01Z147)
国家自然科学基金资助项目(60673041
+3 种基金
60873150)
国家教育部博士点基金资助项目(200802850006)
江苏省自然科学基金资助项目(BK2008160)
江苏省高校自然科学重大基础研究项目(08KJA520002)
-
文摘
该文提出了一种基于卷积树核函数的中文实体语义关系抽取方法,该方法通过在关系实例的结构化信息中加入实体语义信息,如实体类型、引用类型和GPE角色等,从而构造能有效捕获结构化信息和实体语义信息的合一句法和实体语义关系树,以提高中文语义关系抽取的性能。在ACE RDC 2005中文基准语料上进行的关系探测和关系抽取的实验表明,该方法能显著提高中文语义关系抽取性能,大类抽取的最佳F值达到67.0,这说明结构化句法信息和实体语义信息在中文语义关系抽取中具有互补性。
-
关键词
中文语义关系抽取
卷积树核函数
实体语义信息
-
Keywords
Chinese semantic relation extraction
convolution tree kernel
entity semantic information
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于功效特征的专利聚类方法
被引量:2
- 2
-
-
作者
马建红
曹文斌
刘元刚
夏爽
-
机构
河北工业大学人工智能与数据科学学院
天津市科学技术协会
天津科学技术馆
-
出处
《计算机应用》
CSCD
北大核心
2021年第5期1361-1366,共6页
-
基金
科技部创新方法工作专项(2019IM020300)。
-
文摘
当前专利是按照领域划分的,而基于功效特征可以实现跨领域的专利聚类,这在企业创新设计中具有重要意义,而精确提取专利功效特征和快速获得最优聚类结果是其中的关键任务。为此提出一种信息实体语义增强表示(ERNIE)和卷积神经网络(CNN)相结合的功效特征联合提取(FEI-Joint)模型来提取专利文献的功效特征,并且改进自组织神经网络(SOM)算法,从而提出具有早期拒绝策略与类合并思想的自组织神经网络(ERCM-SOM)来实现基于功效特征的专利聚类。对FEI-Joint模型与TF-IDF、狄利克雷分布(LDA)、CNN在特征提取后的聚类效果上进行比较和分析,结果表明其F-measure值比其他模型有明显提高。ERCM-SOM算法与K-Means算法、SOM算法相比,在Fmeasure值提高的同时,其时间较SOM算法有明显缩短。对比使用专利分类号(IPC)的专利分类,采用基于功效特征的聚类方法可实现跨领域的专利聚类效果,为设计者借鉴其他领域的设计方法奠定了基础。
-
关键词
专利聚类
信息实体语义增强表示
卷积神经网络
跨领域
自组织神经网络
-
Keywords
patent clustering
Enhanced Language Representation with Informative Entities(ERNIE)
Convolutional Neural Network(CNN)
cross-domain
Self-Organizing Map(SOM)
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-