-
题名基于知网的中文结构排歧工具——VXY
被引量:2
- 1
-
-
作者
董强
郝长伶
董振东
-
机构
加拿大智达有限公司
-
出处
《中文信息学报》
CSCD
北大核心
2010年第1期60-64,共5页
-
文摘
该文介绍了基于知网的中文结构排歧工具系列中的一种—VXY。VXY采取了一种独到的排歧技术,对于语言难点采取"定点清除"的策略。它用来解决"V+N+的+N"类型的结构性歧义。VXY是一个自足的、可以现场考核检验的并可以真正付诸实用的系统,而不是仅仅某种方法论的表演或举例性的"游戏"。该文简要地介绍了VXY的组成部分,说明了它的意义计算的原理。同时,该文就如何更有效地利用知网进行结构和语义排歧,如何开辟不同于当前语言信息处理中的"三部曲"(语料标注、现成的计算、应试性的评测)的语言技术等问题进行讨论。
-
关键词
计算机应用
中文信息处理
语义
排歧工具
强支配
中文句法结构
知网
-
Keywords
computer application
Chinese information processing
semantics
disambiguator
strong government
Chinese syntactic structure
HowNet
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名地质领域开放式实体关系联合抽取
被引量:9
- 2
-
-
作者
王智广
文红英
鲁强
申昊锴
-
机构
中国石油大学(北京)计算机科学与技术系
中国石油大学(北京)石油数据挖掘北京市重点实验室
-
出处
《计算机工程与设计》
北大核心
2021年第4期996-1005,共10页
-
基金
国家重点研发计划基金项目(2019YFC0312003)
国家科技重大基金项目(2017ZX05018-005)。
-
文摘
为解决地质领域实体关系类型复杂且缺乏大量标注语料的问题,建立基于句法结构的开放式实体关系联合抽取模型CSSEM(Chinese syntactic structure extraction model)。给出一种基于模式的地质领域实体识别方法,解决地质领域缺乏实体标注语料的问题;基于少量标注语料自动学习关系抽取模式,使用基于句法结构的抽取模式从非结构化文本中开放式地抽取三元组。基于AUC(area under curve)评价标准,CSSEM与其它方法在地质领域和通用领域的数据集上进行对比分析。分析结果表明,该模型在上述两个领域取得了更好的准确率和召回率。
-
关键词
地质领域
句法结构
依存句法分析
实体关系抽取
模式
中文句法结构抽取模型
-
Keywords
geological field
syntactic structure
dependency parsing
entity relation extraction
patterns
CSSEM
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-