期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
中文信息抽取研究的文献计量分析
1
作者 刘少俊 《情报探索》 2016年第9期93-97,101,共6页
[目的/意义]分析中文信息抽取技术研究的发展现状,为今后相关研究提供参考。[方法/过程]借助引文分析和共词分析等文献计量方法,对中国知网收录的中文信息抽取文献的年份、作者、机构、内容进行分析。[结果/结论]我国中文信息抽取研究在... [目的/意义]分析中文信息抽取技术研究的发展现状,为今后相关研究提供参考。[方法/过程]借助引文分析和共词分析等文献计量方法,对中国知网收录的中文信息抽取文献的年份、作者、机构、内容进行分析。[结果/结论]我国中文信息抽取研究在1997年起步,2003年进入快速发展期,2007年进入稳定发展期;核心作者较少,研究机构以大学为主;中文信息抽取对象从特定领域或格式限定文本向开放文本发展,使用的模型在增加,应用领域也在不断扩大。 展开更多
关键词 中文信息抽取 文献计量 自然语言处理
下载PDF
基于神经网络的中文谓语动词识别研究 被引量:7
2
作者 李婷 秦永彬 +2 位作者 黄瑞章 程欣宇 陈艳平 《数据采集与处理》 CSCD 北大核心 2020年第3期582-590,共9页
识别谓语动词是理解句子的关键。由于中文谓语动词结构复杂、使用灵活、形式多变,识别谓语动词在中文自然语言处理中是一项具有挑战的任务。本文从信息抽取角度,介绍了与中文谓语动词识别相关的概念,提出了一种针对中文谓语动词标注方... 识别谓语动词是理解句子的关键。由于中文谓语动词结构复杂、使用灵活、形式多变,识别谓语动词在中文自然语言处理中是一项具有挑战的任务。本文从信息抽取角度,介绍了与中文谓语动词识别相关的概念,提出了一种针对中文谓语动词标注方法。在此基础上,研究了一种基于Attentional-BiLSTM-CRF神经网络的中文谓语动词识别方法。该方法通过双向递归神经网络获取句子内部的依赖关系,然后用注意力机制建模句子的焦点角色。最后通过条件随机场(Conditional random field,CRF)层返回一条最大化的标注路径。此外,为解决谓语动词输出唯一性的问题,提出了一种基于卷积神经网络的谓语动词唯一性识别模型。通过实验,该算法超出传统的序列标注模型CRF,在本文标注的中文谓语动词数据上到达76.75%的F值。 展开更多
关键词 谓语动词识别 神经网络 中文信息抽取
下载PDF
基于异构知识库的命名实体消歧 被引量:9
3
作者 宁博 张菲菲 《西安邮电大学学报》 2014年第4期70-76,共7页
针对自然语言处理中的中文命名实体消歧问题,提出一种基于异构知识库的层次聚类方法。利用中文信息抽取系统对中文维基百科等知识库进行抽取,形成包含人物信息、实体关系的实体信息对象,并在Hadoop平台上用分布式计算进行层次聚类,研究... 针对自然语言处理中的中文命名实体消歧问题,提出一种基于异构知识库的层次聚类方法。利用中文信息抽取系统对中文维基百科等知识库进行抽取,形成包含人物信息、实体关系的实体信息对象,并在Hadoop平台上用分布式计算进行层次聚类,研究人物实体特征的选取和维基百科等知识库的使用对命名实体消歧结果的影响。结果表明加入百科知识库后,F值从91.33%增加到了92.68%。 展开更多
关键词 人名消歧 维基百科 中文信息抽取 层次聚类 实体信息
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部