期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于字符级截断式循环神经网络的人名国籍识别
1
作者 张钰莎 张礼明 蒋盛益 《模式识别与人工智能》 EI CSCD 北大核心 2019年第4期369-375,共7页
人名是反映用户国籍的关键信息,不同国籍的人名在结构和组成成分方面存在差异性和关联性。目前,基于人名的国籍识别研究工作大部分将人名切分成多个独立的字符单元,忽略字符间微妙的搭配和序列关系。针对上述问题,文中提出基于字符级截... 人名是反映用户国籍的关键信息,不同国籍的人名在结构和组成成分方面存在差异性和关联性。目前,基于人名的国籍识别研究工作大部分将人名切分成多个独立的字符单元,忽略字符间微妙的搭配和序列关系。针对上述问题,文中提出基于字符级截断式循环神经网络的人名国籍识别模型,将人名通过滑动窗口的方式截断成多个子序列,利用长短期记忆单元模型学习不同子序列内部的字符组合关系,通过平均池化操作聚合所有子序列信息,获取最终的人名向量表示。最后根据该人名向量实现用户的国籍识别。截断式的子序列有利于模型更关注人名内部的细微差异。在Olympic运动员和Aminer学者数据集上的实验表明,文中模型性能较优。 展开更多
关键词 国籍识别 用户画像 字符级表示模型 循环神经网络
下载PDF
基于细粒度词表示的命名实体识别研究 被引量:15
2
作者 林广和 张绍武 林鸿飞 《中文信息学报》 CSCD 北大核心 2018年第11期62-71,78,共11页
命名实体识别(NER)是自然语言处理中的一项基础任务,其性能的优劣极大地影响着关系抽取、语义角色标注等后续任务。传统的统计模型特征设计难度大、领域适应性差,一些神经网络模型则忽略了词本身所具有的形态学信息。针对上述问题,该文... 命名实体识别(NER)是自然语言处理中的一项基础任务,其性能的优劣极大地影响着关系抽取、语义角色标注等后续任务。传统的统计模型特征设计难度大、领域适应性差,一些神经网络模型则忽略了词本身所具有的形态学信息。针对上述问题,该文构建了一种基于细粒度词表示的端到端模型(Finger-BiLSTM-CRF)来进行命名实体识别任务。该文首先提出一种基于注意力机制的字符级词表示模型Finger来融合形态学信息和单词的字符信息,然后将Finger与BiLSTM-CRF模型联合进行实体识别,最终该方法以端到端、无任何特征工程的方式在CoNLL 2003数据集上取得了F1为91.09%的结果。实验表明,该文设计的Finger模型显著提升NER系统的召回率,从而使得模型的识别能力显著提升。 展开更多
关键词 命名实体识别 端到端模型 字符表示模型 注意力机制
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部