期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
一种与分词一体化的中文人名识别方法 被引量:2
1
作者 高红 黄德根 杨元生 《计算机工程》 CAS CSCD 北大核心 2006年第19期9-10,13,共3页
提出了一种与分词一体化的人名识别方法,根据中文人名内部用字产生潜在人名,可信度较高的潜在人名与其它候选切分词共同组成分词有向图的节点。利用Bigram和Trigram给有向边赋值,使有向图的最短路径对应句子的正确切分,确定了句子的切... 提出了一种与分词一体化的人名识别方法,根据中文人名内部用字产生潜在人名,可信度较高的潜在人名与其它候选切分词共同组成分词有向图的节点。利用Bigram和Trigram给有向边赋值,使有向图的最短路径对应句子的正确切分,确定了句子的切分路径即可识别出句子中的人名。实验结果表明,该方法取得了较好的人名识别正确率。 展开更多
关键词 中文人名识别 未登录词识别 汉语自动分词 最短路径
下载PDF
基于条件随机场的中文人名识别研究 被引量:3
2
作者 邱莎 段玻 +1 位作者 申浩如 丁海燕 《昆明学院学报》 2011年第6期64-66,共3页
利用条件随机场能够任意添加特征的优点,基于条件随机场模型在字粒度一级进行中文人名识别的研究.根据中文人名在文本中出现的基本特征和上下文特征,结合模型的综合性能,合理构造条件随机场的特征模板,在大规模标注语料上进行训练,统计... 利用条件随机场能够任意添加特征的优点,基于条件随机场模型在字粒度一级进行中文人名识别的研究.根据中文人名在文本中出现的基本特征和上下文特征,结合模型的综合性能,合理构造条件随机场的特征模板,在大规模标注语料上进行训练,统计中文人名在文本中的条件概率分布,获得模型参数,并采用序列标注的方式完成中文人名识别任务.多次闭合测试和开放测试结果表明,F值基本都高于90%. 展开更多
关键词 命名实体识别 中文人名识别 条件随机场 条件概率 特征模板 序列标注
下载PDF
HENU汉语分词系统中的中文人名识别算法
3
作者 毋琳 郑逢斌 +1 位作者 乔保军 汤赛丽 《计算机工程与应用》 CSCD 北大核心 2006年第14期180-182,232,共4页
论文介绍在HENU汉语自动分词系统中对中文人名的自动识别算法。该算法在常用的规则和统计相结合方法基础之上,采用了局部回溯分词的思想,较好地解决了同姓异名对的冲突问题。在开放测试中,该方法取得了90.9%的准确率和95.9%的召回率。
关键词 中文人名识别 同姓异名对 自动分词
下载PDF
基于混合方法的中文人名识别研究 被引量:4
4
作者 王祖兴 吕钊 顾君忠 《计算机工程与应用》 CSCD 北大核心 2015年第8期211-217,共7页
当前中文人名识别的研究主要针对中国人名,而对日本人名及音译人名的专门研究相对较少,识别效果也亟待提高。提出利用CRRM方法进行中、日及音译人名同步识别。该方法基于CRF(Conditional Random Fields)并结合了上下文规则及人名可信度... 当前中文人名识别的研究主要针对中国人名,而对日本人名及音译人名的专门研究相对较少,识别效果也亟待提高。提出利用CRRM方法进行中、日及音译人名同步识别。该方法基于CRF(Conditional Random Fields)并结合了上下文规则及人名可信度模型。此外,利用局部统计算法对边界识别错误的人名进行修正,并利用扩散操作召回未被识别的人名。实验结果表明,中、日、音译人名识别的F值均高于90%,提出的方法可以取得较好的识别效果。 展开更多
关键词 中文人名识别 条件随机域(CRF)模型 人名可信度模型 上下文规则 边缘概率
下载PDF
基于知网的贝叶斯中文人名识别 被引量:4
5
作者 蒋才智 王浩 姚宏亮 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第2期147-153,共7页
本文在朴素贝叶斯分类器的基础上,融入了知网语义的元素,构建了一个统计与语义相结合的中文人名识别模型.其基本思想是,首先利用贝叶斯分类器对中国人名进行定位和粗略识别,然后使用知网语义做进一步修正.该模型在继承了贝叶斯算法公式... 本文在朴素贝叶斯分类器的基础上,融入了知网语义的元素,构建了一个统计与语义相结合的中文人名识别模型.其基本思想是,首先利用贝叶斯分类器对中国人名进行定位和粗略识别,然后使用知网语义做进一步修正.该模型在继承了贝叶斯算法公式简单和具有一定学习能力的基础上,避免了人名规则的大量使用,同时克服统计方法中人名边界难于界定的问题.实验结果表明,其准确率和召回率分别为95.67%和97.78%. 展开更多
关键词 贝叶斯分类器 知网语义 中文人名识别
下载PDF
基于错误驱动学习和知网的中文人名识别 被引量:3
6
作者 李波 张蕾 《计算机工程》 CAS CSCD 2012年第12期179-181,共3页
针对统计与规则这2种方法的优缺点,提出一种基于转换的错误驱动学习与知网相结合的中文人名自动识别方法。利用标注语料库,根据在人名识别中的作用对人名上下文环境进行角色标注,提取标注后的实例,并采用基于转换的错误驱动方法和知网... 针对统计与规则这2种方法的优缺点,提出一种基于转换的错误驱动学习与知网相结合的中文人名自动识别方法。利用标注语料库,根据在人名识别中的作用对人名上下文环境进行角色标注,提取标注后的实例,并采用基于转换的错误驱动方法和知网对提取的实例进行可用规则提取,结合规则和实例对文本进行人名识别。实验结果表明,与其他方法相比,该方法的中文人名识别准确率、召回率和F值均有明显提高。 展开更多
关键词 中文人名识别 基于转换的错误驱动学习 知网 语料库 角色标注
下载PDF
基于多级阈值的中文人名识别 被引量:1
7
作者 余祖波 高庆狮 马建军 《计算机工程与应用》 CSCD 北大核心 2007年第33期1-3,18,共4页
在对大规模姓名样本库统计的基础上,研究了各种中文人名的姓氏、名字用字规律,并通过对大规模语料库的统计分析,得到了每个姓氏用字在真实文本中用作真实姓氏的概率及其上下文规律;针对汉族人名和少数民族人名及音译人名,分别提出了多... 在对大规模姓名样本库统计的基础上,研究了各种中文人名的姓氏、名字用字规律,并通过对大规模语料库的统计分析,得到了每个姓氏用字在真实文本中用作真实姓氏的概率及其上下文规律;针对汉族人名和少数民族人名及音译人名,分别提出了多级姓氏阈值和多级首字阈值的概念,并使用3σ法则确定阈值。实验结果表明,基于多级阈值的中文人名识别模型是有效的。 展开更多
关键词 自然语言处理 未登录词识别 中文人名识别 多级阈值 3σ法则
下载PDF
一种中文人名识别的训练架构 被引量:1
8
作者 王嘉文 王传栋 杨雁莹 《计算机技术与发展》 2018年第7期53-57,62,共6页
中文人名识别作为中文语言处理的一项关键技术,广泛应用于文本挖掘、语义分析、机器翻译等领域。在数据日趋海量化和异构化的当今社会,对于中文人名进行命名实体识别已经成为现阶段中文自然语言处理的研究热点之一。由于现有方法大多依... 中文人名识别作为中文语言处理的一项关键技术,广泛应用于文本挖掘、语义分析、机器翻译等领域。在数据日趋海量化和异构化的当今社会,对于中文人名进行命名实体识别已经成为现阶段中文自然语言处理的研究热点之一。由于现有方法大多依赖于先验的领域知识和工程化的特征,识别模型常需要研究人员的大量语言学知识。为了减少甚至忽略对这些工程化的特征的依赖,旨在建立一种较为灵活的深度神经网络架构,通过对大规模未标记语料的内部表示的学习,使得系统减少甚至忽略这些工程化特征的影响,采用无监督的方法进行中文人名识别。实验结果表明,该模型不但性能良好,而且不需要过多的计算资源,在中文人名识别的应用中具有良好的效果。 展开更多
关键词 自然语言处理 深度学习 神经网络 中文人名识别
下载PDF
一种基于本体论和规则匹配的中文人名识别方法 被引量:5
9
作者 周昆 胡学钢 《微计算机信息》 2010年第31期87-89,共3页
未登录词识别是中文信息处理的一个难点,未登录词识别技术的突破对提高汉语自动分词和句法分析的准确性都有很重要的意义。在未登录词中,仅中文姓名就占15%之多,由此可见中文姓名识别对于未登录词识别乃至整个自动分词技术的重要性。本... 未登录词识别是中文信息处理的一个难点,未登录词识别技术的突破对提高汉语自动分词和句法分析的准确性都有很重要的意义。在未登录词中,仅中文姓名就占15%之多,由此可见中文姓名识别对于未登录词识别乃至整个自动分词技术的重要性。本文设计了一种基于本体论和规则匹配的中文人名识别方法,首先基于本体构建中文人名层次分类体系,于分词的过程中指导源文本中候选人名的提取,然后根据规则库匹配修正候选人名,同时分析识别结果生成新的规则反馈给规则库。该方法能够对中文人名知识库进行有效的组织,同时具有一定的自学习的能力,可以获得比较好的中文人名识别效果。 展开更多
关键词 中文人名识别 命名实体识别 中文分词 本体
下载PDF
一种利用统计语义单元识别中文人名的方法 被引量:1
10
作者 余祖波 马建军 《小型微型计算机系统》 CSCD 北大核心 2008年第12期2339-2343,共5页
从语义语言的角度提出一种利用统计语义单元识别中文人名的方法.在该方法中没有词的概念,一切单位都是语义单元,语义单元有参数和类型等属性.通过语义单元对句子进行语义切分,获得句子的语义单元图,并利用联合概率模型求得语义单元图中... 从语义语言的角度提出一种利用统计语义单元识别中文人名的方法.在该方法中没有词的概念,一切单位都是语义单元,语义单元有参数和类型等属性.通过语义单元对句子进行语义切分,获得句子的语义单元图,并利用联合概率模型求得语义单元图中概率最大的路径,然后根据人名模式集在该路径上识别人名.初步实验表明,该方法是一种值得探索的新方法. 展开更多
关键词 自然语言处理 中文人名识别 语义单元 人名模式集
下载PDF
基于层次聚类的中文人名消歧方法研究 被引量:1
11
作者 朱翔 史晓东 陈毅东 《心智与计算》 2010年第4期236-241,共6页
人名消歧近来成为自然语言处理中的一个热点问题。由于中文的复杂性,中文人名消歧被认为比英文人名消歧更困难。本文在使用层次凝聚聚类算法的基础上,主要探讨了中文人名的识别对中文人名消歧的影响以及中文人名消歧有效特征的自动提取... 人名消歧近来成为自然语言处理中的一个热点问题。由于中文的复杂性,中文人名消歧被认为比英文人名消歧更困难。本文在使用层次凝聚聚类算法的基础上,主要探讨了中文人名的识别对中文人名消歧的影响以及中文人名消歧有效特征的自动提取。实验证明,特征融合是提高系统性能的有效方法。中国中文信息学会与SIGHAN组织的评测表明本文所提出的方法是有效的。 展开更多
关键词 中文人名消歧 聚类 中文人名识别 特征提取 特征融合
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部