期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
不同水平留学生汉语交集型与组合型切分歧义识别实验研究
1
作者
杨万兵
杨峥琳
《语言科学》
CSSCI
北大核心
2016年第3期280-290,共11页
通过对初、中级水平留学生汉语交集型与组合型切分歧义识别实验研究发现:两种类型切分歧义识别的汉语水平和链长主效应都十分显著,初级识别错误率、修改率均高于中级。对于交集型切分歧义而言,链长越长,识别错误率越低;组合型链长1、2...
通过对初、中级水平留学生汉语交集型与组合型切分歧义识别实验研究发现:两种类型切分歧义识别的汉语水平和链长主效应都十分显著,初级识别错误率、修改率均高于中级。对于交集型切分歧义而言,链长越长,识别错误率越低;组合型链长1、2识别错误率无显著差异,但链长为3时识别错误率显著提高;链长为1时,初级与中级识别错误率相当,链长为2、3时,初级识别错误率高于中级。文章从两类切分歧义特点、汉语水平与链长、动态语境与修改意识等方面分析了造成这些差异的原因,并提出了相应的教学建议。
展开更多
关键词
交集型
切分
歧义
组合型切分歧义
链长
词语识别
动态语境
下载PDF
职称材料
基于语境信息的汉语组合型歧义消歧方法
被引量:
7
2
作者
冯素琴
陈惠明
《中文信息学报》
CSCD
北大核心
2007年第6期13-16,42,共5页
组合型歧义切分字段一直是汉语自动分词的难点,难点在于消歧依赖其上下文语境信息。本文采集、统计了组合型歧义字段的前后语境信息,应用对数似然比建立了语境计算模型,并考虑了语境信息的窗口大小、位置和频次对消歧的影响而设计了权...
组合型歧义切分字段一直是汉语自动分词的难点,难点在于消歧依赖其上下文语境信息。本文采集、统计了组合型歧义字段的前后语境信息,应用对数似然比建立了语境计算模型,并考虑了语境信息的窗口大小、位置和频次对消歧的影响而设计了权值计算公式。在此基础上,1.使用语境信息中对数似然比的最大值进行消歧;2.使用语境信息中合、分两种情况下各自的对数似然比之和,取值大者进行消歧。对高频出现的14个组合型分词歧义进行实验,前者的平均准确率为84.93%,后者的平均准确率为95.60%。实验证明使用语境信息之和对消解组合型分词歧义具有良好效果。
展开更多
关键词
计算机应用
中文信息处理
自然语言处理
汉语自动分词
组合型切分歧义
对数似然比
语境信息
下载PDF
职称材料
一种自组织的汉语组合型歧义消歧方法
被引量:
3
3
作者
冯素琴
陈惠明
《计算机工程与设计》
CSCD
北大核心
2007年第3期737-739,742,共4页
组合型歧义切分字段一直是汉语自动分词的难点。用人工校验后的分词语料提供的搭配实例作为组合歧义字段的初始搭配知识,提出使用搭配统计表的多元最大对数似然比进行消歧;继而根据实验确定了歧义字段的上下文窗口、窗口位置区分、权值...
组合型歧义切分字段一直是汉语自动分词的难点。用人工校验后的分词语料提供的搭配实例作为组合歧义字段的初始搭配知识,提出使用搭配统计表的多元最大对数似然比进行消歧;继而根据实验确定了歧义字段的上下文窗口、窗口位置区分、权值估计等要素;在此基础上采用自组织方法自动扩充搭配集,使消歧信息趋于稳定;最后,对提出的方法进行了实验,实验表明,该算法能有效提高消歧准确率。
展开更多
关键词
自然语言处理
汉语自动分词
组合型切分歧义
自组织方法
消歧
下载PDF
职称材料
利用上下文信息解决汉语自动分词中的组合型歧义
被引量:
24
4
作者
肖云
孙茂松
邹嘉彦
《计算机工程与应用》
CSCD
北大核心
2001年第19期87-89,106,共4页
组合型歧义切分字段一直是汉语自动分词研究中的一个难点。该文将之视为与WordSenseDisambiguation(WSD)相等价的问题。文章借鉴了WSD研究中广泛使用的向量空间法,选取了20个典型的组合型歧义进行了详尽讨论。提出了根据它们的分布“分...
组合型歧义切分字段一直是汉语自动分词研究中的一个难点。该文将之视为与WordSenseDisambiguation(WSD)相等价的问题。文章借鉴了WSD研究中广泛使用的向量空间法,选取了20个典型的组合型歧义进行了详尽讨论。提出了根据它们的分布“分而治之”的策略,继而根据实验确定了与特征矩阵相关联的上下文窗口大小、窗口位置区分、权值估计等要素,并且针对数据稀疏问题,利用词的语义代码信息对特征矩阵进行了降维处理,取得了较好的效果。笔者相信,这个模型对组合型歧义切分字段的排歧具有一般性。
展开更多
关键词
自然语言处理
中文计算
汉语自动分词
组合型
歧义
切分
字段
中文信息处理
下载PDF
职称材料
题名
不同水平留学生汉语交集型与组合型切分歧义识别实验研究
1
作者
杨万兵
杨峥琳
机构
暨南大学华文学院/华文教育研究院
中山大学国际汉语学院
出处
《语言科学》
CSSCI
北大核心
2016年第3期280-290,共11页
基金
"中央高校基本科研业务费专项资金"
暨南跨越计划(15JNKY006)支持
文摘
通过对初、中级水平留学生汉语交集型与组合型切分歧义识别实验研究发现:两种类型切分歧义识别的汉语水平和链长主效应都十分显著,初级识别错误率、修改率均高于中级。对于交集型切分歧义而言,链长越长,识别错误率越低;组合型链长1、2识别错误率无显著差异,但链长为3时识别错误率显著提高;链长为1时,初级与中级识别错误率相当,链长为2、3时,初级识别错误率高于中级。文章从两类切分歧义特点、汉语水平与链长、动态语境与修改意识等方面分析了造成这些差异的原因,并提出了相应的教学建议。
关键词
交集型
切分
歧义
组合型切分歧义
链长
词语识别
动态语境
Keywords
overlapping ambiguities words segmentation
combinatorial ambiguities in Chinese words segmentation
the number of possible word combination
word recognition
dynamic context
分类号
H195 [语言文字—汉语]
下载PDF
职称材料
题名
基于语境信息的汉语组合型歧义消歧方法
被引量:
7
2
作者
冯素琴
陈惠明
机构
忻州师范学院计算机科学与技术系
出处
《中文信息学报》
CSCD
北大核心
2007年第6期13-16,42,共5页
基金
山西省忻州师范学院基金资助项目(200307)
文摘
组合型歧义切分字段一直是汉语自动分词的难点,难点在于消歧依赖其上下文语境信息。本文采集、统计了组合型歧义字段的前后语境信息,应用对数似然比建立了语境计算模型,并考虑了语境信息的窗口大小、位置和频次对消歧的影响而设计了权值计算公式。在此基础上,1.使用语境信息中对数似然比的最大值进行消歧;2.使用语境信息中合、分两种情况下各自的对数似然比之和,取值大者进行消歧。对高频出现的14个组合型分词歧义进行实验,前者的平均准确率为84.93%,后者的平均准确率为95.60%。实验证明使用语境信息之和对消解组合型分词歧义具有良好效果。
关键词
计算机应用
中文信息处理
自然语言处理
汉语自动分词
组合型切分歧义
对数似然比
语境信息
Keywords
computer application
Chinese information processing
natural language processing
Chinese word segmentatiom combinational ambiguity
log likelihood ratio
contextual information
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种自组织的汉语组合型歧义消歧方法
被引量:
3
3
作者
冯素琴
陈惠明
机构
忻州师范学院计算机科学与技术系
出处
《计算机工程与设计》
CSCD
北大核心
2007年第3期737-739,742,共4页
基金
山西省忻州师范学院基金项目(200307)
文摘
组合型歧义切分字段一直是汉语自动分词的难点。用人工校验后的分词语料提供的搭配实例作为组合歧义字段的初始搭配知识,提出使用搭配统计表的多元最大对数似然比进行消歧;继而根据实验确定了歧义字段的上下文窗口、窗口位置区分、权值估计等要素;在此基础上采用自组织方法自动扩充搭配集,使消歧信息趋于稳定;最后,对提出的方法进行了实验,实验表明,该算法能有效提高消歧准确率。
关键词
自然语言处理
汉语自动分词
组合型切分歧义
自组织方法
消歧
Keywords
natural language processing
Chinese word segmentation
combinatorial ambiguities
adaptive method
disambiguate
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
利用上下文信息解决汉语自动分词中的组合型歧义
被引量:
24
4
作者
肖云
孙茂松
邹嘉彦
机构
清华大学智能技术与系统国家重点实验室
香港城市大学语言资讯科学研究中心
出处
《计算机工程与应用》
CSCD
北大核心
2001年第19期87-89,106,共4页
基金
国家重点基础研究发展规划项目资助课题(课题编号:G1998030507)
文摘
组合型歧义切分字段一直是汉语自动分词研究中的一个难点。该文将之视为与WordSenseDisambiguation(WSD)相等价的问题。文章借鉴了WSD研究中广泛使用的向量空间法,选取了20个典型的组合型歧义进行了详尽讨论。提出了根据它们的分布“分而治之”的策略,继而根据实验确定了与特征矩阵相关联的上下文窗口大小、窗口位置区分、权值估计等要素,并且针对数据稀疏问题,利用词的语义代码信息对特征矩阵进行了降维处理,取得了较好的效果。笔者相信,这个模型对组合型歧义切分字段的排歧具有一般性。
关键词
自然语言处理
中文计算
汉语自动分词
组合型
歧义
切分
字段
中文信息处理
Keywords
natural language processing,Chinese computing,Chinese word segmentation,Combinatorial ambiguity
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
不同水平留学生汉语交集型与组合型切分歧义识别实验研究
杨万兵
杨峥琳
《语言科学》
CSSCI
北大核心
2016
0
下载PDF
职称材料
2
基于语境信息的汉语组合型歧义消歧方法
冯素琴
陈惠明
《中文信息学报》
CSCD
北大核心
2007
7
下载PDF
职称材料
3
一种自组织的汉语组合型歧义消歧方法
冯素琴
陈惠明
《计算机工程与设计》
CSCD
北大核心
2007
3
下载PDF
职称材料
4
利用上下文信息解决汉语自动分词中的组合型歧义
肖云
孙茂松
邹嘉彦
《计算机工程与应用》
CSCD
北大核心
2001
24
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部