期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
10
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
中文“非多字词错误”自动校对方法研究
被引量:
15
1
作者
刘亮亮
曹存根
《计算机科学》
CSCD
北大核心
2016年第10期200-205,共6页
针对目前中文文本中的"非多字词错误"自动校对方法的不足,提出了一种模糊分词的"非多字词错误"自动查错和自动校对方法。首先利用精确匹配算法与中文串模糊相似度算法对中文文本进行精确切分和模糊全切分,建立词图...
针对目前中文文本中的"非多字词错误"自动校对方法的不足,提出了一种模糊分词的"非多字词错误"自动查错和自动校对方法。首先利用精确匹配算法与中文串模糊相似度算法对中文文本进行精确切分和模糊全切分,建立词图;然后利用改进的语言模型对词图进行最短路径求解,得到分词结果,实现"非多字词错误"的自动发现和自动纠正。实验测试集是由2万行领域问答系统日志语料构成,共包含664处"非多字词错误"。实验表明,所提方法能有效发现"非多字词错误",包括由于汉字替换、缺字、多字引起的"非多字词错误",该方法的查错召回率达到75.9%,查错精度达到85%。所提方法是一种将查错与纠错融于一体的方法。
展开更多
关键词
非词错误
非多字词错误
模糊匹配
词图
下载PDF
职称材料
英文作文的自动拼写检查研究
被引量:
5
2
作者
李斌
姚建民
朱巧明
《郑州大学学报(理学版)》
CAS
2008年第3期48-51,共4页
基于自动拼写检查的研究现状,将英文作文中的拼写错误进行了分类,并分别采用规则匹配和统计建模的方法对单词的非词错误和真词错误进行了研究,从而扩大了对英文单词进行拼写检查的研究范围.真词错误检查主要是利用贝叶斯定理,并通过建...
基于自动拼写检查的研究现状,将英文作文中的拼写错误进行了分类,并分别采用规则匹配和统计建模的方法对单词的非词错误和真词错误进行了研究,从而扩大了对英文单词进行拼写检查的研究范围.真词错误检查主要是利用贝叶斯定理,并通过建立一些特定的混淆集的方法来实现.通过实验数据分析,该系统的准确率达到了80%以上.
展开更多
关键词
拼写检查
真词错误
非词错误
贝叶斯定理
混淆集
下载PDF
职称材料
基于规则与统计相结合的中文文本自动查错模型与算法
被引量:
33
3
作者
张仰森
曹元大
俞士汶
《中文信息学报》
CSCD
北大核心
2006年第4期1-7,55,共8页
中文文本自动校对是自然语言处理领域具有挑战性的研究课题。本文提出了一种规则与统计相结合的中文文本自动查错模型与算法。根据正确文本分词后单字词的出现规律以及“非多字词错误”的概念,提出一组错误发现规则,并与针对分词后单字...
中文文本自动校对是自然语言处理领域具有挑战性的研究课题。本文提出了一种规则与统计相结合的中文文本自动查错模型与算法。根据正确文本分词后单字词的出现规律以及“非多字词错误”的概念,提出一组错误发现规则,并与针对分词后单字散串建立的字二元、三元统计模型和词性二元、三元统计模型相结合,建立了文本自动查错模型与实现算法。通过对30篇含有578个错误测试点的文本进行实验,所提算法的查错召回率为86.85%、准确率为69.43%,误报率为30.57%。
展开更多
关键词
计算机应用
中文信息处理
中文文本自动查错
规则与统计相结合
非多字词错误
真多字词错误
下载PDF
职称材料
对汉语中介语表人名词“~人”的偏误分析
被引量:
6
4
作者
李华
《云南师范大学学报(对外汉语教学与研究版)》
2005年第3期46-49,共4页
本文首先对<倒序现代汉语词典>中收录的以"人"结尾的表人名词"~人"进行分类描写,总结出"人"构成表人名词的构词规则.然后通过对比<倒序现代汉语词典>中收录的以"人"结尾的表人名...
本文首先对<倒序现代汉语词典>中收录的以"人"结尾的表人名词"~人"进行分类描写,总结出"人"构成表人名词的构词规则.然后通过对比<倒序现代汉语词典>中收录的以"人"结尾的表人名词和对汉语中介语语料库中表人的生造词"~人"进行归纳,分析偏误类型,进而找出导致偏误产生的主要原因,希望讨论结果能够为对外汉语教学提供帮助.
展开更多
关键词
表人名词
中介语
生造词
偏误分析
对外汉语教学
下载PDF
职称材料
基于规则与统计相结合的藏文文本自动查错方法研究
被引量:
2
5
作者
完么扎西
尼玛扎西
《中文信息学报》
CSCD
北大核心
2022年第2期69-75,共7页
针对目前藏文文本自动查错方法的不足,该文提出了一种基于规则和统计相结合的自动查错方法。首先以藏文拼写文法为基础,结合形式语言与自动机理论,构造37种确定型有限自动机识别现代藏文字;然后利用查找字典的方法识别梵音藏文字;最后...
针对目前藏文文本自动查错方法的不足,该文提出了一种基于规则和统计相结合的自动查错方法。首先以藏文拼写文法为基础,结合形式语言与自动机理论,构造37种确定型有限自动机识别现代藏文字;然后利用查找字典的方法识别梵音藏文字;最后利用互信息和t-测试差等统计方法查找藏语词语搭配错误和语法错误等真字词错误,实现藏文文本的自动查错。实验测试集由100篇新闻类语料构成,共包含49处错误。实验表明,该文方法能有效发现非字错误和真字词错误,该方法的查错召回率达到83.7%,查错准确率达到70.7%,F值达到76.7%。
展开更多
关键词
藏文文本自动查错
非字错误
真字词错误
下载PDF
职称材料
齿顶曲线误差对非圆齿轮副重合度的影响
被引量:
2
6
作者
唐德威
张光辉
+4 位作者
唐德威
于红英
徐晓俊
李华敏
唐德栋
《林业机械与木工设备》
北大核心
2001年第4期14-17,共4页
以非圆齿轮插齿加工为例,分析了利用渐开线圆柱插齿刀加工非圆齿轮时齿顶曲线误差对非圆齿轮重合度的影响,为严格控制非圆齿轮副的重合度提供了理论保证。
关键词
非圆齿轮
齿顶曲线
误差
重合度
插齿加工过程
非圆齿轮副
下载PDF
职称材料
英语运用中的非母语特性与词汇深度习得
被引量:
1
7
作者
段静红
《河南机电高等专科学校学报》
CAS
2008年第4期121-123,共3页
文章探讨了中国大学生英语运用中的非母语特性及其成因,指出其语用表现偏常的重要原因之一是未能充分掌握常用词在使用时的典型类联接和搭配,目的在于提出在外语教学中有必要重视和探讨二语词汇的深度习得及其现实实现问题。
关键词
词语深度习得
非母语特性
错误
类联接和搭配
下载PDF
职称材料
基于键盘距离和依存分析的拼写纠错方法
被引量:
1
8
作者
谢文慧
易荣庆
彭涛
《吉林大学学报(理学版)》
CAS
CSCD
北大核心
2018年第5期1179-1186,共8页
利用基于键盘距离和依存分析的拼写纠错模型,解决文本输入过程中产生的非词错误.通过综合考虑邻近权值、依存关系权值及词频三部分构造最终的拼写纠错模型,并在Brown语料库、Gutenberg语料库和Inaugural语料库上验证该模型.实验结果表明...
利用基于键盘距离和依存分析的拼写纠错模型,解决文本输入过程中产生的非词错误.通过综合考虑邻近权值、依存关系权值及词频三部分构造最终的拼写纠错模型,并在Brown语料库、Gutenberg语料库和Inaugural语料库上验证该模型.实验结果表明,该模型可有效进行非词纠错.
展开更多
关键词
键盘距离
单词距离
依存分析
SpellKD模型
非词错误
下载PDF
职称材料
关于解决蒙古文形对码错错误的研究综述
9
作者
杨利润
斯琴巴图
锡林宝力尔
《现代计算机》
2020年第4期29-31,36,共4页
首先给出蒙古文电子文本中“形对码错”错误的概念及产生原因,并根据产生原因将“形对码错”错误分为“读音非词”和“同形词替代”等两种错误,之后分别归纳总结解决“读音非词”和“同形词替代”两种错误的主要研究方法。
关键词
蒙古文校对
形对码错
读音非词
同形词替代
下载PDF
职称材料
从词内同化看非汉字圈留学生汉字书写偏误
10
作者
黄蓬博
吴日霞
+1 位作者
代晶
辛梓
《大理大学学报》
CAS
2021年第5期109-114,共6页
词内同化汉字偏误是留学生常见的偏误之一。借助HSK动态作文语料库,收集非汉字圈留学生词内同化汉字偏误231个。通过考察这些偏误的分布趋势和类型特征,发现非汉字圈留学生的词内同化汉字偏误集中出现于中高级水平的作文中,且表现为以...
词内同化汉字偏误是留学生常见的偏误之一。借助HSK动态作文语料库,收集非汉字圈留学生词内同化汉字偏误231个。通过考察这些偏误的分布趋势和类型特征,发现非汉字圈留学生的词内同化汉字偏误集中出现于中高级水平的作文中,且表现为以部件添加和改换为主要手段,顺同化和逆同化数量相当,部件改换式顺同化和部件添加式逆同化凸显的特点。针对统计中出现的高频偏误,利用现场测试的方法,对留学生的测试结果和反馈进行整理,并从汉字习得顺序、汉字构形规律和汉字组合同化三个方面,解释留学生出现偏误的原因,提出相应的教学建议。
展开更多
关键词
词内同化汉字偏误
非汉字圈留学生
统计与分类
成因分析
教学建议
下载PDF
职称材料
题名
中文“非多字词错误”自动校对方法研究
被引量:
15
1
作者
刘亮亮
曹存根
机构
江苏科技大学计算机科学与工程学院
中国科学院计算技术研究所智能信息重点实验室
出处
《计算机科学》
CSCD
北大核心
2016年第10期200-205,共6页
基金
国家自然科学基金项目(91224006
61173063
+2 种基金
61203284
30973713)
国家社科基金重点项目(10AYY003)资助
文摘
针对目前中文文本中的"非多字词错误"自动校对方法的不足,提出了一种模糊分词的"非多字词错误"自动查错和自动校对方法。首先利用精确匹配算法与中文串模糊相似度算法对中文文本进行精确切分和模糊全切分,建立词图;然后利用改进的语言模型对词图进行最短路径求解,得到分词结果,实现"非多字词错误"的自动发现和自动纠正。实验测试集是由2万行领域问答系统日志语料构成,共包含664处"非多字词错误"。实验表明,所提方法能有效发现"非多字词错误",包括由于汉字替换、缺字、多字引起的"非多字词错误",该方法的查错召回率达到75.9%,查错精度达到85%。所提方法是一种将查错与纠错融于一体的方法。
关键词
非词错误
非多字词错误
模糊匹配
词图
Keywords
non
-
word
error
,
non
-multi-character
word
error
, Fuzzy matching,
word
graph
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
英文作文的自动拼写检查研究
被引量:
5
2
作者
李斌
姚建民
朱巧明
机构
苏州大学江苏省计算机信息处理重点实验室
出处
《郑州大学学报(理学版)》
CAS
2008年第3期48-51,共4页
基金
江苏省自然科学基金资助项目,编号BK2006539
江苏省高校自然科学基础研究项目,编号06KJB520095
文摘
基于自动拼写检查的研究现状,将英文作文中的拼写错误进行了分类,并分别采用规则匹配和统计建模的方法对单词的非词错误和真词错误进行了研究,从而扩大了对英文单词进行拼写检查的研究范围.真词错误检查主要是利用贝叶斯定理,并通过建立一些特定的混淆集的方法来实现.通过实验数据分析,该系统的准确率达到了80%以上.
关键词
拼写检查
真词错误
非词错误
贝叶斯定理
混淆集
Keywords
spelling check
real-
word
error
non
-
word
error
Bayes theorem
confusion set
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于规则与统计相结合的中文文本自动查错模型与算法
被引量:
33
3
作者
张仰森
曹元大
俞士汶
机构
北京大学计算语言学研究所
北京理工大学计算机科学工程系
北京信息科技大学计算机及自动化系
出处
《中文信息学报》
CSCD
北大核心
2006年第4期1-7,55,共8页
基金
国家973项目资助(2004CB318102)
国家863计划资助(2001AA114210
+1 种基金
2002AA117010)
中国博士后基金项目资助(2005038026)
文摘
中文文本自动校对是自然语言处理领域具有挑战性的研究课题。本文提出了一种规则与统计相结合的中文文本自动查错模型与算法。根据正确文本分词后单字词的出现规律以及“非多字词错误”的概念,提出一组错误发现规则,并与针对分词后单字散串建立的字二元、三元统计模型和词性二元、三元统计模型相结合,建立了文本自动查错模型与实现算法。通过对30篇含有578个错误测试点的文本进行实验,所提算法的查错召回率为86.85%、准确率为69.43%,误报率为30.57%。
关键词
计算机应用
中文信息处理
中文文本自动查错
规则与统计相结合
非多字词错误
真多字词错误
Keywords
Computer application
Chinese information processing
Chinese text automatic
error
-detecting
Combing rule-based and statistics-based approaches
non
-multi-character
word
error
real-multi-character
word
error
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
对汉语中介语表人名词“~人”的偏误分析
被引量:
6
4
作者
李华
机构
北京语言大学汉语速成学院 北京
出处
《云南师范大学学报(对外汉语教学与研究版)》
2005年第3期46-49,共4页
基金
教育部人文社科基金资助项目(02JAZJD740006)
文摘
本文首先对<倒序现代汉语词典>中收录的以"人"结尾的表人名词"~人"进行分类描写,总结出"人"构成表人名词的构词规则.然后通过对比<倒序现代汉语词典>中收录的以"人"结尾的表人名词和对汉语中介语语料库中表人的生造词"~人"进行归纳,分析偏误类型,进而找出导致偏误产生的主要原因,希望讨论结果能够为对外汉语教学提供帮助.
关键词
表人名词
中介语
生造词
偏误分析
对外汉语教学
Keywords
denoting-person noun
interlingua
non
-
word
error
分类号
H195 [语言文字—汉语]
下载PDF
职称材料
题名
基于规则与统计相结合的藏文文本自动查错方法研究
被引量:
2
5
作者
完么扎西
尼玛扎西
机构
青海师范大学民族师范学院
西藏大学信息科学技术学院
出处
《中文信息学报》
CSCD
北大核心
2022年第2期69-75,共7页
基金
国家社会科学基金(19XYY021)。
文摘
针对目前藏文文本自动查错方法的不足,该文提出了一种基于规则和统计相结合的自动查错方法。首先以藏文拼写文法为基础,结合形式语言与自动机理论,构造37种确定型有限自动机识别现代藏文字;然后利用查找字典的方法识别梵音藏文字;最后利用互信息和t-测试差等统计方法查找藏语词语搭配错误和语法错误等真字词错误,实现藏文文本的自动查错。实验测试集由100篇新闻类语料构成,共包含49处错误。实验表明,该文方法能有效发现非字错误和真字词错误,该方法的查错召回率达到83.7%,查错准确率达到70.7%,F值达到76.7%。
关键词
藏文文本自动查错
非字错误
真字词错误
Keywords
Tibetan text automatic
error
checking
non word error
real
word
error
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
齿顶曲线误差对非圆齿轮副重合度的影响
被引量:
2
6
作者
唐德威
张光辉
唐德威
于红英
徐晓俊
李华敏
唐德栋
机构
重庆大学机械传动国家重点实验室
哈尔滨工业大学机电工程学院
哈尔滨
出处
《林业机械与木工设备》
北大核心
2001年第4期14-17,共4页
基金
国家自然科学基金资助(项目编号:59475009)
航天科技开发项目资助(项目编号:96-22)
文摘
以非圆齿轮插齿加工为例,分析了利用渐开线圆柱插齿刀加工非圆齿轮时齿顶曲线误差对非圆齿轮重合度的影响,为严格控制非圆齿轮副的重合度提供了理论保证。
关键词
非圆齿轮
齿顶曲线
误差
重合度
插齿加工过程
非圆齿轮副
Keywords
Key
word
s:
non
-circular gear
tip curve
error
contact ratio
分类号
TH132.41 [机械工程—机械制造及自动化]
下载PDF
职称材料
题名
英语运用中的非母语特性与词汇深度习得
被引量:
1
7
作者
段静红
机构
新乡学院外语系
出处
《河南机电高等专科学校学报》
CAS
2008年第4期121-123,共3页
文摘
文章探讨了中国大学生英语运用中的非母语特性及其成因,指出其语用表现偏常的重要原因之一是未能充分掌握常用词在使用时的典型类联接和搭配,目的在于提出在外语教学中有必要重视和探讨二语词汇的深度习得及其现实实现问题。
关键词
词语深度习得
非母语特性
错误
类联接和搭配
Keywords
comprehensive acquisition of lexical
word
s
non
- nativeness
error
colligation and collocation
分类号
H313 [语言文字—英语]
下载PDF
职称材料
题名
基于键盘距离和依存分析的拼写纠错方法
被引量:
1
8
作者
谢文慧
易荣庆
彭涛
机构
吉林大学计算机科学与技术学院
国网吉林省电力有限公司
吉林大学符号计算与知识工程教育部重点实验室
出处
《吉林大学学报(理学版)》
CAS
CSCD
北大核心
2018年第5期1179-1186,共8页
基金
国家自然科学基金(批准号:60903098)
吉林省发改委产业技术研究与开发专项基金(批准号:2015Y055)
吉林省科技厅重点科技攻关项目(批准号:20150204040GX)
文摘
利用基于键盘距离和依存分析的拼写纠错模型,解决文本输入过程中产生的非词错误.通过综合考虑邻近权值、依存关系权值及词频三部分构造最终的拼写纠错模型,并在Brown语料库、Gutenberg语料库和Inaugural语料库上验证该模型.实验结果表明,该模型可有效进行非词纠错.
关键词
键盘距离
单词距离
依存分析
SpellKD模型
非词错误
Keywords
keyboard distance
word
distance
dependency parsing
SpellKD model
non
-
word
error
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
关于解决蒙古文形对码错错误的研究综述
9
作者
杨利润
斯琴巴图
锡林宝力尔
机构
内蒙古建筑职业技术学院
内蒙古妇女干部学校
内蒙古广播电视台
出处
《现代计算机》
2020年第4期29-31,36,共4页
基金
内蒙古自治区高等学校科学研究项目(No.NJZY331)
文摘
首先给出蒙古文电子文本中“形对码错”错误的概念及产生原因,并根据产生原因将“形对码错”错误分为“读音非词”和“同形词替代”等两种错误,之后分别归纳总结解决“读音非词”和“同形词替代”两种错误的主要研究方法。
关键词
蒙古文校对
形对码错
读音非词
同形词替代
Keywords
Mongolian Proofreading
Form-Right-Code-
error
Pronunciation
non
word
Homograph Substitution
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
从词内同化看非汉字圈留学生汉字书写偏误
10
作者
黄蓬博
吴日霞
代晶
辛梓
机构
桂林医学院国际教育学院
出处
《大理大学学报》
CAS
2021年第5期109-114,共6页
文摘
词内同化汉字偏误是留学生常见的偏误之一。借助HSK动态作文语料库,收集非汉字圈留学生词内同化汉字偏误231个。通过考察这些偏误的分布趋势和类型特征,发现非汉字圈留学生的词内同化汉字偏误集中出现于中高级水平的作文中,且表现为以部件添加和改换为主要手段,顺同化和逆同化数量相当,部件改换式顺同化和部件添加式逆同化凸显的特点。针对统计中出现的高频偏误,利用现场测试的方法,对留学生的测试结果和反馈进行整理,并从汉字习得顺序、汉字构形规律和汉字组合同化三个方面,解释留学生出现偏误的原因,提出相应的教学建议。
关键词
词内同化汉字偏误
非汉字圈留学生
统计与分类
成因分析
教学建议
Keywords
Chinese character
error
s by intra-
word
assimilation
non
-Chinese character sphere learners
statistics and classification
cause analysis
teaching suggestions
分类号
H195 [语言文字—汉语]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
中文“非多字词错误”自动校对方法研究
刘亮亮
曹存根
《计算机科学》
CSCD
北大核心
2016
15
下载PDF
职称材料
2
英文作文的自动拼写检查研究
李斌
姚建民
朱巧明
《郑州大学学报(理学版)》
CAS
2008
5
下载PDF
职称材料
3
基于规则与统计相结合的中文文本自动查错模型与算法
张仰森
曹元大
俞士汶
《中文信息学报》
CSCD
北大核心
2006
33
下载PDF
职称材料
4
对汉语中介语表人名词“~人”的偏误分析
李华
《云南师范大学学报(对外汉语教学与研究版)》
2005
6
下载PDF
职称材料
5
基于规则与统计相结合的藏文文本自动查错方法研究
完么扎西
尼玛扎西
《中文信息学报》
CSCD
北大核心
2022
2
下载PDF
职称材料
6
齿顶曲线误差对非圆齿轮副重合度的影响
唐德威
张光辉
唐德威
于红英
徐晓俊
李华敏
唐德栋
《林业机械与木工设备》
北大核心
2001
2
下载PDF
职称材料
7
英语运用中的非母语特性与词汇深度习得
段静红
《河南机电高等专科学校学报》
CAS
2008
1
下载PDF
职称材料
8
基于键盘距离和依存分析的拼写纠错方法
谢文慧
易荣庆
彭涛
《吉林大学学报(理学版)》
CAS
CSCD
北大核心
2018
1
下载PDF
职称材料
9
关于解决蒙古文形对码错错误的研究综述
杨利润
斯琴巴图
锡林宝力尔
《现代计算机》
2020
0
下载PDF
职称材料
10
从词内同化看非汉字圈留学生汉字书写偏误
黄蓬博
吴日霞
代晶
辛梓
《大理大学学报》
CAS
2021
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部