期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
中文“非多字词错误”自动校对方法研究 被引量:15
1
作者 刘亮亮 曹存根 《计算机科学》 CSCD 北大核心 2016年第10期200-205,共6页
针对目前中文文本中的"非多字词错误"自动校对方法的不足,提出了一种模糊分词的"非多字词错误"自动查错和自动校对方法。首先利用精确匹配算法与中文串模糊相似度算法对中文文本进行精确切分和模糊全切分,建立词图... 针对目前中文文本中的"非多字词错误"自动校对方法的不足,提出了一种模糊分词的"非多字词错误"自动查错和自动校对方法。首先利用精确匹配算法与中文串模糊相似度算法对中文文本进行精确切分和模糊全切分,建立词图;然后利用改进的语言模型对词图进行最短路径求解,得到分词结果,实现"非多字词错误"的自动发现和自动纠正。实验测试集是由2万行领域问答系统日志语料构成,共包含664处"非多字词错误"。实验表明,所提方法能有效发现"非多字词错误",包括由于汉字替换、缺字、多字引起的"非多字词错误",该方法的查错召回率达到75.9%,查错精度达到85%。所提方法是一种将查错与纠错融于一体的方法。 展开更多
关键词 非词错误 非多字词错误 模糊匹配 词图
下载PDF
英文作文的自动拼写检查研究 被引量:5
2
作者 李斌 姚建民 朱巧明 《郑州大学学报(理学版)》 CAS 2008年第3期48-51,共4页
基于自动拼写检查的研究现状,将英文作文中的拼写错误进行了分类,并分别采用规则匹配和统计建模的方法对单词的非词错误和真词错误进行了研究,从而扩大了对英文单词进行拼写检查的研究范围.真词错误检查主要是利用贝叶斯定理,并通过建... 基于自动拼写检查的研究现状,将英文作文中的拼写错误进行了分类,并分别采用规则匹配和统计建模的方法对单词的非词错误和真词错误进行了研究,从而扩大了对英文单词进行拼写检查的研究范围.真词错误检查主要是利用贝叶斯定理,并通过建立一些特定的混淆集的方法来实现.通过实验数据分析,该系统的准确率达到了80%以上. 展开更多
关键词 拼写检查 真词错误 非词错误 贝叶斯定理 混淆集
下载PDF
基于规则与统计相结合的中文文本自动查错模型与算法 被引量:33
3
作者 张仰森 曹元大 俞士汶 《中文信息学报》 CSCD 北大核心 2006年第4期1-7,55,共8页
中文文本自动校对是自然语言处理领域具有挑战性的研究课题。本文提出了一种规则与统计相结合的中文文本自动查错模型与算法。根据正确文本分词后单字词的出现规律以及“非多字词错误”的概念,提出一组错误发现规则,并与针对分词后单字... 中文文本自动校对是自然语言处理领域具有挑战性的研究课题。本文提出了一种规则与统计相结合的中文文本自动查错模型与算法。根据正确文本分词后单字词的出现规律以及“非多字词错误”的概念,提出一组错误发现规则,并与针对分词后单字散串建立的字二元、三元统计模型和词性二元、三元统计模型相结合,建立了文本自动查错模型与实现算法。通过对30篇含有578个错误测试点的文本进行实验,所提算法的查错召回率为86.85%、准确率为69.43%,误报率为30.57%。 展开更多
关键词 计算机应用 中文信息处理 中文文本自动查错 规则与统计相结合 非多字词错误 真多字词错误
下载PDF
对汉语中介语表人名词“~人”的偏误分析 被引量:6
4
作者 李华 《云南师范大学学报(对外汉语教学与研究版)》 2005年第3期46-49,共4页
本文首先对<倒序现代汉语词典>中收录的以"人"结尾的表人名词"~人"进行分类描写,总结出"人"构成表人名词的构词规则.然后通过对比<倒序现代汉语词典>中收录的以"人"结尾的表人名... 本文首先对<倒序现代汉语词典>中收录的以"人"结尾的表人名词"~人"进行分类描写,总结出"人"构成表人名词的构词规则.然后通过对比<倒序现代汉语词典>中收录的以"人"结尾的表人名词和对汉语中介语语料库中表人的生造词"~人"进行归纳,分析偏误类型,进而找出导致偏误产生的主要原因,希望讨论结果能够为对外汉语教学提供帮助. 展开更多
关键词 表人名词 中介语 生造词 偏误分析 对外汉语教学
下载PDF
基于规则与统计相结合的藏文文本自动查错方法研究 被引量:2
5
作者 完么扎西 尼玛扎西 《中文信息学报》 CSCD 北大核心 2022年第2期69-75,共7页
针对目前藏文文本自动查错方法的不足,该文提出了一种基于规则和统计相结合的自动查错方法。首先以藏文拼写文法为基础,结合形式语言与自动机理论,构造37种确定型有限自动机识别现代藏文字;然后利用查找字典的方法识别梵音藏文字;最后... 针对目前藏文文本自动查错方法的不足,该文提出了一种基于规则和统计相结合的自动查错方法。首先以藏文拼写文法为基础,结合形式语言与自动机理论,构造37种确定型有限自动机识别现代藏文字;然后利用查找字典的方法识别梵音藏文字;最后利用互信息和t-测试差等统计方法查找藏语词语搭配错误和语法错误等真字词错误,实现藏文文本的自动查错。实验测试集由100篇新闻类语料构成,共包含49处错误。实验表明,该文方法能有效发现非字错误和真字词错误,该方法的查错召回率达到83.7%,查错准确率达到70.7%,F值达到76.7%。 展开更多
关键词 藏文文本自动查错 非字错误 真字词错误
下载PDF
齿顶曲线误差对非圆齿轮副重合度的影响 被引量:2
6
作者 唐德威 张光辉 +4 位作者 唐德威 于红英 徐晓俊 李华敏 唐德栋 《林业机械与木工设备》 北大核心 2001年第4期14-17,共4页
以非圆齿轮插齿加工为例,分析了利用渐开线圆柱插齿刀加工非圆齿轮时齿顶曲线误差对非圆齿轮重合度的影响,为严格控制非圆齿轮副的重合度提供了理论保证。
关键词 非圆齿轮 齿顶曲线 误差 重合度 插齿加工过程 非圆齿轮副
下载PDF
英语运用中的非母语特性与词汇深度习得 被引量:1
7
作者 段静红 《河南机电高等专科学校学报》 CAS 2008年第4期121-123,共3页
文章探讨了中国大学生英语运用中的非母语特性及其成因,指出其语用表现偏常的重要原因之一是未能充分掌握常用词在使用时的典型类联接和搭配,目的在于提出在外语教学中有必要重视和探讨二语词汇的深度习得及其现实实现问题。
关键词 词语深度习得 非母语特性 错误 类联接和搭配
下载PDF
基于键盘距离和依存分析的拼写纠错方法 被引量:1
8
作者 谢文慧 易荣庆 彭涛 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2018年第5期1179-1186,共8页
利用基于键盘距离和依存分析的拼写纠错模型,解决文本输入过程中产生的非词错误.通过综合考虑邻近权值、依存关系权值及词频三部分构造最终的拼写纠错模型,并在Brown语料库、Gutenberg语料库和Inaugural语料库上验证该模型.实验结果表明... 利用基于键盘距离和依存分析的拼写纠错模型,解决文本输入过程中产生的非词错误.通过综合考虑邻近权值、依存关系权值及词频三部分构造最终的拼写纠错模型,并在Brown语料库、Gutenberg语料库和Inaugural语料库上验证该模型.实验结果表明,该模型可有效进行非词纠错. 展开更多
关键词 键盘距离 单词距离 依存分析 SpellKD模型 非词错误
下载PDF
关于解决蒙古文形对码错错误的研究综述
9
作者 杨利润 斯琴巴图 锡林宝力尔 《现代计算机》 2020年第4期29-31,36,共4页
首先给出蒙古文电子文本中“形对码错”错误的概念及产生原因,并根据产生原因将“形对码错”错误分为“读音非词”和“同形词替代”等两种错误,之后分别归纳总结解决“读音非词”和“同形词替代”两种错误的主要研究方法。
关键词 蒙古文校对 形对码错 读音非词 同形词替代
下载PDF
从词内同化看非汉字圈留学生汉字书写偏误
10
作者 黄蓬博 吴日霞 +1 位作者 代晶 辛梓 《大理大学学报》 CAS 2021年第5期109-114,共6页
词内同化汉字偏误是留学生常见的偏误之一。借助HSK动态作文语料库,收集非汉字圈留学生词内同化汉字偏误231个。通过考察这些偏误的分布趋势和类型特征,发现非汉字圈留学生的词内同化汉字偏误集中出现于中高级水平的作文中,且表现为以... 词内同化汉字偏误是留学生常见的偏误之一。借助HSK动态作文语料库,收集非汉字圈留学生词内同化汉字偏误231个。通过考察这些偏误的分布趋势和类型特征,发现非汉字圈留学生的词内同化汉字偏误集中出现于中高级水平的作文中,且表现为以部件添加和改换为主要手段,顺同化和逆同化数量相当,部件改换式顺同化和部件添加式逆同化凸显的特点。针对统计中出现的高频偏误,利用现场测试的方法,对留学生的测试结果和反馈进行整理,并从汉字习得顺序、汉字构形规律和汉字组合同化三个方面,解释留学生出现偏误的原因,提出相应的教学建议。 展开更多
关键词 词内同化汉字偏误 非汉字圈留学生 统计与分类 成因分析 教学建议
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部