期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
A Spell Checking Web Service API for Smart City Communication Platforms
1
作者 Vita S. Barletta Danilo Caivano +1 位作者 Antonella Nannavecchia Michele Scalera 《Open Journal of Applied Sciences》 2019年第12期819-840,共22页
The Internet of Things becomes Internet of Everything when in the process of communication machine-to-machine also intelligent forms of communication between human and machine are involved. Cities can be viewed as a m... The Internet of Things becomes Internet of Everything when in the process of communication machine-to-machine also intelligent forms of communication between human and machine are involved. Cities can be viewed as a microcosm of this interconnected system where ICT and emerging technologies can be enabling factors to transform cities in Smart Cities. Cities can take great advantage by using information intelligence to achieve important public-policy goals and, in particular, by enabling network communication channels between citizens and public administrators in order to provide information and online services in real time through platform systems rather than by means of humans, using Artificial Intelligence and Natural Language Processing techniques. This work was the first step of a wider project aimed at providing a Spell Checking Web Service API for Smart City communication platforms able to automatically select, among the large availability of open source spell checking tools, the most suitable tool based on the semantic structure of the specific textual data. The system should manage an enhanced Italian Vocabulary Database, specifically implemented to support all the tools of the system. The goal of the present work was to test, through an experimental research, the feasibility of the entire project by implementing a Spell Checking Prototype System designed to manage two selected spell checking tools. Results showed that the Spell Checking Prototype System significantly improves performances by allowing the user to select the most suitable tool for the specific semantic structure of the text. The system also enables to manage the list of exceptions, which continuously enhance the Italian Vocabulary Database. The experimentation proved scientific evidence of the validity of the project aimed at implementing a Spell Checking Web Service API in order to improve the quality of natural language data to be stored or processed in Smart City NCeSDP systems, through the use of existing spell checking tools. 展开更多
关键词 Internet of Everything Smart CITY NATURAL LANGUAGE Processing spell checkING Service
下载PDF
基于BERT和多特征融合嵌入的中文拼写检查 被引量:1
2
作者 刘哲 殷成凤 李天瑞 《计算机科学》 CSCD 北大核心 2023年第3期282-290,共9页
由于汉字的多样性和中文语义表达的复杂性,中文拼写检查仍是一项重要且富有挑战性的任务。现有的解决方法通常存在无法深入挖掘文本语义的问题,且在利用汉字独特的相似性特征时往往通过预先建立的外部资源或是启发式规则来学习错误字符... 由于汉字的多样性和中文语义表达的复杂性,中文拼写检查仍是一项重要且富有挑战性的任务。现有的解决方法通常存在无法深入挖掘文本语义的问题,且在利用汉字独特的相似性特征时往往通过预先建立的外部资源或是启发式规则来学习错误字符与正确字符之间的映射关系。文中提出了一种融合汉字多特征嵌入的端到端中文拼写检查算法模型BFMBERT(BiGRU-Fusion Mask BERT)。该模型首先利用结合混淆集的预训练任务使BERT学习中文拼写错误知识,然后使用双向GRU网络捕获文本中每个字符错误的概率,利用该概率计算汉字语义、拼音和字形特征的融合嵌入表示,最后将这种融合嵌入输入到BERT中的掩码语言模型(Mask Language Model,MLM)以预测正确字符。在SIGHAN 2015基准数据集上对BFMBERT进行了评测,取得了82.2的F1值,其性能优于其他基线模型。 展开更多
关键词 中文拼写检查 BERT 文本校对 掩码语言模型 字词错误校对 预训练模型
下载PDF
基于局部语义增强的中文拼写纠错方法
3
作者 卓奕炜 田泽佳 门豪 《电子设计工程》 2023年第3期54-57,62,共5页
针对当前主流的中文拼写纠错模型对文本局部上下文特征学习不足的问题,该文提出基于局部语义特征增强的改进思路:在自注意力计算单元中添加高斯分布的偏置矩阵,改变注意力权重分布,使得纠错模型可以强化对当前位置相邻文本特征的学习;... 针对当前主流的中文拼写纠错模型对文本局部上下文特征学习不足的问题,该文提出基于局部语义特征增强的改进思路:在自注意力计算单元中添加高斯分布的偏置矩阵,改变注意力权重分布,使得纠错模型可以强化对当前位置相邻文本特征的学习;而在计算注意力得分时减少当前位置的权重,可以进一步提升学习局部信息的效果。实验表明,该文提出的改进方法对中文拼写纠错任务的精确率、召回率和F1值均有提升,其中F1值与过往最好成果相比可提升1.74%。 展开更多
关键词 中文拼写纠错 自注意力网络 局部语义增强 高斯分布
下载PDF
基于深度模型的汉字拼写检查方法
4
作者 陈哲 曹阳 《南通大学学报(自然科学版)》 CAS 2023年第4期69-78,共10页
针对汉语初学者在学习汉语时不可避免地会出现拼写错误的问题,提出一个汉语拼写检查模型,用以检测和纠正句子中的拼写错误。模型结合了汉字的视觉特征和语音特征,由一个检查网络和一个纠正网络构成。基于双向长短期记忆网络(bidirection... 针对汉语初学者在学习汉语时不可避免地会出现拼写错误的问题,提出一个汉语拼写检查模型,用以检测和纠正句子中的拼写错误。模型结合了汉字的视觉特征和语音特征,由一个检查网络和一个纠正网络构成。基于双向长短期记忆网络(bidirectional long short-term memory network,BiLSTM)和条件随机场(conditional random field,CRF)构成的检测网络用于检测句子中的错误字;基于BERT(bidirectional encoder representations from transformer)模型的纠正网络用以结合全局上下文信息对检测到的错误字进行纠正。最后,在CLP-2014,SIGHAN-2013和SIGHAN-2015数据集上进行实验,结果表明:相比现有的方法,提出的模型在错字检测和错字纠正上的效果均得到了提升;相比利用视觉特征,汉字的语音特征能更好地提升错字的检测效果。 展开更多
关键词 汉语拼写检查 长短期记忆网络 条件随机场 BERT
下载PDF
基于大规模网络语料的藏文音节拼写错误统计与分析 被引量:6
5
作者 刘汇丹 洪锦玲 +1 位作者 诺明花 吴健 《中文信息学报》 CSCD 北大核心 2017年第2期61-70,共10页
针对从互联网获取的一份包含19万藏文网页,总计427万句、9 328万音节字的藏文文本语料,该文按照预定的规则对其中的藏文音节拼写错误情况进行了统计与分析。数据显示,在语料中出现的共计20 743个藏文音节中,含有拼写错误的音节共有9 700... 针对从互联网获取的一份包含19万藏文网页,总计427万句、9 328万音节字的藏文文本语料,该文按照预定的规则对其中的藏文音节拼写错误情况进行了统计与分析。数据显示,在语料中出现的共计20 743个藏文音节中,含有拼写错误的音节共有9 700个,占藏文音节总数的46.762 8%,错误音节在语料中共出现27 427次,仅占0.030 8%,说明这份语料的文本质量是相当高的。文中还详细统计了各种不同表现形式的错误音节所占比重,并分析了导致拼写错误的四个主要原因:一是输入了多余的元音符号;二是音节点或句尾空格缺失;三是同一字丁/字符存在多种表达形式;四是错误地使用了相似字符。 展开更多
关键词 藏文拼写检查 拼写检查 语料 统计 藏文信息处理 中文信息处理
下载PDF
TSRM藏文拼写检查算法 被引量:11
6
作者 珠杰 李天瑞 刘胜久 《中文信息学报》 CSCD 北大核心 2014年第3期92-98,共7页
拼写检查作为文本处理中的重要内容,在字处理软件、文字识别、语音识别、搜索引擎等领域具有广泛的应用。该文以藏文语音特性建立的字组织法为依据,以藏文音节规则为模型,提出了藏文音节规则模型(TSRM)的藏文音节拼写检查算法,并通过2... 拼写检查作为文本处理中的重要内容,在字处理软件、文字识别、语音识别、搜索引擎等领域具有广泛的应用。该文以藏文语音特性建立的字组织法为依据,以藏文音节规则为模型,提出了藏文音节规则模型(TSRM)的藏文音节拼写检查算法,并通过2组实验验证了算法的有效性。在没有考虑梵音转写藏文的情况下,拼写错误检查的准确率可以达到99.8%。 展开更多
关键词 藏文音节 藏文规则 拼写检查
下载PDF
中文文本自动校对 被引量:23
7
作者 张磊 周明 +1 位作者 黄昌宁 潘海华 《语言文字应用》 CSSCI 北大核心 2001年第1期19-26,共8页
本文详细介绍了中文文本自动校对的研究现状 ,包括文本中错误的分类 ,中文自动校对中常用的语言模型 ,以及一些有代表性的工作。作为参考 ,本文还介绍了英文拼写检查的方法 ,比较了中英文自动校对的异同并重点介绍了其中对中文自动校对... 本文详细介绍了中文文本自动校对的研究现状 ,包括文本中错误的分类 ,中文自动校对中常用的语言模型 ,以及一些有代表性的工作。作为参考 ,本文还介绍了英文拼写检查的方法 ,比较了中英文自动校对的异同并重点介绍了其中对中文自动校对有参考价值的几种基于特征的方法。 展开更多
关键词 中文文本自动校对 拼写检查 自然语言处理
下载PDF
英文作文的自动拼写检查研究 被引量:5
8
作者 李斌 姚建民 朱巧明 《郑州大学学报(理学版)》 CAS 2008年第3期48-51,共4页
基于自动拼写检查的研究现状,将英文作文中的拼写错误进行了分类,并分别采用规则匹配和统计建模的方法对单词的非词错误和真词错误进行了研究,从而扩大了对英文单词进行拼写检查的研究范围.真词错误检查主要是利用贝叶斯定理,并通过建... 基于自动拼写检查的研究现状,将英文作文中的拼写错误进行了分类,并分别采用规则匹配和统计建模的方法对单词的非词错误和真词错误进行了研究,从而扩大了对英文单词进行拼写检查的研究范围.真词错误检查主要是利用贝叶斯定理,并通过建立一些特定的混淆集的方法来实现.通过实验数据分析,该系统的准确率达到了80%以上. 展开更多
关键词 拼写检查 真词错误 非词错误 贝叶斯定理 混淆集
下载PDF
基于词典和统计相结合的维吾尔语拼写检查方法 被引量:2
9
作者 麦合甫热提 艾山.吾买尔 +2 位作者 麦热哈巴.艾力 吐尔根.伊布拉音 张健 《中文信息学报》 CSCD 北大核心 2014年第2期66-71,共6页
该文通过研究国内外相关的拼写错误查错和纠错方法的理论,再结合维吾尔语自身的特点,提出了基于词典和统计相结合的维吾尔语拼写查错方法。首先,提出基于词典的方法进行词库和词干提取的拼写检查;其次,提出基于N元语法的词缀连接有效性... 该文通过研究国内外相关的拼写错误查错和纠错方法的理论,再结合维吾尔语自身的特点,提出了基于词典和统计相结合的维吾尔语拼写查错方法。首先,提出基于词典的方法进行词库和词干提取的拼写检查;其次,提出基于N元语法的词缀连接有效性判断模型,对未登录词提出基于N元语法的拼写检查模型;最后,结合以上几种方法各自的优点提出基于混合策略的拼写检查方法,该方法在准确性和检查结果可靠性等方面得到了较显著的提高。 展开更多
关键词 维吾尔语 拼写检查 词典 N元语法
下载PDF
微信语音找书研究 被引量:15
10
作者 黎邦群 《图书情报知识》 CSSCI 北大核心 2014年第6期54-61,共8页
针对当前手机输入文字不便、拼写容易出错导致用户找书体验不佳的现状,通过分析语音找书的应用现状与实际工作中的应用需求,阐述了基于微信公众平台建设图书馆公众号语音找书应用的技术思路,采用拼写检查、中文分词、拼音搜索等关键技... 针对当前手机输入文字不便、拼写容易出错导致用户找书体验不佳的现状,通过分析语音找书的应用现状与实际工作中的应用需求,阐述了基于微信公众平台建设图书馆公众号语音找书应用的技术思路,采用拼写检查、中文分词、拼音搜索等关键技术和方法,判断用户的真实查询意图,优化图书查找的策略,对用户使用微信输入语音的识别结果进行修正和反馈,提出了语音找书的具体设计方案、建设实现过程、建设中出现的主要问题及解决方法,并对应用效果进行了评估,结果成功实现了微信语音找书,方便了用户,提升了找书的效率与服务的质量。 展开更多
关键词 微信 公众号 语音找书 图书查询 拼写检查 中文分词 拼音搜索
下载PDF
云计算环境下的高效密文检索协议 被引量:1
11
作者 段桂华 鞠瑞 +1 位作者 王玉斌 刘煜 《信息网络安全》 2013年第9期26-29,共4页
为了保护云平台用户的隐私,防止服务器第三方获知用户信息,文章提出了一种基于异步拼写检查的云端密文检索方案EFCS(Efficient Fuzzy Cipher Search)。该方案基于异步拼写检查,采用spell checker、文件过滤、分级推送和动态词库等技术... 为了保护云平台用户的隐私,防止服务器第三方获知用户信息,文章提出了一种基于异步拼写检查的云端密文检索方案EFCS(Efficient Fuzzy Cipher Search)。该方案基于异步拼写检查,采用spell checker、文件过滤、分级推送和动态词库等技术实现云平台上的密文检索。与已有的基于通配符的模糊密文检索方案进行性能对比,EFCS能在保证相同安全性能的前提下,具有较低的存储开销、通信开销和解密计算代价。 展开更多
关键词 密文检索 模糊搜索 云计算 拼写检查
下载PDF
一个用于OCR输出的中文文本的拼写校对系统 被引量:3
12
作者 李蓉 《中文信息学报》 CSCD 北大核心 2009年第5期92-97,共6页
该文描述了一个处理OCR输出的中文文本的拼写校正系统。使用一个大的正负语料库来建立错误模式库;负语料库中包含OCR识别错误,而正语料库中为对错误进行了编改后的正确文本。首先应用句子匹配算法从正负语料库中提取匹配的句子;然后使... 该文描述了一个处理OCR输出的中文文本的拼写校正系统。使用一个大的正负语料库来建立错误模式库;负语料库中包含OCR识别错误,而正语料库中为对错误进行了编改后的正确文本。首先应用句子匹配算法从正负语料库中提取匹配的句子;然后使用比较算法从匹配的两个句子中提取不同的字符;若两个句子存在不同,则使用错词提取算法来获得错误词和对应的校正词,并以如下三元组的形式保存:(校正词,错词,出现次数)。用上述算法运行整个正负语料库之后,可获得错误模式的集合,由此建立错误模式库。错误模式可看作是校正规则,用于校正文本中和模式中与"错词"相同形式的错误。根据"错词"的长度将错误模式分为两类,一类为"错词"的长度大于两个字符,可直接应用错误模式规则进行校正;另一类为"错词"的长度等于两个字符,需使用验证算法确定是否当前的模式需要被校正。以上方法是为同方光盘公司开发的THOCR中文校对系统的核心算法,其中正负语料库来自公司在期刊网建设中的积累。由于算法所获得的错误模式均来自真实的OCR识别文本,所以校对效果较好。结尾部分给出了本校对系统的实验结果。 展开更多
关键词 计算机应用 中文信息处理 错误校对 正负语料 学习算法
下载PDF
英文光学字符识别的后处理 被引量:7
13
作者 吕学强 迟呈英 《鞍山钢铁学院学报》 2002年第3期192-196,共5页
总结了英文光学字符识别 (OCR)系统中的常见错误类型 ,论证了使用拼写检查技术发现错误的可能性 .以最相似单词替换OCR的错误输出 ,从而达到改正错误的目的 .利用编辑距离实现词汇相似性评估 ,并用动态规划技术优化了编辑距离的计算 .... 总结了英文光学字符识别 (OCR)系统中的常见错误类型 ,论证了使用拼写检查技术发现错误的可能性 .以最相似单词替换OCR的错误输出 ,从而达到改正错误的目的 .利用编辑距离实现词汇相似性评估 ,并用动态规划技术优化了编辑距离的计算 .试验结果证明该方法可以使OCR系统的单词识别率提高 6 2 5 % . 展开更多
关键词 英文光学字符识别 后处理 拼写检查 编辑距离 字符识别率 单词识别率
下载PDF
Microsoft Word的拼写检查功能及其引用 被引量:1
14
作者 熊小兵 《信息技术》 2005年第7期140-143,共4页
从Word的COM体系结构入手,重点探讨了与拼写检查有关的对象、方法和属性,以及在应用编程时通过会话框来引用Word的拼写检查功能的模块化方法。
关键词 MICROSOFT WORD 拼写检查 COM 应用编程
下载PDF
Metaphone语音匹配算法及其应用研究 被引量:2
15
作者 马立东 《计算机时代》 2010年第10期39-43,46,共6页
综述了Metaphone语音匹配算法;与Soundex算法的编码结果相比较,指出了Metaphone算法的优缺点。对一段实现Metaphone算法的Delphi源代码进行了分析,并修正了其中的漏洞。用典型实例说明Metaphone适用于检查及校正和语音相关的拼写错误。... 综述了Metaphone语音匹配算法;与Soundex算法的编码结果相比较,指出了Metaphone算法的优缺点。对一段实现Metaphone算法的Delphi源代码进行了分析,并修正了其中的漏洞。用典型实例说明Metaphone适用于检查及校正和语音相关的拼写错误。介绍了Metaphone的两大应用领域,并指出了Metaphone在文本清理等领域的潜在用途。 展开更多
关键词 Metaphone 语音编码 语音匹配 拼写检查 文本清理
下载PDF
一种有效的拼写错误自动校正技术
16
作者 王素琴 《郑州大学学报(自然科学版)》 CAS 1995年第1期16-18,共3页
编译程序一项重要任务是诊察程序中的错误并尽可能改正,拼写错误是源程序中一种常见的错误,本文提出一种有效的拼写错误校正技术,它以一种统一的方式对四种常见的拼写错误进行诊察,并自动进行校正。
关键词 编译程序 拼写错误 校正 自动校正 源程序
下载PDF
基于VBA面向词典编纂的英语拼写校正
17
作者 马立东 《软件》 2011年第10期8-11,15,共5页
研究适合词典编纂工作特点的英语拼写错误更正方法。根据VBA语法,用VB代码编程,对MicrosoftWord的可编程对象进行操作,实现计算机辅助英语拼写错误更正的半自动化处理。重点实现英语拼写错误及更正建议的批量自动提取和标注功能。通过... 研究适合词典编纂工作特点的英语拼写错误更正方法。根据VBA语法,用VB代码编程,对MicrosoftWord的可编程对象进行操作,实现计算机辅助英语拼写错误更正的半自动化处理。重点实现英语拼写错误及更正建议的批量自动提取和标注功能。通过对用户词典的程序控制,降低查错误报率,解决英语拼写变体差异引起的误报等问题。 展开更多
关键词 拼写检查 拼写校正 校对 词典
下载PDF
基于iPhone平台拼写检查工具的关键技术研究
18
作者 李顺 杨煦 《电脑知识与技术》 2013年第8X期5555-5556,共2页
该文研究内容是基于iPhone平台的英文拼写检查工具的关键技术,拼写检查工具就是针对英文文档,可以帮助用户来检查编写的英文文档是否正确,并能够根据字符串相似性算法智能的针对错误给出相应的拼写建议,用户可根据给出的拼写建议来修改... 该文研究内容是基于iPhone平台的英文拼写检查工具的关键技术,拼写检查工具就是针对英文文档,可以帮助用户来检查编写的英文文档是否正确,并能够根据字符串相似性算法智能的针对错误给出相应的拼写建议,用户可根据给出的拼写建议来修改文档。iPhone平台的搭建过程以及在iPhone平台上编写程序应用的关键技术,及编写过程中出现的问题。 展开更多
关键词 iPhone平台 拼写检查 词库 字符串相似性算法
下载PDF
基于统计翻译框架的蒙古文自动拼写校对方法 被引量:10
19
作者 苏传捷 侯宏旭 +1 位作者 杨萍 员华瑞 《中文信息学报》 CSCD 北大核心 2013年第6期175-179,共5页
在以国际标准编码存储的传统蒙古文电子文本中,拼写错误十分普遍。人工校对这些错误不仅速度慢而且成本高。该文提出了一种基于统计翻译框架的传统蒙古文自动拼写校对方法,将拼写校对看作是从错误词到正确词的翻译。该文使用改进的基于... 在以国际标准编码存储的传统蒙古文电子文本中,拼写错误十分普遍。人工校对这些错误不仅速度慢而且成本高。该文提出了一种基于统计翻译框架的传统蒙古文自动拼写校对方法,将拼写校对看作是从错误词到正确词的翻译。该文使用改进的基于短语的统计机器翻译模型来构建拼写校对模型,然后对测试文本进行校对。实验结果表明,该方法可以快速、有效地校对拼写错误,而且不依赖于特定语言的语法知识。使用该方法对包含1 026个正确词、1 102个错误词的测试集进行拼写校对,校对后文本中的正确词所占比例最高可达97.55%。 展开更多
关键词 蒙古文 拼写检查 拼写校对 机器翻译
下载PDF
藏文音节拼写检查的CNN模型 被引量:12
20
作者 色差甲 贡保才让 才让加 《中文信息学报》 CSCD 北大核心 2019年第1期111-117,共7页
藏文音节拼写检查是藏语自然语言处理的基本任务,在藏文文字处理、文字识别、文本生成等领域具有广泛的应用。该文首先针对藏文音节的结构提出了音节向量化的方法,即音节矩阵。然后构建了适合于藏文音节拼写检查的CNN模型,使用1 364 88... 藏文音节拼写检查是藏语自然语言处理的基本任务,在藏文文字处理、文字识别、文本生成等领域具有广泛的应用。该文首先针对藏文音节的结构提出了音节向量化的方法,即音节矩阵。然后构建了适合于藏文音节拼写检查的CNN模型,使用1 364 880个藏文音节进行训练。最后对68 244个藏文音节进行测试。实验结果显示,藏文音节拼写检查CNN模型的结果优于规则、RNN和LSTM等模型,不仅对符合藏文文法的音节能正确识别外,而且对梵音藏文音节也能有效识别,正确率、召回率以及F值分别为99.52%、99.30%和99.41%。 展开更多
关键词 藏文音节 音节矩阵 CNN模型 拼写检查
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部