期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于字串切分统计词典的繁体中文拼写检错方法
1
作者 王勇 顾磊 《计算机应用研究》 CSCD 北大核心 2016年第5期1370-1373,1378,共5页
针对繁体中文拼写检错的问题进行了研究,提出一种基于字串切分统计词典的检错方法。利用语料库中字串出现的频率信息作为检错依据,根据字串及其频率信息来建立统计词典,并设计了基于统计规则评判的检错算法。以SIGHAN7会议中文拼写校验... 针对繁体中文拼写检错的问题进行了研究,提出一种基于字串切分统计词典的检错方法。利用语料库中字串出现的频率信息作为检错依据,根据字串及其频率信息来建立统计词典,并设计了基于统计规则评判的检错算法。以SIGHAN7会议中文拼写校验任务中用于检错评测的1 000句测试集作为实验测试集,并与此会议提交的结果进行比较,实验结果表明,与基于复杂语言模型的检错方法相比,该方法在实现简单的同时也有很好的检错效果,获得了较高的准确率和精确率以及较低的误报率。 展开更多
关键词 中文语言处理 繁体中文拼写检错 中文分词 字串切分 统计词典 混淆集
下载PDF
浅谈互联网信息挖掘技术 被引量:2
2
作者 黄君羡 欧薇 《广东交通职业技术学院学报》 2003年第4期37-38,41,共3页
本文就互联网信息挖掘技术和对网络信息挖掘中的关键技术、系统流程进行了阐述。
关键词 互联网 信息挖掘技术 系统流程 网络搜索引擎 目标样本 中文分词 统计词典
下载PDF
英汉─汉英统计大词典正式出版
3
作者 王吉利 《中国统计》 CSSCI 北大核心 2001年第8期59-59,共1页
关键词 书评 《英汉-汉英统计词典 统计知识
原文传递
Knowledge Automatic Indexing Based on Concept Lexicon and Segm-entation Algorithm
4
作者 王兰成 蒋丹 乐嘉锦 《Journal of Donghua University(English Edition)》 EI CAS 2005年第1期26-30,共5页
This paper is based on two existing theories about automatic indexing of thematic knowledge concept. The prohibit-word table with position information has been designed. The improved Maximum Matching-Minimum Backtrack... This paper is based on two existing theories about automatic indexing of thematic knowledge concept. The prohibit-word table with position information has been designed. The improved Maximum Matching-Minimum Backtracking method has been researched. Moreover it has been studied on improved indexing algorithm and application technology based on rules and thematic concept word table. 展开更多
关键词 Concept Lexicon Segmentation Algorithm Knowledge Indexing.
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部