期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
使用机械分词与特征扫描实现对甲骨卜辞的切分 被引量:2
1
作者 陆公正 开金宇 《苏州市职业大学学报》 2013年第4期2-6,共5页
依据甲骨文语法及甲骨文词典对甲骨卜辞进行切分,是建立甲骨文语料库实现计算机辅助甲骨文考释的前提和基础.针对甲骨卜辞的切分,采用机械分词与特征扫描相结合的中文分词技术对200条比较完整的卜辞进行切分实验,将只使用机械分词和结... 依据甲骨文语法及甲骨文词典对甲骨卜辞进行切分,是建立甲骨文语料库实现计算机辅助甲骨文考释的前提和基础.针对甲骨卜辞的切分,采用机械分词与特征扫描相结合的中文分词技术对200条比较完整的卜辞进行切分实验,将只使用机械分词和结合了特征扫描的两种方法进行比较.结果表明,采用机械分词与特征扫描相结合,实现甲骨卜辞的切分的正确率和效率都较高. 展开更多
关键词 甲骨卜辞 分词技术 机械分词 特征扫描 LUCENE
下载PDF
智能化中文机械分词组件的设计
2
作者 齐忠琪 《中国教育技术装备》 2009年第21期95-96,共2页
分词是计算机系统对自然语言处理的第一步,分词的方法与准确率将显著影响自然语言的处理效果。在分析机械分词技术的基础上,提出构建智能化机械分词组件的思想,论述构建智能化中文分词组件的基本思路与方法,指出智能化中文机械分词... 分词是计算机系统对自然语言处理的第一步,分词的方法与准确率将显著影响自然语言的处理效果。在分析机械分词技术的基础上,提出构建智能化机械分词组件的思想,论述构建智能化中文分词组件的基本思路与方法,指出智能化中文机械分词组件在中文信息处理领域中的应用前景。 展开更多
关键词 中文处理 机械分词 组件设计
下载PDF
基于Hash结构的机械统计分词系统研究 被引量:8
3
作者 费洪晓 胡海苗 巩燕玲 《计算机工程与应用》 CSCD 北大核心 2006年第5期159-161,共3页
在综合比较了常用的机械分词方法和统计分词方法基础上,论文设计并实现了一种基于Hash结构的机械统计分词系统。系统突破了传统的机械分词方法和统计分词方法,结合了两者的优势,并对其做了一系列的改进。从对测试结果的分析可以看出,系... 在综合比较了常用的机械分词方法和统计分词方法基础上,论文设计并实现了一种基于Hash结构的机械统计分词系统。系统突破了传统的机械分词方法和统计分词方法,结合了两者的优势,并对其做了一系列的改进。从对测试结果的分析可以看出,系统的分词速度达到了每秒一万两千个汉字以上,且具有较强的未登陆词识别能力。 展开更多
关键词 中文分词 机械分词 统计分词 Hash结构
下载PDF
一种改进的MM分词方法的算法设计 被引量:28
4
作者 骆正清 陈增武 胡上序 《中文信息学报》 CSCD 1996年第3期30-36,共7页
本文提出了一种改进的最大匹配(MM)的自动分词方法,并给出了相应的算法及词典设计。
关键词 汉语 自动分词 最大匹配 机械分词
下载PDF
基于反序词典的中文分词技术研究 被引量:18
5
作者 罗桂琼 费洪晓 戴弋 《计算机技术与发展》 2008年第1期80-83,共4页
中文自动分词是计算机中文信息处理中的难题。在对中文分词的现有技术研究的基础上,对反序最大匹配分词方法进行了较深入的研究探讨,在此基础上对中文分词的词典结构和分词算法做了一部分改进,设计了基于反序词典的中文分词系统。实验表... 中文自动分词是计算机中文信息处理中的难题。在对中文分词的现有技术研究的基础上,对反序最大匹配分词方法进行了较深入的研究探讨,在此基础上对中文分词的词典结构和分词算法做了一部分改进,设计了基于反序词典的中文分词系统。实验表明,该改进算法加快了中文的分词速度,使得中文分词系统的效率有了显著提高。 展开更多
关键词 中文分词 反序最大匹配 机械分词 反序词典
下载PDF
汉语自动分词研究综述 被引量:16
6
作者 骆正清 陈增武 +1 位作者 王泽兵 胡上序 《浙江大学学报(自然科学版)》 EI CSCD 1997年第3期306-312,共7页
本文对汉语自动分词的方法进行了概述,并在考察分词精度和分词知识的基础上。
关键词 汉语自动分词 分词精度 中文信息处理 机械分词
下载PDF
对中文分词系统预处理模块算法的研究和改进
7
作者 刘勇 范丽辉 《科技信息》 2012年第8期264-265,共2页
中文分词技术是一项在搜索引擎中广泛应用的关键技术,也是中文信息处理中的一项关键技术。文章通过对中文分词系统中预处理模块的改进提高了分词的速度,改进了分词系统。
关键词 中文分词 机械分词 词典 正向最大匹配 预处理模块
下载PDF
基于层次分析法的中文分词算法改进 被引量:1
8
作者 丁洁 《信息技术》 2016年第10期190-193,共4页
首先简要介绍了中文分词的应用领域,指出中文分词所面临的问题,歧义语句和未登录词的识别率低的现状。然后,在传统的机械分词算法基础上,改进算法,引入了多种优化技术。基于上述理论和改进算法,设计并实现了一个改进的中文分词系统,不... 首先简要介绍了中文分词的应用领域,指出中文分词所面临的问题,歧义语句和未登录词的识别率低的现状。然后,在传统的机械分词算法基础上,改进算法,引入了多种优化技术。基于上述理论和改进算法,设计并实现了一个改进的中文分词系统,不仅能够保证快速分词,而且提高了分词的正确率,改善了歧义语句和未登录词的识别率低的问题。 展开更多
关键词 中文分词 机械分词 自然语言处理
下载PDF
甲骨刻辞词性标注语料库系统设计与实现 被引量:2
9
作者 开金宇 刘永革 李欣 《殷都学刊》 2011年第2期32-34,共3页
使用计算机辅助甲骨学研究,建设甲骨刻辞词性标注语料库是必不可少的一项基础性工程。现在还没有现成的甲骨刻辞词性标注语料库,因此,有必要设计和实现甲骨刻辞词性标注语料库系统。这个标注系统结合人工标注、机器标注和人工审核,循环... 使用计算机辅助甲骨学研究,建设甲骨刻辞词性标注语料库是必不可少的一项基础性工程。现在还没有现成的甲骨刻辞词性标注语料库,因此,有必要设计和实现甲骨刻辞词性标注语料库系统。这个标注系统结合人工标注、机器标注和人工审核,循环作业,快速、高效地建设甲骨刻辞语料库。 展开更多
关键词 甲骨刻辞词性标注语料库 机械分词 特征扫描 最大概率标注法
下载PDF
内容管理系统的文章关键词提取组件分析与优化 被引量:3
10
作者 陆钊 《玉林师范学院学报》 2015年第5期135-141,共7页
SEO仍是中小网站提升网站排名的主要方法,优化关键词是其中重要的环节。本文从中文分词处理的角度,通过理论和结构分析,针对Dede CMS提出了一套优化关键词提取组件的方法,经实验对比结果证明了方法的有效性.同时还提出了推广的思路.
关键词 分词提取 机械分词 词典编译 DEDECMS
下载PDF
基于规则的英汉翻译系统的设计与实现
11
作者 张翠萍 《三明学院学报》 2011年第6期36-41,共6页
针对用计算机来实现不同语言间的自动翻译这一问题,设计了基于规则的英汉翻译系统,系统对词库中的词进行预处理,使之符合一定的规范,在此基础上根据单词语义切分句子,将特定单词划分成结点逐步形成译文,而后在查找过程中,找到匹配的译文... 针对用计算机来实现不同语言间的自动翻译这一问题,设计了基于规则的英汉翻译系统,系统对词库中的词进行预处理,使之符合一定的规范,在此基础上根据单词语义切分句子,将特定单词划分成结点逐步形成译文,而后在查找过程中,找到匹配的译文,最后对每个结点的译文按照事先设立的语法来进行重组,使之最大限度地符合自然语言语法规则,达到使用户可以认识和理解的最终目的。实验证明,系统能有效实现翻译功能,具有一定的应用性。 展开更多
关键词 翻译 规则 机械分词
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部