期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
分词技术的研究与应用——一种快速分词的实现 被引量:2
1
作者 吴宏洲 《电脑知识与技术》 2015年第2X期179-182,186,共5页
该文主要论述一种快速分词技术的实现。对于GBK编码格式的原始文献,利用GBK可见汉字,建立内存常驻索引,按照最大匹配法查找外存分词词典库,从而将文章例句进行快速切分。理论上是目前最快的一种分词方法。
关键词 正向分词 逆向分词 GBK 字典索引
下载PDF
用链栈存储搜索关键字提高中文搜索引擎中分词的速度与精确度
2
作者 赵双柱 《福建电脑》 2010年第1期86-86,90,共2页
分词方法是中文搜索引擎系统中最为基础和最为重要的技术,它直接影响搜索引擎对用户搜索结果的准确性与快速性。本文采用链栈存储用户按搜索目标分割好的搜索关键字,利用链栈先进后出的操作特点,用逆向最大匹配分词法实现中文搜索引擎... 分词方法是中文搜索引擎系统中最为基础和最为重要的技术,它直接影响搜索引擎对用户搜索结果的准确性与快速性。本文采用链栈存储用户按搜索目标分割好的搜索关键字,利用链栈先进后出的操作特点,用逆向最大匹配分词法实现中文搜索引擎中搜索关键字的快速与准确分词,从而实现系统对用户搜索的快速与准确反应。 展开更多
关键词 链栈 动态操作 逆向最大匹配分词
下载PDF
课程知识检索系统中检索器模块的实现 被引量:1
3
作者 薛醒思 《闽江学院学报》 2008年第5期74-77,共4页
提出了一个基于领域本体的课程知识检索系统,探讨了个性化检索技术在系统的检索器模块中的应用,并详细介绍了检索器模块中基于本体的逆向最大匹配分词算法(RMM)和分层遍历森林算法的实现,为课程知识检索系统进一步的开发工作奠定了基础.
关键词 课程知识检索系统 领域本体 逆向最大匹配分词算法 分层遍历森林算法
下载PDF
肿瘤电子病历数据挖掘技术的应用研究 被引量:1
4
作者 童刚 姜宁 刘焕 《计算机技术与发展》 2020年第8期152-156,共5页
旨在研究肿瘤电子病历数据挖掘技术,重点探究数据抽取及挖掘分析实验。数据抽取是对文本信息进行针对性抽取,以结构化的形式将结果储存起来,从而为分类算法的研究奠定数据基础。重点研究了肿瘤电子病历的中文分词及分类挖掘算法的选取,... 旨在研究肿瘤电子病历数据挖掘技术,重点探究数据抽取及挖掘分析实验。数据抽取是对文本信息进行针对性抽取,以结构化的形式将结果储存起来,从而为分类算法的研究奠定数据基础。重点研究了肿瘤电子病历的中文分词及分类挖掘算法的选取,对于中文分词的研究,提出了改进后的逆向最大匹配算法,提高了分词准确度和分词效率。对于分类挖掘算法的研究,采用分类效果较好的C4.5算法和BP神经网络算法分别进行分类挖掘实验,通过对分类算法的性能对比,在研究肿瘤电子病历的分类挖掘上,C4.5算法更有利于辅助医生进行肿瘤疾病诊断,提高疾病诊断的精确率及效率进而提高肿瘤患者的治愈率。 展开更多
关键词 肿瘤电子病历 辅助诊断 逆向最大匹配分词 C4.5 神经网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部