期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
上海光源PDM全文检索系统的改进
1
作者 李玖栋 邓辉宇 《核技术》 CAS CSCD 北大核心 2011年第10期721-725,共5页
上海光源的产品数据管理(PDM)原有的全文检索系统是一个基于数据库的检索系统,该系统在检全率、检准率以及相关度排序上均存在着不足。通过修改中文分词算法和细化相关度排序算法等手段对该系统进行改进,提高了系统的性能。测试结果表... 上海光源的产品数据管理(PDM)原有的全文检索系统是一个基于数据库的检索系统,该系统在检全率、检准率以及相关度排序上均存在着不足。通过修改中文分词算法和细化相关度排序算法等手段对该系统进行改进,提高了系统的性能。测试结果表明检全率和检准率均得以提高,满足了上海光源对图文档管理的需求。 展开更多
关键词 产品数据管理(pdm) 全文检索 中文分词 相关度排序
原文传递
基于Lucene的地名数据库快速检索系统 被引量:20
2
作者 张文元 周世宇 谈国新 《计算机应用研究》 CSCD 北大核心 2017年第6期1756-1761,共6页
针对传统关系型数据库海量地名数据检索效率低下的问题,提出了一种盘古分词和Lucene全文检索相结合的地名数据库快速检索方法。首先,设计了一种地名数据表结构,比较了几种常用开源分词器的中文分词性能,并选用性能优异的盘古中文分词器... 针对传统关系型数据库海量地名数据检索效率低下的问题,提出了一种盘古分词和Lucene全文检索相结合的地名数据库快速检索方法。首先,设计了一种地名数据表结构,比较了几种常用开源分词器的中文分词性能,并选用性能优异的盘古中文分词器,通过扩展其词典来实现中文地名的有效分词。其次,利用内存索引和多线程并行处理技术提高Lucene创建倒排索引效率,并依据地名类别和显示优先级属性优化了检索结果相关度排序策略。最后,开发了一套具有快速搜索和地图定位展示的Web地名检索系统,使用500万条真实地名数据测试了其检索性能,查询平均耗时不到1s,比MySQL数据库模糊检索效率提高了15倍,匹配结果也更加准确,能够提供高效灵活的海量地名公共检索服务。 展开更多
关键词 LUCENE 地名 全文检索 数据库 中文分词 相关度排序
下载PDF
PHP+MYSQL环境下的中文分词技术研究 被引量:1
3
作者 徐殿军 崔宝华 《辽宁师范大学学报(自然科学版)》 CAS 北大核心 2008年第1期57-59,共3页
要想在上百亿的网页中找到有意义结果,最重要的是把最相关的结果显示出来,而且要排在最前面,这也称为相关度排序.中文分词的准确与否,常常直接影响到对搜索结果的相关度排序.对PHP编写模拟分词函数进行了研究和分析.给出了PHP+MYSQL环... 要想在上百亿的网页中找到有意义结果,最重要的是把最相关的结果显示出来,而且要排在最前面,这也称为相关度排序.中文分词的准确与否,常常直接影响到对搜索结果的相关度排序.对PHP编写模拟分词函数进行了研究和分析.给出了PHP+MYSQL环境下实现传统分词的实现过程.并在此基础上引入了字典的概念,因其在分词之前已提前调入内存,从而大大提高了分词的效率和准确性.在PHP+MYSQL环境下为中文的分词过程实现提供了良好的平台基础,丰富的PHP函数为实现精确的分词提供了语言和语法的支持,MYSQL轻型数据库为字典提供快速的存取. 展开更多
关键词 全文检索 中文分词 相关度排序 PHP MYSQL
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部