期刊文献+

PHP+MYSQL环境下的中文分词技术研究 被引量:1

Research of chinese word automatic segmentation based on PHP and MYSQL
下载PDF
导出
摘要 要想在上百亿的网页中找到有意义结果,最重要的是把最相关的结果显示出来,而且要排在最前面,这也称为相关度排序.中文分词的准确与否,常常直接影响到对搜索结果的相关度排序.对PHP编写模拟分词函数进行了研究和分析.给出了PHP+MYSQL环境下实现传统分词的实现过程.并在此基础上引入了字典的概念,因其在分词之前已提前调入内存,从而大大提高了分词的效率和准确性.在PHP+MYSQL环境下为中文的分词过程实现提供了良好的平台基础,丰富的PHP函数为实现精确的分词提供了语言和语法的支持,MYSQL轻型数据库为字典提供快速的存取. The relevance ranking arranges a set of retrieved records so that those most likely to be relevant to your request are shown to you first. The relevance ranking of search results are directly decid- ed by accuracy of Chinese word segmentation. Basing on analysing simulation segmentation function by PHP, this paper presents an implement of segmentation in PHP+SQL. The implement greatly im- proves the efficiency and accuracy of the segmentation by introducing the concept of dictionary and loading before segmentation. This implement provides a good platform for Chinese word segmentation by rich PHP function and MYSQL database.
出处 《辽宁师范大学学报(自然科学版)》 CAS 北大核心 2008年第1期57-59,共3页 Journal of Liaoning Normal University:Natural Science Edition
关键词 全文检索 中文分词 相关度排序 PHP MYSQL full-text retrieval chinese word segmentation relevancy ranking PHP MYSQL
  • 相关文献

参考文献3

二级参考文献14

共引文献10

同被引文献9

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部