期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于位置索引的中英文模糊检索算法研究 被引量:1
1
作者 王立彬 许成谦 袁丽 《高技术通讯》 CAS 2021年第7期723-732,共10页
信息检索效率的提高可以给用户带来更好的体验。信息检索的实质是字符串匹配,针对当前字符串匹配算法效率低下的问题,本文提出一种基于位置索引的中英文快速模糊检索算法,通过直接获取被匹配串的所有位置信息,在匹配串进行匹配时可根据... 信息检索效率的提高可以给用户带来更好的体验。信息检索的实质是字符串匹配,针对当前字符串匹配算法效率低下的问题,本文提出一种基于位置索引的中英文快速模糊检索算法,通过直接获取被匹配串的所有位置信息,在匹配串进行匹配时可根据位置信息达到直接精确匹配,从而提升匹配效率。并在此算法基础上深入分析了基于中文的模糊匹配查找和多关键字查找。通过实验测试,该算法在数据量、数据源长度和待匹配串长度等特性评价指标上均优于一般算法。 展开更多
关键词 位置索引 模糊检索 字符串匹配 快速检索 中英文检索
下载PDF
基于TRIP的全文检索系统的应用及研究 被引量:1
2
作者 杨恒宇 余嵘华 《电脑知识与技术》 2012年第9期5962-5964,共3页
介绍在对TRIP全文数据库系统和中文切词有关技术研究分析的基础上,开发J2EE架构下基于TRIP的全文检索系统。该全文检索系统在WEB环境下运行,具有跨平台性。
关键词 TRIP 中英文全文检索 中文切词 倒排文件
下载PDF
Regularized canonical correlation analysis with unlabeled data 被引量:1
3
作者 Xi-chuan ZHOU Hai-bin SHEN 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2009年第4期504-511,共8页
In standard canonical correlation analysis (CCA), the data from definite datasets are used to estimate their canonical correlation. In real applications, for example in bilingual text retrieval, it may have a great po... In standard canonical correlation analysis (CCA), the data from definite datasets are used to estimate their canonical correlation. In real applications, for example in bilingual text retrieval, it may have a great portion of data that we do not know which set it belongs to. This part of data is called unlabeled data, while the rest from definite datasets is called labeled data. We propose a novel method called regularized canonical correlation analysis (RCCA), which makes use of both labeled and unlabeled samples. Specifically, we learn to approximate canonical correlation as if all data were labeled. Then, we describe a generalization of RCCA for the multi-set situation. Experiments on four real world datasets, Yeast, Cloud, Iris, and Haberman, demonstrate that, by incorporating the unlabeled data points, the accuracy of correlation coefficients can be improved by over 30%. 展开更多
关键词 Canonical correlation analysis (CCA) REGULARIZATION Unlabeled data Generalized canonical correlation analysis(GCCA)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部