期刊文献+

基于奇异值分解的藏文Web不良信息检索算法研究 被引量:2

下载PDF
导出
摘要 阐述了藏文Web不良信息的特点、类型、危害性,设计了倾向性藏文Web不良文本过滤系统结构.提出一种藏文Web不良文本检索算法.该算法从不良文本中提取倾向性关键词项,根据矩阵奇异值分解方法中的转移概率构造出倾向性关键词项的状态矩阵,提取平面坐标空间第一像限的奇异值向量作为复特征向量,利用向量间的余弦相似度作为文本检索的相似度度量.实验结果表明,该算法在检索准确率和运算效率上都优于传统的LSA算法.
出处 《西北民族大学学报(自然科学版)》 2015年第4期23-27,共5页 Journal of Northwest Minzu University(Natural Science)
基金 西北民族大学研究生教育教学改革研究项目(编号:1671280504)
  • 相关文献

参考文献7

  • 1Deerwester S, Dumais S T , Furnas G W, et al . Indexing by Latent Semantic Analysis[-J]. Journal of the American Society of Information Science, 1990,41 (6).
  • 2卫威,王建民.一种大规模数据的快速潜在语义索引[J].计算机工程,2009,35(15):35-37. 被引量:10
  • 3吴昌悫,魏洪增.矩阵理论与方法[M].北京:电子工业出版社,2013.
  • 4Salton G, Wong A, Yang Chung-Shu. A Vector Space Model for Automatic Indexing[J-]. Communications of the ACM,1975,18(11) :613-620.
  • 5Kalt T. A New Probabilistic Model of Text Classification and Retrieval[R]. Amherst, USA: Center for Intelligent In- formation Retrieval, University of Massachusetts Amherst, Technical Report IR-78,1996.
  • 6Lewis D D. Naive(Bayes)at Forty: The Independence Assumption in Information Retrieval[C]//Proc, of EMCL' 98. Berlin, Germany: Springer, 1996.
  • 7Landauer T K. A Solution to Plato's Problem.. The Latent Semantic Analysis Theory of the Acquisition, Induction, and Representation of Knowledge [J]. Psychological Review, 1997,104(2).

二级参考文献6

  • 1何明,冯博琴,傅向华.基于Rough集潜在语义索引的Web文档分类[J].计算机工程,2004,30(13):3-5. 被引量:7
  • 2Scott C D,Dumais S T,Thomas K L,et al.Indexing by Latent Semantic Analysis[J].Journal of the American Society for Information Sciences,1990,41 (6):391-407.
  • 3Tang Chunqiang,Dwarkadas S,Xu Zhichen.On Scaling Latent Semantic Indexing for Large Peer-to-Peer Systems[C]//Proceedings of the 27th Annual international ACM SIGIR Conference on Research and Development in Information Retrieval.NY,USA:ACM Press,2004:112-121.
  • 4Kolda T G,O'Leary D P.A Semidiscrete Matrix Decomposition for Latent Semantic Indexing Information Retrieval[J].ACM Trans.on Inf.Syst.,1998,16(4):322-346.
  • 5Karypis G,Hart E H S.Concept Indexing:A Fast Dimensionality Reduction Algorithm with Application to Document Retrieval and Categorization[C]//Proceedings of CIKM'00.McLean,VA,USA:[s.n.],2000:12-19.
  • 6Bingham E,Mannila H.Random Projection in Dimensionality Reduction:Applications to Image and Text Data[C]//Proceedings of KDD'01.San Francisco,CA,USA:[s.n.],2001:245-250.

共引文献10

同被引文献78

引证文献2

二级引证文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部