中英文双语交叉过滤的逻辑模型被引量：9

Logic Model for Chinese-English Cross-language Text Filtering

下载PDF

导出

摘要文章简要地描述了文本过滤的背景，提出了基于潜在语义索引的中英文双语交叉过滤的逻辑模型。其基本思想是改进双语交叉过滤中基于词汇对译的方法，而是利用双语文本中潜在的语义结构，作为用户模板与文本匹配的基础。将出现的双语词汇和文本映射为语义空间的向量，不必翻译对译词，甚至不需要出现相应的对译词，也能匹配成功，极大地改善了交叉过滤的精度，效果良好。 This paper briefly describes the background of text filtering and puts forward the logic model for ChineseEnglish cross-language text filtering based on hatent Semantic Indexing. The main idea is showed as follows; It takesthe latent semantic structures as a basis of the matching between user profile and texts instead of the word to wordtranslations,and either texts or words in bi-language can be represented as vectors in new semantic space. As a result,inner production acts as similarity measure,so profiles and texts could match successfully without corresponding wordsin another language. The experiment shows that it can markedly improve the efficiency of text filtering.

作者林鸿飞李业丽姚天顺

机构地区东北大学计算机系

出处《计算机工程与应用》 CSCD 北大核心 2000年第8期48-50,共3页 Computer Engineering and Applications

基金国家自然科学基金!69675019 国家教委博士点基金

关键词中英文双语交叉过滤用户模板逻辑模型 Text Filtering, Cross-language Text Filtering, Latent Semantic Indexing, User Profiles, Vector Space Model

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1吴立德，大规模中文文本处理，1997年
2Yan T W，Proceeding of the USENIX Technical Conference，1995年，177页
3姚天顺，自然语言理解，1995年
4Yan T W，Proceeding of the Third International Conference onParallel and Distributed Info，1994年，89页

同被引文献71

1叶浩,王明文,曾雪强.基于潜在语义的多类文本分类模型研究[J].清华大学学报（自然科学版）,2005,45(S1):1818-1822. 被引量：18
2刘云峰 ,齐欢 ,HU Xiang'en ,CAI Zhiqiang ,代建民 .基于潜在语义空间维度特性的多层文档聚类[J].清华大学学报（自然科学版）,2005(S1):1783-1786. 被引量：11
3曾雪强,王明文,陈素芬.一种基于潜在语义结构的文本分类模型[J].华南理工大学学报（自然科学版）,2004,32(z1):99-102. 被引量：27
4郑亚非.潜在语义分析与篇章理解[J].浙江工业大学学报（社会科学版）,2006,5(1):70-75. 被引量：1
5顾榕,王小平,曹立明.一种基于潜在语义分析的查询扩展算法[J].计算机工程与应用,2004,40(18):23-25. 被引量：8
6何明,冯博琴,傅向华.基于Rough集潜在语义索引的Web文档分类[J].计算机工程,2004,30(13):3-5. 被引量：7
7王怡,盖杰,武港山,王继成.基于潜在语义分析的中文文本层次分类技术[J].计算机应用研究,2004,21(8):151-154. 被引量：15
8王金凤.一种基于特征聚合理论和LSI的文本分类新方法[J].北京理工大学学报（社会科学版）,2004,6(5):92-94. 被引量：2
9刘云峰,齐欢,代建民.潜在语义分析在中文信息处理中的应用[J].计算机工程与应用,2005,41(3):91-93. 被引量：18
10陈涛,宋妍,谢阳群.基于IIG和LSI组合特征提取方法的文本聚类研究[J].情报学报,2005,24(2):203-209. 被引量：14

引证文献9

1王理达.电子政务中中文文本分类技术的应用[J].大众科技,2005,7(1):23-25.
2孙海霞,成颖.潜在语义标引(LSI)研究综述[J].现代图书情报技术,2007(9):49-53. 被引量：6
3林鸿飞,王剑峰.双语交叉分类模型的设计与实现[J].中文信息学报,2001,15(6):27-32.
4张永奎,王树锋.交叉语言信息检索研究进展[J].计算机工程与应用,2002,38(19):85-87. 被引量：2
5周洲,侯开虎,姚洪发,张慧.基于TF-IDF及LSI模型的主观题自动评分系统研究[J].软件,2019,40(2):158-163. 被引量：4
6于汝意,刘秀磊,刘旭红,张良,王延飞.泛娱乐情报主题的感知研究[J].北京信息科技大学学报（自然科学版）,2020,35(2):58-61. 被引量：2
7王闰强,胡铁军.中文文本自动分类研究进展[J].医学情报工作,2002,23(6):342-345. 被引量：7
8夏歆钰,张弛.利用大容量硬盘进行局域网光盘数据库检索[J].医学情报工作,2002,23(6):346-347. 被引量：2
9杨梁彬.文本检索的潜在语义索引法初探[J].大学图书馆学报,2003,21(6):68-72. 被引量：11

二级引证文献33

1张爱丽,刘广利,刘长宇.基于SVM的多类文本分类研究[J].情报杂志,2004,23(9):6-7. 被引量：7
2钱鹏.隐喻与语义分析[J].情报杂志,2004,23(11):59-61. 被引量：2
3万乐,刘万春.类别特征词权重加权文本分类方法[J].军民两用技术与产品,2006(3):38-39. 被引量：1
4秦春秀,刘怀亮,赵捧未.一种基于本体论和潜在语义索引的文本语义处理方法[J].现代图书情报技术,2006(9):34-37.
5孙海霞,成颖.潜在语义标引(LSI)研究综述[J].现代图书情报技术,2007(9):49-53. 被引量：6
6刘桂芳.基于EDA技术的网络信息采集资源的应用[J].内蒙古科技与经济,2008(10):141-141.
7谭爱平,成亚玲.搜索引擎技术综述[J].湖南工业职业技术学院学报,2008,8(3):19-21.
8邢海燕,祝咏晨.基于模糊相关的文本特征选择方法[J].现代计算机,2008,14(12):86-88.
9刘桂芳.基于网络信息资源文献检索的方法与技巧[J].内蒙古科技与经济,2008(22):227-228.
10陈立华.基于潜在语义分析的影响自然语言检索查准率指标因素的评述[J].现代情报,2010,30(3):26-28. 被引量：2

1鬼王.“甜似蜜”蜂房小技巧[软件提高篇][J].电脑应用文萃,2005(1):65-65.
2白海燕,朱礼军.关联数据的自动关联构建研究[J].现代图书情报技术,2010(2):44-49. 被引量：35
3刘颖.贝叶斯方法在文本分类预处理中的应用[J].电脑与信息技术,2010,18(6):26-27. 被引量：1
4李芳,盛焕烨.双语词汇自动获取系统[J].上海交通大学学报,2001,35(9):1386-1389.
5陈莉.由“龙”之争看英汉互译中的译词原则[J].科技信息,2008(20):190-190.
6魏晓宁,朱巧明.基于Nave Bayes模型的垃圾邮件过滤方法[J].南通大学学报（自然科学版）,2008,7(1):54-57. 被引量：3
7马丽娟.从“意思”的意思看可译词的不可译性[J].中国校外教育,2012(5):3-3.
8沈丽虹,周昌乐.基于语义空间的支持向量机的文本过滤[J].计算机应用,2005,25(3):664-665. 被引量：3
9鲍蕾,黄曙光,李永亮.基于商空间粒度合成的中文文本表示法[J].小型微型计算机系统,2011,32(12):2434-2438.
10董兴华,徐春,王磊,周喜.多语言在线机器翻译研究[J].计算机工程与应用,2012,48(15):144-148. 被引量：2

计算机工程与应用

2000年第8期

浏览历史

内容加载中请稍等...

中英文双语交叉过滤的逻辑模型被引量：9

参考文献4

同被引文献71

引证文献9

二级引证文献33

相关作者

相关机构

相关主题

浏览历史

中英文双语交叉过滤的逻辑模型 被引量：9

参考文献4

同被引文献71

引证文献9

二级引证文献33

相关作者

相关机构

相关主题

浏览历史

中英文双语交叉过滤的逻辑模型被引量：9