结合本体论和统计方法的跨语言信息检索模型被引量：5

CLIR model based on a combination of ontology and statistical method

下载PDF

导出

摘要为了更有效地提高跨语言信息检索的性能,结合本体论和统计方法的特性,提出一种混合的跨语言信息检索模型.在该语言模型的结构上,提出一种本体描述框架,构造了一个形式化的语言本体知识表示,通过典型语料学习,融合了语法、语义、句法等多元信息,建立了源语言本体知识库.在跨语言信息检索的实际应用中,利用本体表示,获得初始的检索文档集,再基于源语言本体知识库,对全部候选文档重新排序,以提高TopN排列的精确度.利用NTCIR-3Workshop中的中英文跨语言信息检索数据集对该语言模型进行了评价,相关实验结果表明,该方法取得了较满意的实验效果. For improving the performance of cross-lingual information retrieval, a hybrid language presented based on a combination of ontology and statistical method. In the structure of the languag model is e model, an ontology description frame was given and a linguistic ontology knowledge presentation was determined. A linguistic ontology knowledge bank of source language was created, which combines with semantic, pragmatic and syntactic by learning typical corpus. In cross-lingual information retrieval, the initial document set will be obtained by ontology presentation and all documents will be re-ordered based on linguistic ontology knowledge of source language for improving the precision of Top N rank. The cross-lingual information retrieval data set in NTCIR-3 Workshop was used to evaluate the performance of the language model. The results indicate that the proposed method improves the precision of nature language processing.

作者郑德权李生赵铁军于浩

机构地区哈尔滨工业大学教育部-微软语言语音重点实验室

出处《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2008年第1期77-80,共4页 Journal of Harbin Institute of Technology

基金国家自然科学基金资助项目(60736044) 国家高技术研究发展计划资助项目(2006AA01Z150 2004AA11701008)

关键词跨语言信息检索本体统计方法语言模型知识获取 cross-lingual information retrieval ontology statistical method language model knowledge acquisition

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献18

1GAO J F, NIE J Y, HE H ZH, et al. Resolving query translation ambiguity using a decaying co-occurrence model and syntactic dependence relations [C]//Proceedings of the 25th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. Finland: ACM. 2002:183 - 190.
2XU J, WEISCHEDEL R. Trec-9 Cross-Lingual Retrieval at BBN [C]//Proceeding of the Ninth Text Retrieval Conference. USA : NIST. 2000 : 106 - 115.
3GAO J F, Nie J Y, ZHANG J, et al. Trec-9 CLIR Experiments at MSRCN [C]//Proceeding of the Ninth Text Retrieval Conference. USA : NIST. 2000: 343 - 353.
4WU L D, HUANG X J, GUO Y, et al. Fdu at Trec-9: CUR,Filtering and QA Tasks [C]//Proceeding of the Ninth Text Retrieval Conference. USA : NIST. 2000 :202 -219.
5JIN H, WONG. K F. Trec-9 CLIR at Cuhk, Disambiguation by Similarity Values Between Adjacent Words [ C ]//Proceeding of the Ninth Text Retrieval Conference. USA: NIST. 2000:151-156.
6JELINEK, F. Self-Organized Language Modeling for Speech Recognition [C]//Readings in Speech Recognition. San Mateo: Morgan kaufmann Publishers. 1990: 450 - 506.
7BROWN P, PIETRA S D. , PIETRA V D, et al. The mathematics of statistical machinetranslation: Parameter estimation [ J ]. Computational Linguistics, 1993, 19 (2) : 269 -311.
8CROFT W B, LAFFERTY J. Language Modeling for Information Retrieval [M]. Amsterdam: Springer, 2003.
9NECHES R. , FIKES R. , FININ T. , et al. Enabling Technology for Knowledge Sharing [ J ]. AI Magazine, 1991, 12(3): 16-36.
10CYCL Cycorp, Inc. [EB/OL]. http://www.cyc. com.

同被引文献98

1黄新艳,姚文琳,徐建良.基于汉英双语语料库的汉英Ontology的建立与管理[J].仪器仪表学报,2005,26(z2):529-532. 被引量：1
2吴琳.面向科技文献的跨语言信息检索系统模型研究[J].情报理论与实践,2008,31(6):924-927. 被引量：1
3张玥杰,郭依昆,连理,吴立德.基于英汉机译实现跨语言信息检索[J].小型微型计算机系统,2004,25(7):1135-1140. 被引量：10
4张秀坤,赵丹群.TREC概况及其最新发展研究[J].情报理论与实践,2004,27(5):537-540. 被引量：8
5张俊林,曲为民,杜林,孙玉芳.跨语言信息检索研究进展[J].计算机科学,2004,31(7):16-19. 被引量：17
6耿骞,王洋.跨语言信息检索中的词语转换方法[J].图书情报工作,2004,48(10):81-83. 被引量：3
7何晓聪.跨语言信息检索初探[J].情报科学,2005,23(2):274-277. 被引量：4
8王妙娅,赖茂生.跨语言信息检索中的询问翻译方法及其研究进展[J].现代图书情报技术,2005(4):37-41. 被引量：14
9王昊.跨语言信息检索实现方法与关键技术探讨[J].情报杂志,2005,24(7):46-49. 被引量：14
10马费成.数字时代情报学发展展望（笔谈）——在数字环境下实现知识的组织和提供[J].郑州大学学报（哲学社会科学版）,2005,38(4):5-7. 被引量：54

引证文献5

1于再富,袁满.融合BabelNet的多语言智能信息检索模型[J].吉林大学学报（信息科学版）,2020,38(1):99-106. 被引量：7
2张明尧,姬东鸿.汉语信息检索的测试集建设[J].情报杂志,2010,29(6):99-103.
3朱培焱,夏栋梁.汉英跨语言信息检索研究[J].计算机与现代化,2011(8):13-16. 被引量：3
4司莉,贾欢.2004—2014年我国多语言信息组织与检索研究进展与启示[J].情报学报,2015,34(6):662-672. 被引量：10
5司莉,陈雨雪,曾粤亮.基于多语言本体的中英跨语言信息检索模型及实现[J].图书情报工作,2017,61(1):100-108. 被引量：18

二级引证文献37

1于再富,袁满.融合BabelNet的多语言智能信息检索模型[J].吉林大学学报（信息科学版）,2020,38(1):99-106. 被引量：7
2徐李华.曲项向天歌──浅谈江苏鹅业发展[J].中国禽业导刊,2000,17(6):4-5.
3朱敏.基于Web的未登录词翻译技术的分析[J].苏州市职业大学学报,2013,24(3):12-15.
4杨亮.查询扩展技术在跨语言信息检索中的应用[J].现代计算机（中旬刊）,2015(1):26-30.
5李佳.基于词共现的跨语言检索平台研究[J].情报杂志,2015,34(8):195-198. 被引量：3
6谢丽娜.2015年我国情报学研究进展[J].山东图书馆学刊,2016(6):21-28. 被引量：4
7王瑞云,贾君枝.中文个人名称规范记录的实体匹配与聚簇[J].国家图书馆学刊,2017,26(2):79-86. 被引量：2
8王瑞云,贾君枝.基于作品关系扩展的中文同名个人规范记录识别与聚簇研究[J].图书情报工作,2017,61(5):125-131. 被引量：1
9许天成,张姝涵,但唐朋,王思懿.基于QQBot的个人资讯管理系统设计与实现[J].电子技术与软件工程,2018(3):70-71.
10周祖坤,杨光,冯小坤.面向文档信息检索的排序学习算法[J].自动化技术与应用,2018,37(2):40-45.

1李枫林,毛展展.应用本体构建方法研究及案例分析[J].图书馆学研究,2014(19):31-41. 被引量：5
2于凤,郑德权,赵铁军,李生.基于上下文多元信息的文档相似度计算研究[J].哈尔滨工程大学学报,2006,27(B07):397-402. 被引量：2
3彭程.基于本体论的电子商务自然语言研究[J].微计算机信息,2008,24(18):152-154.
4唐通,唐雁,沈黎,陈泳序,申红林,王斌,张桉.基于时间SFM因子的推荐系统攻击检测方法[J].西南大学学报（自然科学版）,2013,35(11):164-171. 被引量：3
5李川,鄂海红,宋美娜.基于Storm的实时计算框架的研究与应用[J].软件,2014,35(10):16-20. 被引量：21
6陈程,李翔.基于MapBasic的TOPN分析模块的实现[J].价值工程,2012,31(15):157-158.
7钱剑飞,陈华,陈奇,俞瑞钊.一种代码与中文文档关联信息的自动提取方法[J].浙江大学学报（工学版）,2004,38(11):1417-1421. 被引量：2
8陈磊,叶修梓,潘翔,张三元,张引,彭维.基于本体的产品数据语义互操作[J].计算机集成制造系统,2008,14(4):821-828. 被引量：14
9张行文,汪自云.基于源语言的开放机群管制系统设计与实现[J].湖北师范学院学报（自然科学版）,2007,27(2):8-10.
10吴谋硕.基于用户信息的信息检索效果提高策略[J].电脑知识与技术,2011,7(7X):5037-5038.

哈尔滨工业大学学报

2008年第1期

浏览历史

内容加载中请稍等...

结合本体论和统计方法的跨语言信息检索模型被引量：5

参考文献18

同被引文献98

引证文献5

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

结合本体论和统计方法的跨语言信息检索模型 被引量：5

参考文献18

同被引文献98

引证文献5

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

结合本体论和统计方法的跨语言信息检索模型被引量：5