汉蒙跨语言检索系统设计与实现被引量：5

Design and Implementation of Chinese and Mongolian Cross-language Retrieval System

下载PDF

导出

摘要 [目的/意义]基于汉蒙间跨语言检索系统发展现状,设计并实现通过汉文、传统蒙古文关键词检索西里尔蒙古文文档的系统。[方法/过程]汉蒙跨语言检索系统包括机器翻译和文档检索。在机器翻译方面,实现了基于词典的汉文到西里尔蒙古文机器翻译,并实现了基于规则和统计的传统蒙古文到西里尔蒙古文转换;在文档检索方面,基于Lucene全文索引工具包对大量的西里尔蒙古文文档建立索引,并根据向量空间模型对查询和文档的相似度进行排序,得到与查询最为匹配的文档集。[结果/结论]本系统响应速度较快,准确率较高,达到可用水平。一方面促进中国与蒙古国之间的科技、文化、教育的交流;另一方面对我国西里尔蒙古文的研究有一定的促进作用。 [ Purpose/significance] This paper designs and implements a system for retrieving Cyrillic Mongolian documents through Chinese and traditional Mongolian keywords based on the current development of Chinese and Mongolian cross-language retrieval systems. [ Method/process ] The proposed Chinese-Mongolian cross-language retrieval system includes machine translation and document retrieval. In the aspect of machine translation, two translations are implemented ： a dictionary-based Chinese to Cyrillic Mongolian translation; the traditional Mongolian to Cyrillic Mongolian conversion based on rules and statistics. For document retrieval, the Lucene full-text indexing toolkit is employed to index a large amount of Cyrillic Mongolian documents. The best matched documents are obtained using the vector space model. [ Result/conclusion ] This system has high accuracy of retrieval with rapid response, and it can be applied in practical system. On the one hand, this research promotes the exchange of science, technology, culture and education between China and Mongolia. On the other hand, it promotes the study of Cyril Mongolian in China.

作者鲍玉来白淑霞飞龙王炜华

机构地区内蒙古大学图书馆内蒙古大学计算机学院

出处《情报理论与实践》 CSSCI 北大核心 2017年第4期128-132,144,共6页 Information Studies:Theory & Application

基金国家自然科学基金项目"基于领域本体的蒙古文数字资源整合机制研究"的成果项目编号:71163029

关键词跨语言信息检索信息检索系统检索方法 cross-language information retrieval information retrieval system retrieval method

分类号 TP391.3 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1张玥杰,郭依昆,连理,吴立德.基于英汉机译实现跨语言信息检索[J].小型微型计算机系统,2004,25(7):1135-1140. 被引量：10
2高红霞.西里尔蒙古文网页向传统蒙古文自动转换系统之网页排版格式转换[J].内蒙古民族大学学报（社会科学版）,2013,39(5):113-116. 被引量：1
3飞龙,高光来,闫学亮,魏宏喜.传统蒙古文与西里尔蒙古文相互转换方法的研究[J].计算机工程与应用,2014,50(23):206-211. 被引量：4

二级参考文献20

1[1]Mark W. Davis and Ted E. Dunning. A TREC evaluation of query translation methods for multi-lingual text retrieval[A]. In:D. K. Harman, editor, The Fourth Text Retrieval Conference (TREC-4)[C]. NIST, November 1995.
2[2]Christian Fluhr. Multilingual information retrieval[A]. In:Ronald A Cole, Joseph Mariani, Hans Uszkoreit, Annie Zaenen, and Victor Joe Zue, editors, Survey of the state of the art in human language technology[C]. 291-305. Center for Spoken Language Understanding, Oregon Graduate Institute, 1995.
3[3]Pigur V A. Multilanguage information-retrieval systems: Integration levels and language support[J]. Automatic Documentation and Mathematical Linguistics, 1979,13(1):36-46.
4[4]Chris Buckley, Gerard Salton, James Allan, and Amit Singhal. Automatic query expansion using SMART[C]: TREC 3. In D. K. Harman, editor, Overview of the Third Text Retrieval Conference (TREC-3), NIST, November 1994, 69-80.
5[5]Pim van der Eijk. Automating the acquisition of bilingual terminology[C]. In:Sixth Conference of the European Chapter of the Association for Computational Linguistics, April 1993, 113-119.
6[6]Chung hsin Lin and Hsinchun Chen. An automatic indexing and neural network approach to concept retrieval and classification of multilingual (Chinese-English) documents[J]. IEEE Transaction on Systems, Man and Cybernetics, February 1996,26(1):75-88.
7[7]Kenney Ng. A maximum likelihood ratio information retrieval model[C].In:Proceedings of the 8th Text Retrieval Conference (TREC-8), 1999.
8[8]Wu Li-de. Large scale chinese text processing[M]. Fudan University Press, 1997.
9清格尔泰．蒙古语语法[M]．呼和浩特：内蒙古人民出版社，1992．
10Hpricot pylori style wiki. [2011 - 01 - 30]. http://tam. qmix. org/wki/Hpricot, html.

共引文献12

1任成梅.跨语言信息检索的发展与展望[J].图书馆学研究,2006(4):79-82. 被引量：11
2郭宇锋,黄敏.跨语言信息检索理论与应用研究[J].图书与情报,2006(2):79-81. 被引量：9
3邱悦.跨语言信息检索研究[J].图书情报工作,2006,50(10):82-86. 被引量：1
4任成梅,李春英.汉英跨语言信息检索探讨[J].图书馆理论与实践,2006(6):51-53. 被引量：5
5陈凤娟,邵波.跨语言信息检索文献的计量分析[J].中国信息导报,2007(8):35-38. 被引量：1
6庞观松,张黎莎,蒋盛益.个性化跨语言学术搜索技术研究[J].情报学报,2011,30(8):870-874. 被引量：4
7庞观松,张黎莎,蒋盛益.跨语言智能学术搜索系统设计与实现[J].山东大学学报（工学版）,2011,41(5):63-68. 被引量：5
8司莉,贾欢.2004—2014年我国多语言信息组织与检索研究进展与启示[J].情报学报,2015,34(6):662-672. 被引量：10
9王春荣,王贵荣,霍日查.西里尔蒙古文语料库收集研究[J].语文学刊,2016,36(7):76-78.
10飞龙,高光来,王洪伟,路敏.基于规则和统计相结合的西里尔蒙古文到传统蒙古文转换方法[J].中文信息学报,2017,31(3):156-162. 被引量：3

同被引文献41

1袁庆升,张冬明,靳国庆,刘菲,包秀国.视频检索中图像信息量度量[J].通信学报,2016,37(2):80-87. 被引量：4
2欧石燕,唐振贵,苏翡斐.面向信息检索的术语服务构建与应用研究[J].中国图书馆学报,2016,42(2):32-51. 被引量：23
3江霞,安虹,梁伟浩,张爱民,李丰.OpenACC到MIC平台上并行程序的自动翻译及优化[J].小型微型计算机系统,2016,37(4):824-829. 被引量：5
4钟艳如,梁毅芳,许本胜,曾聪文,卢宏成,吴帆,赵争君.基于网络本体语言的三维计算机辅助设计主模型相似性计算方法[J].计算机应用,2016,36(6):1599-1604. 被引量：5
5颛悦,熊锦华,马宏远,程舒杨,程学旗.一种支持混合语言的并行查询纠错方法[J].中文信息学报,2016,30(2):99-106. 被引量：1
6苏依拉,窦保媛,吉亚图.基于本体的蒙古语灾害信息检索模型[J].北京工业大学学报,2016,42(7):1017-1023. 被引量：4
7斯日古楞,林民,田长波.基于LDA模型的蒙古文信息检索方法研究[J].内蒙古师范大学学报（自然科学汉文版）,2016,45(3):403-407. 被引量：3
8李浩亮,毛晓波,宋纪元,张肖宁.智能仿生双向手语翻译系统[J].电子技术应用,2016,42(7):83-86. 被引量：4
9司莉,张孝天.多语言知识组织系统的互操作项目调查及研究[J].情报科学,2016,34(9):3-6. 被引量：5
10王明文,洪欢,江爱文,左家莉.基于词重要性的信息检索图模型[J].中文信息学报,2016,30(4):134-141. 被引量：11

引证文献5

1林寒.基于多语言交互的英语翻译在线辅助系统设计[J].现代电子技术,2019,42(6):22-25. 被引量：15
2王丹,张祥合,赵浩宇.基于元数据的信息知识组织智能检索系统设计[J].情报科学,2019,37(9):113-116. 被引量：13
3赵翀,王丽达.基于数据挖掘技术的智能图书馆云检索系统设计[J].现代电子技术,2020,43(2):60-63. 被引量：10
4王玉荣,张树钧,林民,宝美荣.基于云架构的蒙古文硕士论文检索系统的设计与实现[J].内蒙古师范大学学报（自然科学汉文版）,2020,49(3):194-200. 被引量：3
5蒲巧.双向交互机器人的语言自动生成仿真[J].计算机仿真,2019,36(4):310-314. 被引量：4

二级引证文献45

1单凯轩.基于云计算的数据挖掘系统设计分析[J].计算机产品与流通,2020(9):187-188.
2李建平.手法治疗骶髂关节错缝52例[J].按摩与导引,2000,16(3):52-53.
3王捍天.基于PID控制的机器人轨迹跟踪性能研究与比较[J].电子元器件与信息技术,2019,0(6):44-47. 被引量：16
4张丹.网络环境下英语语音在线自动评改系统设计[J].科技通报,2019,35(12):199-203. 被引量：3
5田力.基于汉英短语翻译组合机器自动翻译系统设计与测试研究[J].微型电脑应用,2020,36(5):43-46. 被引量：10
6齐帅,潘克刚,齐宝峰,王欣婷,苏耀丁.交互机器人技术与发展[J].通信技术,2020,53(6):1449-1453. 被引量：2
7吴石松,林志达.基于seq2 seq和Attention模型的聊天机器人对话生成机制研究[J].自动化与仪器仪表,2020(7):186-189. 被引量：4
8胡晓榕.基于融合多语言交互的在线翻译辅助系统[J].微型电脑应用,2020,36(11):80-81. 被引量：2
9徐志强,袁振德,谢继亮.一种基于蒙古文Opentype字库显示索引的检索方法[J].信息技术与信息化,2020(12):93-94.
10张思龙,王兰成,娄国哲.基于知识图谱的网络舆情研判系统研究[J].现代情报,2021,41(4):10-16. 被引量：14

1张彦文.多语言数字图书馆及其研究浅析[J].河南图书馆学刊,2013,33(9):97-99. 被引量：4
2彭丽.谈谈高校图书馆编目工作的外包[J].时代教育,2008(1):161-161.
3邱均平,叶晓峰,熊尊妍.国外索引工具的发展趋势——以Scopus为例[J].中国索引,2008,6(1):2-14. 被引量：7
4石颖.我国论文的SCI收录情况简介[J].广东科技,2004,13(7):57-58.
5邱均平,叶晓峰,熊尊妍.国外索引工具发展趋势研究——以Scopus为例[J].情报科学,2009,27(6):801-807. 被引量：4
6于兴艳,孔真.浅析基于web的跨语言信息检索之现状[J].信息通信,2011,24(4):81-82. 被引量：1
7华薇娜.搜索引擎的最新进展述要[J].图书与情报,2009(6):83-87. 被引量：6
8刘卫中.网上信息跨语言检索方法[J].情报科学,2004,22(12):1503-1504. 被引量：6
9陈凤娟,邵波.跨语言信息检索文献的计量分析[J].中国信息导报,2007(8):35-38. 被引量：1
10张彦文.跨语言信息检索及其相关问题[J].教育教学论坛,2014(1):132-134.

情报理论与实践

2017年第4期

浏览历史

内容加载中请稍等...

汉蒙跨语言检索系统设计与实现被引量：5

参考文献3

二级参考文献20

共引文献12

同被引文献41

引证文献5

二级引证文献45

相关作者

相关机构

相关主题

浏览历史

汉蒙跨语言检索系统设计与实现 被引量：5

参考文献3

二级参考文献20

共引文献12

同被引文献41

引证文献5

二级引证文献45

相关作者

相关机构

相关主题

浏览历史

汉蒙跨语言检索系统设计与实现被引量：5