期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
一种基于维基百科的多语种翻译词汇自动抽取方法
1
作者 温家凯 《企业科技与发展》 2016年第7期129-133,共5页
多语种翻译词汇是解决跨语言信息检索中未登录词问题的有效途径,而高质量的翻译词汇特别是专有名词、新词和命名实体难以在普通词典中找到。文章提出一种从维基百科中自动抽取出多语种翻译词汇的方法,主要通过在维基百科离线数据文件中... 多语种翻译词汇是解决跨语言信息检索中未登录词问题的有效途径,而高质量的翻译词汇特别是专有名词、新词和命名实体难以在普通词典中找到。文章提出一种从维基百科中自动抽取出多语种翻译词汇的方法,主要通过在维基百科离线数据文件中根据其文件结构特征进行抽取。实验证明,该方法能够有效获取高质量的多语种翻译词汇。 展开更多
关键词 多语种翻译词汇 信息自动抽取 维基百科
下载PDF
壮、蒙古、维、哈、柯、朝语信息处理研究进展 被引量:6
2
作者 刘连芳 海银花 +3 位作者 那顺乌日图 黄家裕 吐尔根·依布拉音 玄龙云 《广西科学院学报》 2018年第1期18-26,共9页
少数民族语言文字处理是中国语言文字信息处理的重要组成部分。自20世纪80年代以来,少数民族语言文字处理在各民族科研、产业工作者的共同努力下,在操作系统、输入输出、编辑排版、标准化、语言资源建设、机器翻译、软件平台、人才培养... 少数民族语言文字处理是中国语言文字信息处理的重要组成部分。自20世纪80年代以来,少数民族语言文字处理在各民族科研、产业工作者的共同努力下,在操作系统、输入输出、编辑排版、标准化、语言资源建设、机器翻译、软件平台、人才培养等各个方面取得了长足的进展。本文综述壮、蒙古、维吾尔、哈萨克、柯尔克孜、朝鲜6个少数民族的语言文字信息处理历史、现状及存在问题,并对其未来发展方向进行展望。 展开更多
关键词 壮文 蒙古文 维哈柯文 朝鲜文 信息处理
下载PDF
东南亚语言及信息处理研究进展 被引量:1
3
作者 黄家裕 刘连芳 +1 位作者 邓姿娴 温家凯 《广西科学院学报》 2018年第1期27-31,共5页
本文首先介绍各东南亚语言的特点,并重点介绍越南语与中国壮语的关联以及它们在信息处理上的相近性;然后介绍国内外越南语信息处理的工作现状,并分析汉越机器翻译的发展趋势;最后展望东南亚语言及壮语信息处理的下一步工作。
关键词 东南亚语言 越南语 壮语 信息处理
下载PDF
在线专利检索分析系统的设计与实现 被引量:1
4
作者 温家凯 农强 《企业科技与发展》 2016年第6期34-38,42,共6页
文章介绍了一个在线专利检索分析系统,阐述了系统的体系结构、各模块的功能、关键技术。该系统在分布式大数据采集、基于Lucene与Mysql数据库结合的全文索引、基于Mina框架的分布式在线分析架构等基础上实现的专利信息检索和统计分析,... 文章介绍了一个在线专利检索分析系统,阐述了系统的体系结构、各模块的功能、关键技术。该系统在分布式大数据采集、基于Lucene与Mysql数据库结合的全文索引、基于Mina框架的分布式在线分析架构等基础上实现的专利信息检索和统计分析,在大规模数据方面体现出较好的效率,并提供检索结果自动翻译、检索词智能扩展和产业分类导航等特色功能,可以帮助普通用户更便捷地利用专利信息。 展开更多
关键词 专利检索自动翻译 检索扩展 专利分析 分布式 全文检索Lucene Mina
下载PDF
5
作者 刘连芳 《广西科学院学报》 2018年第1期84-84,84,共1页
语言文字是表达思维的工具,没有语言文字,人类无法把文明成果流传下来;语言文字是最重要的交流工具,是共享个人智能并将其转化为社会智慧的载体和渠道.用计算机对语言文字的音、形、义等信息进行处理和加工,即自然语言信息处理.这是一... 语言文字是表达思维的工具,没有语言文字,人类无法把文明成果流传下来;语言文字是最重要的交流工具,是共享个人智能并将其转化为社会智慧的载体和渠道.用计算机对语言文字的音、形、义等信息进行处理和加工,即自然语言信息处理.这是一门与计算机科学、语言学、数学、信息学、声学等多种学科相关联的综合性学科.中文信息处理是自然语言信息处理的一个分支. 展开更多
关键词 语言信息处理 计算机科学 语言文字 中文信息处理 交流工具 行处理 语言学 信息学
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部