期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于概率模型的汉语和越南语的人名音译方法 被引量:1
1
作者 申文明 刘连芳 +1 位作者 黄家裕 温家凯 《广西科学院学报》 2010年第4期439-442,共4页
利用概率模型训练、学习得到基于字形的汉越音译知识,实现汉语和越南语的人名音译。音译方法简单有效,在汉译越上效果尤为显著,准确率达到97.41%。
关键词 汉越人名翻译 音译 概率模型 音译知识
下载PDF
在线专利检索分析系统的设计与实现 被引量:1
2
作者 温家凯 农强 《企业科技与发展》 2016年第6期34-38,42,共6页
文章介绍了一个在线专利检索分析系统,阐述了系统的体系结构、各模块的功能、关键技术。该系统在分布式大数据采集、基于Lucene与Mysql数据库结合的全文索引、基于Mina框架的分布式在线分析架构等基础上实现的专利信息检索和统计分析,... 文章介绍了一个在线专利检索分析系统,阐述了系统的体系结构、各模块的功能、关键技术。该系统在分布式大数据采集、基于Lucene与Mysql数据库结合的全文索引、基于Mina框架的分布式在线分析架构等基础上实现的专利信息检索和统计分析,在大规模数据方面体现出较好的效率,并提供检索结果自动翻译、检索词智能扩展和产业分类导航等特色功能,可以帮助普通用户更便捷地利用专利信息。 展开更多
关键词 专利检索自动翻译 检索扩展 专利分析 分布式 全文检索Lucene Mina
下载PDF
壮文与壮文信息处理 被引量:10
3
作者 刘连芳 顾林 +1 位作者 黄家裕 温家凯 《中文信息学报》 CSCD 北大核心 2011年第6期175-182,共8页
壮族的文字分为古壮文和现代壮文。古壮文主要出现在古籍中,民间也仍在使用,是活体字。1990年起广西研制了古壮文造字/编辑/排版工具、释义字典和借音壮字数据库。现代壮文创制于1955年,是壮族扫盲/教学、国家党政重要文件、人民币、广... 壮族的文字分为古壮文和现代壮文。古壮文主要出现在古籍中,民间也仍在使用,是活体字。1990年起广西研制了古壮文造字/编辑/排版工具、释义字典和借音壮字数据库。现代壮文创制于1955年,是壮族扫盲/教学、国家党政重要文件、人民币、广西公共场所使用的文字。目前已有编辑工具、英汉壮释义词典及辅助翻译软件。今后应研究壮文标准,研究开发全文检索和古壮—现代壮—汉—英互译系统,以推动壮文教育、出版、交流与遗产保护。 展开更多
关键词 古壮文 现代壮文 信息处理
下载PDF
一种基于维基百科的多语种翻译词汇自动抽取方法
4
作者 温家凯 《企业科技与发展》 2016年第7期129-133,共5页
多语种翻译词汇是解决跨语言信息检索中未登录词问题的有效途径,而高质量的翻译词汇特别是专有名词、新词和命名实体难以在普通词典中找到。文章提出一种从维基百科中自动抽取出多语种翻译词汇的方法,主要通过在维基百科离线数据文件中... 多语种翻译词汇是解决跨语言信息检索中未登录词问题的有效途径,而高质量的翻译词汇特别是专有名词、新词和命名实体难以在普通词典中找到。文章提出一种从维基百科中自动抽取出多语种翻译词汇的方法,主要通过在维基百科离线数据文件中根据其文件结构特征进行抽取。实验证明,该方法能够有效获取高质量的多语种翻译词汇。 展开更多
关键词 多语种翻译词汇 信息自动抽取 维基百科
下载PDF
东南亚语言及信息处理研究进展 被引量:1
5
作者 黄家裕 刘连芳 +1 位作者 邓姿娴 温家凯 《广西科学院学报》 2018年第1期27-31,共5页
本文首先介绍各东南亚语言的特点,并重点介绍越南语与中国壮语的关联以及它们在信息处理上的相近性;然后介绍国内外越南语信息处理的工作现状,并分析汉越机器翻译的发展趋势;最后展望东南亚语言及壮语信息处理的下一步工作。
关键词 东南亚语言 越南语 壮语 信息处理
下载PDF
MS Windows环境的桌面搜索系统设计与实现
6
作者 黄家裕 温家凯 刘连芳 《广西科学院学报》 2010年第4期486-489,共4页
提出一个基于Lucene的MS Windows环境桌面搜索系统架构,探讨文件监视、基于磁盘文件的外存队列、文件文本提取以及索引和检索等各关键模块的实现方法,并测试验证该系统具有较高的实用价值。
关键词 桌面搜索 文件监视 外存队列 文件文本提取 LUCENE
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部