期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
无词典中英文混合术语抽取及算法研究
被引量:
2
1
作者
姜韶华
党延忠
《情报学报》
CSSCI
北大核心
2006年第3期301-305,共5页
中英文混合术语可作为未登录词处理、加权处理和歧义消解等的辅助信息,并有助于提高中文信息处理的质量。依据长度递减与串频统计思想,本文提出了一种中英文混合术语的抽取方法。该方法不需要词典,不需要事先进行语料库的学习,不需...
中英文混合术语可作为未登录词处理、加权处理和歧义消解等的辅助信息,并有助于提高中文信息处理的质量。依据长度递减与串频统计思想,本文提出了一种中英文混合术语的抽取方法。该方法不需要词典,不需要事先进行语料库的学习,不需要建立字索引,而是依靠统计信息,抽取出支持度大于等于阈值的中英文混合术语。该算法能够有效地抽取出文本中新涌现的通用词、专业术语及专有名词。实验显示该方法不受语料限制,能够快速、准确地进行中英文混合术语的抽取。
展开更多
关键词
中英文混合术语
中文信息处理
串频
长串优先
算法
词典
下载PDF
职称材料
题名
无词典中英文混合术语抽取及算法研究
被引量:
2
1
作者
姜韶华
党延忠
机构
大连理工大学系统工程研究所
出处
《情报学报》
CSSCI
北大核心
2006年第3期301-305,共5页
基金
国家自然科学基金资助项目(项目编号:70271046).
文摘
中英文混合术语可作为未登录词处理、加权处理和歧义消解等的辅助信息,并有助于提高中文信息处理的质量。依据长度递减与串频统计思想,本文提出了一种中英文混合术语的抽取方法。该方法不需要词典,不需要事先进行语料库的学习,不需要建立字索引,而是依靠统计信息,抽取出支持度大于等于阈值的中英文混合术语。该算法能够有效地抽取出文本中新涌现的通用词、专业术语及专有名词。实验显示该方法不受语料限制,能够快速、准确地进行中英文混合术语的抽取。
关键词
中英文混合术语
中文信息处理
串频
长串优先
算法
词典
Keywords
terms combined with Chinese and English, Chinese information processing, string frequency, matching longer string first.
分类号
G [文化科学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
无词典中英文混合术语抽取及算法研究
姜韶华
党延忠
《情报学报》
CSSCI
北大核心
2006
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部