检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到2篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

一种基于信息熵的中文高频词抽取算法被引量：22: 1; 作者任禾曾隽芳《中文信息学报》 CSCD 北大核心 2006年第5期40-43,90,共5页; 为扩展分词词典,提高分词的准确率,本文提出了一种基于信息熵的中文高频词抽取算法,其结果可以用来识别未登录词并扩充现有词典。我们首先对文本进行预处理,将文本中的噪音字和非中文字符转化为分隔符,这样文本就可以被视为用分隔符分... 展开更多; 关键词人工智能自然语言处理分词中文抽词信息熵高频词; 下载PDF 职称材料

一种基于逐层扫描的频繁字串快速提取算法被引量：1: 2; 作者张宇萌刘传汉《计算机科学》 CSCD 北大核心 2008年第5期127-130,共4页; 串频统计是一种简便有效的抽取未登录词方法。本文提出了一种快速的频繁字串提取和计频方法,通过逐层扫描快速发现频繁字串,修正字串有效出现频次,最后抽取平均互信息量达到阚值的字串。实验结果显示该方法有效可行。; 关键词频繁字串中文抽词逐层扫描互信息; 下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	一种基于信息熵的中文高频词抽取算法	任禾曾隽芳	《中文信息学报》 CSCD 北大核心	2006	22	下载PDF 职称材料
2	一种基于逐层扫描的频繁字串快速提取算法	张宇萌刘传汉	《计算机科学》 CSCD 北大核心	2008	1	下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部