期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种中文文档的非受限无词典抽词方法
被引量:
28
1
作者
金翔宇
孙正兴
张福炎
《中文信息学报》
CSCD
北大核心
2001年第6期33-39,共7页
本文提出了一种非受限无词典抽词模型 ,该模型通过自增长算法获取中文文档中的汉字结合模式 ,并引入支持度、置信度等概念来筛选词条。实验表明 :在无需词典支持和利用语料库学习的前提下 ,该算法能够快速、准确地抽取中文文档中的中、...
本文提出了一种非受限无词典抽词模型 ,该模型通过自增长算法获取中文文档中的汉字结合模式 ,并引入支持度、置信度等概念来筛选词条。实验表明 :在无需词典支持和利用语料库学习的前提下 ,该算法能够快速、准确地抽取中文文档中的中、高频词条。适于对词条频度敏感 ,而又对计算速度要求很高的中文信息处理应用 。
展开更多
关键词
中文信息处理
自动分词
非受限无词典抽词
汉字结构模式
中文文档
抽词速度
下载PDF
职称材料
题名
一种中文文档的非受限无词典抽词方法
被引量:
28
1
作者
金翔宇
孙正兴
张福炎
机构
南京大学软件新技术国家重点实验室
出处
《中文信息学报》
CSCD
北大核心
2001年第6期33-39,共7页
基金
国家自然科学基金项目 (6 990 30 0 6 )
教育部高等学校骨干教师资助计划(教技司[2 0 0 0 ]6 5号 )
中国博士后科学基金(中博基 [1997]11号 )
文摘
本文提出了一种非受限无词典抽词模型 ,该模型通过自增长算法获取中文文档中的汉字结合模式 ,并引入支持度、置信度等概念来筛选词条。实验表明 :在无需词典支持和利用语料库学习的前提下 ,该算法能够快速、准确地抽取中文文档中的中、高频词条。适于对词条频度敏感 ,而又对计算速度要求很高的中文信息处理应用 。
关键词
中文信息处理
自动分词
非受限无词典抽词
汉字结构模式
中文文档
抽词速度
Keywords
chinese information processing
automatic word segmentation
domain independent dictionary free lexical acquisition
co occurrence patterns of Chinese characters
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种中文文档的非受限无词典抽词方法
金翔宇
孙正兴
张福炎
《中文信息学报》
CSCD
北大核心
2001
28
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部