期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
基于数据量的文本分词算法选取的研究
下载PDF
职称材料
导出
摘要
分析了无词典分词及最大匹配快速分词算法的特点,并针对大数据量和小数据量两类文本,对两种算法进行性能测试。结果表明,两种算法均适用于大数据量的文本分词。此外,对无词典分词算法加以改进,使之也适用于小数据量的文本分词,并通过仿真实验验证改进的有效性。
作者
王一蕾
吴英杰
机构地区
福州大学数学与计算机科学学院
出处
《福建电脑》
2006年第9期18-19,共2页
Journal of Fujian Computer
基金
福州大学科技发展基金(2004-XY-13)
关键词
无词典分词
最大匹配分词
数据量
分类号
TP391 [自动化与计算机技术—计算机应用技术]
TP311.132 [自动化与计算机技术—计算机软件与理论]
引文网络
相关文献
节点文献
二级参考文献
81
参考文献
5
共引文献
158
同被引文献
0
引证文献
0
二级引证文献
0
参考文献
5
1
李振星,徐泽平,唐卫清,唐荣锡.
全二分最大匹配快速分词算法[J]
.计算机工程与应用,2002,38(11):106-109.
被引量:39
2
胥桂仙,苏筱蔚,陈淑艳.
中文文本挖掘中的无词典分词的算法及其应用[J]
.吉林工学院学报(自然科学版),2002,23(1):16-18.
被引量:26
3
黄崑,符绍宏.
自动分词技术及其在信息检索中应用的研究[J]
.现代图书情报技术,2001(3):26-29.
被引量:24
4
孙建涛,沈抖,陆玉昌,石纯一.
网页分类技术[J]
.清华大学学报(自然科学版),2004,44(1):65-68.
被引量:18
5
张春霞,郝天永.
汉语自动分词的研究现状与困难[J]
.系统仿真学报,2005,17(1):138-143.
被引量:60
二级参考文献
81
1
孙茂松.
谈谈汉语分词语料库的一致性问题[J]
.语言文字应用,1999(2):90-93.
被引量:20
2
黄昌宁.
中文信息处理中的分词问题[J]
.语言文字应用,1997(1):74-80.
被引量:83
3
刘开瑛.
现代汉语自动分词评测技术研究[J]
.语言文字应用,1997(1):103-108.
被引量:15
4
孙茂松,邹嘉彦.
汉语自动分词研究中的苦干理论问题[J]
.语言文字应用,1995(4):40-46.
被引量:45
5
吴胜远.
一种汉语分词方法[J]
.计算机研究与发展,1996,33(4):306-311.
被引量:49
6
尹锋,林亚平.
汉语自动分词技术的现状及发展趋势[J]
.软件世界,1996(12):80-84.
被引量:15
7
黄萱菁,吴立德,王文欣,叶丹瑾.
基于机器学习的无需人工编制词典的切词系统[J]
.模式识别与人工智能,1996,9(4):297-303.
被引量:24
8
张琪玉.
检索语言讲座(九)[J]
.情报理论与实践,1996,19(3):63-64.
被引量:9
9
亢临生,张翠英.
自然语言理解在科技文献数据库建设中的应用[J]
.情报学报,1996,15(6):446-450.
被引量:2
10
孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳.
利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J]
.计算机研究与发展,1997,34(5):332-339.
被引量:66
共引文献
158
1
张莉.
网页自动分类技术概念分析[J]
.娄底职业技术学院学报(职教与经济研究),2007(2):58-62.
2
苏芳仲,林世平.
Web文本挖掘中的一种中文分词算法研究及其实现[J]
.福州大学学报(自然科学版),2004,32(z1):67-71.
被引量:5
3
曲维光.
汉语自动分词的方法选择[J]
.计算机科学,2002,29(z1):54-56.
被引量:2
4
于清,阿里甫.库尔班.
微博语料分词及标注方法初探[J]
.新疆大学学报(自然科学版),2013,30(1):81-86.
被引量:1
5
崔岩.
脚本测试技术在列控中心开发测试中的运用[J]
.铁路通信信号工程技术,2013,10(S1):149-153.
被引量:2
6
陈淑珍.
Web文本挖掘中的特征表示与特征提取技术[J]
.三明高等专科学校学报,2004,21(2):53-57.
被引量:2
7
曹倩,丁艳,王超,潘金贵.
汉语自动分词研究及其在信息检索中的应用[J]
.计算机应用研究,2004,21(5):71-74.
被引量:18
8
文庭孝,邱均平,侯经川.
汉语自动分词研究展望[J]
.现代图书情报技术,2004(7):6-10.
被引量:20
9
张春霞,郝天永.
汉语自动分词的研究现状与困难[J]
.系统仿真学报,2005,17(1):138-143.
被引量:60
10
文庭孝,侯经川,邱均平,张洋.
汉语自动分词新思维:无词典切分[J]
.情报杂志,2005,24(2):2-4.
被引量:2
1
谢春发.
中文信息处理在智能答疑系统中的应用研究[J]
.福建广播电视大学学报,2005(2):55-57.
2
张长利,赫枫龄,左万利.
一种基于后缀数组的无词典分词方法[J]
.吉林大学学报(理学版),2004,42(4):548-553.
被引量:14
3
韩客松,王永成,陈桂林.
汉语语言的无词典分词模型系统[J]
.计算机应用研究,1999,16(10):8-9.
被引量:22
4
陈明华,殷景华,舒昌,王明江.
基于正反向最大匹配分词系统的实现[J]
.信息技术,2009,33(6):124-127.
被引量:7
5
刘京城,刘锋.
一种改进的基于后缀数组的无词典分词方法[J]
.计算机技术与发展,2011,21(11):49-52.
6
李振星,徐泽平,唐卫清,唐荣锡.
全二分最大匹配快速分词算法[J]
.计算机工程与应用,2002,38(11):106-109.
被引量:39
7
李晓红.
中文文本分类中的特征词抽取方法[J]
.计算机工程与设计,2009,30(17):4127-4129.
被引量:16
8
胥桂仙,苏筱蔚,陈淑艳.
中文文本挖掘中的无词典分词的算法及其应用[J]
.吉林工学院学报(自然科学版),2002,23(1):16-18.
被引量:26
9
傅赛香,袁鼎荣,黄柏雄,钟智.
基于统计的无词典分词方法[J]
.广西科学院学报,2002,18(4):252-255.
被引量:24
10
张科.
多次Hash快速分词算法[J]
.计算机工程与设计,2007,28(7):1716-1718.
被引量:22
福建电脑
2006年 第9期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部