期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
基于关键词组合向量模型的文本自动分类研究
下载PDF
职称材料
导出
摘要
本文描述了一种新的基于关键词组合模式的文本向量空间表示模型,相对于只使用文本中词语的频率的文本向量空间模型,这种新的模型在可以计算的前提下,使用了词语之间的相对位置信息,从而可以解决部分词语向量空间模型表示的不足。本文讨论了使用这种模型的自动文本分类系统,包括分类系统的结构、特征提取、文本相似度计算公式,并给出了评估方法。
作者
赵红宇
机构地区
西南科技大学经济管理学院
出处
《商场现代化》
北大核心
2008年第26期20-21,共2页
关键词
关键词组合
向量空间
自动分类
分类算法
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
引文网络
相关文献
节点文献
二级参考文献
22
参考文献
4
共引文献
136
同被引文献
0
引证文献
0
二级引证文献
0
参考文献
4
1
朱华宇,孙正兴,张福炎.
一个基于向量空间模型的中文文本自动分类系统[J]
.计算机工程,2001,27(2):15-17.
被引量:45
2
秦进,陈笑蓉,汪维家,陆汝占.
文本分类中的特征抽取[J]
.计算机应用,2003,23(2):45-46.
被引量:73
3
钟敏娟,林亚平,陈治平.
基于分类和关键词组抽取的信息检索算法[J]
.系统仿真学报,2004,16(5):1009-1012.
被引量:10
4
晋耀红,苗传江.
一个基于语境框架的文本特征提取算法[J]
.计算机研究与发展,2004,41(4):582-586.
被引量:15
二级参考文献
22
1
邹涛.基于WWW的信息发现技术研究(博士学位论文)[M].南京:南京大学,1999..
2
[1]Anselm Spoerri. A visual tool for information retrieval. 1995. http://www.scils.rutgers.edu/~aspoerri/InfoCrystal
3
[3]S Robertson. The TREC 2001 Filtering Track Report. 2001. http://trec.nist.gov/pubs/trec10/t10- proceedings.html
4
邹涛,博士学位论文,1999年
5
Yang Y,Information Retrieval J,1999年
6
Yang Y,INRT J,1998年
7
吴立德,大规模中文文本处理,1997年,7页
8
陈世福,人工智能与知识工程,1997年,391页
9
Yang Y,ACM Transactions on Information Systems,1994年
10
Jian Zhang, Jianfeng Gao. Improving the effective of information retrieval with clustering and fusion [J].Computational Linguistics and Chinese Language Processing,2001,6(1): 109-125.
共引文献
136
1
杨丽华,李保林.
邮件过滤系统中预处理方法的研究与实现[J]
.湖北汽车工业学院学报,2007,21(3):40-43.
被引量:2
2
马建斌,滕桂法,李滢,赵洋.
TSVM在电子邮件作者身份分类技术上的应用[J]
.河北工业大学学报,2005,34(z1):124-126.
3
姚学礼.
文本分类中的特征提取方法的研究[J]
.光盘技术,2009(6):15-16.
4
刘海峰,王元元,张学仁.
基于VSM的模糊标引文本检索若干问题研究[J]
.图书情报工作,2006,50(S2):127-130.
5
单丽莉,刘秉权,孙承杰.
文本分类中特征选择方法的比较与改进[J]
.哈尔滨工业大学学报,2011,43(S1):319-324.
被引量:25
6
侯风巍,郭东军,李世磊,徐钊峰.
基于信息反馈的文本主题分类过滤方法[J]
.通信学报,2009,30(S1):139-144.
7
陈淑珍.
Web文本挖掘中的特征表示与特征提取技术[J]
.三明高等专科学校学报,2004,21(2):53-57.
被引量:2
8
贝雨馨,崔荣一.
文本分类中特征项权重的计算方法[J]
.延边大学学报(自然科学版),2004,30(3):202-204.
被引量:9
9
高洁,吉根林.
文本分类技术研究[J]
.计算机应用研究,2004,21(7):28-30.
被引量:36
10
谭浩,贾自艳,史忠植.
新闻专题的高效组织和生成新方法[J]
.科技导报,2004,22(7):48-51.
1
林华兵,傅清祥.
基于文本相似度的关键词分类算法[J]
.福建电脑,2005,21(8):46-47.
被引量:1
2
周丽杰,于伟海,郭成.
基于词项语义组合的文本相似度计算方法研究[J]
.计算机工程与应用,2016,52(19):90-93.
被引量:4
3
王映,常毅,谭建龙,白硕.
基于N元汉字串模型的文本表示和实时分类的研究与实现[J]
.计算机工程与应用,2005,41(5):88-91.
被引量:5
4
何鑫乐,骆虹希,林梦琳,戴丹.
基于淘宝的搜索引擎优化策略研究——以品牌运动鞋类目为主的网店为例[J]
.电子商务,2014,15(12):49-49.
被引量:1
5
檀佳.
基于变电站自动化信息的远程数据挖掘系统研究[J]
.机电信息,2014(24):141-141.
6
符发.
中文文本分类中特征选择方法的比较[J]
.现代计算机,2008,14(6):43-45.
被引量:7
7
吕传宇,李华,耿虎.
一种适合于专题式元搜索引擎的信息检索策略[J]
.重庆大学学报(自然科学版),2004,27(7):90-93.
被引量:1
8
厉宇航,罗振声,程慕胜.
基于概念层次的英文文本自动分类研究[J]
.计算机工程与应用,2004,40(11):75-77.
被引量:3
9
张文萍,黎春兰.
基于文本空间表示模型的文本相似度计算研究[J]
.现代情报,2013,33(2):21-23.
被引量:4
10
同鸣,王硕,丁力伟,王纲.
HCRF和网络文本的精彩事件自动检测定位[J]
.西安电子科技大学学报,2015,42(4):81-87.
商场现代化
2008年 第26期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部