改进的TF-IDF模型在特征抽取中的应用被引量：3

Application of Improved TF-IDF Model in Feature Extraction

下载PDF

导出

摘要在TF-IDF的基础上,提出了一种利用N-gram方法提取特征值的方法,能够很好的从一系列文本中取出某篇文本的特征值,并且可以对分词出现错误的一些连续的词语进行合并得到正确的一组词语,减少了分词出现的错误率。 In this paper,a new method of feature extraction is put forward using N-gram Algorithm,which can help to get better characteristic value of one document,and it can reduce the segmentation error by combining several consecutive words.

作者李运田吴琼郑献卫

机构地区上海大学机电工程与自动化学院

出处《工业控制计算机》 2014年第2期51-51,共1页 Industrial Control Computer

关键词 TF—IDF N—gram 特征值 TF-I DF,N-gram,characteristic value

分类号 TP393.0 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献58

1李超锋,杨殿生,许云.Web使用挖掘中数据预处理过程研究[J].电子测量技术,2007,30(3):3-5. 被引量：6
2林文龙,刘业政,姜元春.Web浏览预测的Markov模型综述[J].计算机科学,2008,35(1):9-14. 被引量：7
3Pazzani M J. A framework for collaborative, con-tent-based and demographic filtering [J], Artif In- tell Rev, 1999, 13 (5-6) z 393.
4Lee T Q, Park Y, Park Y. A time-based approach to effective recommender systems using implicit feedback [- J 7. Expert Syst Appl, 2008, 34 (4) . 3055.
5Pan W K, Chen L. GBPR: group preference based Bayesian personalized ranking for one-class collabo- rative filtering [C] //Proceedings of the 23rd Inter- national Conference on Artificial Intelligence. Bei- jing, China: ACM, 2013.
6孔庆超,毛文吉.互联网用户行为的建模与预测[EB/OL]. (2012-09). [2015-11-01]. http.//www. caa. org. cn/ccaa, php? to = ccaa/indextext, action? Aid=29.
7Manavoglu E, Pavlov D, Giles C L. Probabilistic user behavior models [C] //Proeeedings of the 3rd IEEE International Conference on Data Mining. Melbourne, Florida: IEEE, 2003.
8Peng H K, Zhu J, Piao D, etal. Retweet modeling using conditional random fields [C] //Proceedings of 2011 IEEE llth International Conference on Data Mining Workshops. Vancouver, IEEE, 2011.
9Huang Z, Zeng D D, Chen H. Analyzing consumer- product graphs: Empirical findings and applications in recommender systems [J]. Manage Sci, 2007, 53 (7) : 1146.
10Zhang Y C, Blattner M, Yu Y K. Heat conduction process on community networks as a recommenda- tion model [J]. Phys Rev Lett, 2008, 99 (15) : 12505.

引证文献3

1刘汉清,朱敏,苏亚博,唐彬彬.一种考虑用户兴趣转移特征的协同预测模型[J].四川大学学报（自然科学版）,2016,53(3):548-554. 被引量：13
2黄山,刘学锋,毛建华,李银桥.基于关联规则的大数据领域人才需求分析[J].工业控制计算机,2017,30(8):78-80. 被引量：7
3上海电力学院学报2017年总目次[J].上海电力学院学报,2017,33(6):613-613.

二级引证文献20

1王斯盾,琚生根,周刚,刘玉娇.基于集成分类器的用户属性预测研究[J].四川大学学报（自然科学版）,2017,54(6):1195-1201. 被引量：3
2黄贤英,熊李媛,李沁东.基于改进协同过滤算法的个性化新闻推荐技术[J].四川大学学报（自然科学版）,2018,55(1):49-55. 被引量：19
3金玉,崔兰兰,孙界平,琚生根,王霞.基于综合相似度迁移的协同过滤算法[J].四川大学学报（自然科学版）,2018,55(3):477-482. 被引量：11
4黄贤英,龙姝言,谢晋.基于用户非对称相似性的协同过滤推荐算法[J].四川大学学报（自然科学版）,2018,55(3):489-493. 被引量：8
5杜茂康,王忠思,宋强.基于Bhattacharyya系数的改进相似度度量方法[J].重庆邮电大学学报（自然科学版）,2018,30(5):699-704. 被引量：2
6朱敏,田伟,彭第,苏亚博,牛颢.问答社区中基于问题粒度的用户专业性预测方法[J].工程科学与技术,2019,51(1):173-180. 被引量：1
7李征,段垒.基于用户兴趣评分填充的改进混合推荐方法[J].工程科学与技术,2019,51(1):189-196. 被引量：9
8周燕,朱艳丽,杨敏.基于企业人才需求分析的高校本科人才培养模式的改革研究[J].高教学刊,2019,5(11):167-169. 被引量：4
9朱思霖,郭丽清.基于前程无忧招聘信息的数据人才需求分析[J].物联网技术,2019,9(8):112-116. 被引量：7
10桂忠艳,张艳明,李巍巍.基于行为序列分析的学习资源推荐算法研究[J].计算机应用研究,2020,37(7):1979-1982. 被引量：6

1王鸿,余建桥.基于N-Gram的Deep Web接口属性抽取[J].计算机与现代化,2010(12):135-138. 被引量：1
2熊伟,吴钊,李兵,谷琼,宁彬.一种基于语义的时空敏感社会关系模型[J].小型微型计算机系统,2016,37(6):1207-1211. 被引量：1
3夏成锋.基于n-gram及SVM的中文垃圾邮件过滤[J].广东广播电视大学学报,2008,17(1):100-103.
4罗毅,李利,谭松波,程学旗.基于中文微博语料的情感倾向性分析[J].山东大学学报（理学版）,2014,49(11):1-7. 被引量：11
5宣以广,周华.基于字符熵的JavaScript代码混淆自动检测方法[J].计算机应用与软件,2015,32(1):309-312. 被引量：5
6王常武,韩菁华,张付志.一种相似重复元数据记录检测方法[J].计算机工程,2009,35(21):85-87. 被引量：3
7阿力木.木拉提,艾孜尔古丽,杨雅婷,李晓.基于多策略的维吾尔文网页识别方法[J].中文信息学报,2017,31(1):133-139.
8潘正高,张磊.一种模式匹配和统计学习相结合的文本情感分类方法[J].宿州学院学报,2013,28(1):66-68. 被引量：1
9刘怡,郝云飞.一种新的高效大型音乐数据库查询算法[J].湖南科技大学学报（自然科学版）,2006,21(1):68-72. 被引量：6
10朱志国,邓贵仕,孔立平.基于N-gram的Web用户浏览模式分类算法研究[J].情报学报,2009,28(3):389-394. 被引量：2

工业控制计算机

2014年第2期

浏览历史

内容加载中请稍等...

改进的TF-IDF模型在特征抽取中的应用被引量：3

同被引文献58

引证文献3

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

改进的TF-IDF模型在特征抽取中的应用 被引量：3

同被引文献58

引证文献3

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

改进的TF-IDF模型在特征抽取中的应用被引量：3