高特征参差性下强收敛性文本的信息处理

Processing of Text with High Characteristics Mixed and Strong Convergence

下载PDF

导出

摘要传统的文本信息处理方法无法表征文本内特征,所以不适用于模糊特征的提取分类提出一种高特征参差性下强收敛性文本的信息处理技术,对文本间和文本内的特征同时进行提取,采用迭代控制的TFIDF对特征进行加权值的计算,最后采用22类文本进行性能测试,结果显示,迭代控制的TFIDF算法能够更加细致地对文本进行分类,对特征进行提取,并且算法收敛速度快,稳定性好,具有很好的应用价值。 A processing method of text with high characteristics mixed and strong convergence was propose, the multimediainformation based on iterative classification process and control technology were used to classify the text, and the characteristics between and within the text were all used, the iterative control TFIDF algorithm was used to count the weigh. 22 typesof text were taken as target to test the ability between the improved algorithm and the traditional algorithm, the resultshowed that the improved TFIDF algorithm with iterative can classify the text more detailed and more characteristics is extracted, the algorithm is stable with good convergence ability, it will be used widely.

作者董健

机构地区盐城师范学院信息科学与技术学院

出处《科技通报》北大核心 2014年第4期71-73,共3页 Bulletin of Science and Technology

基金盐城师范学院校级自然科学研究基金(11YCKL032)

关键词迭代算法 TFIDF 高特征参差文本分类 iteration algorithm TFIDF high characteristics mixed text classification

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1Shouning Qu, Sujuan Wang, Yan Zou. Improvement ofText Feature Selection Method based on TFIDF[C]. Interna.tional Seminar on Future Information Technology and Man.agement Engineering,2008: 79-81.
2鲁松,李晓黎,白硕,王实.文档中词语权重计算方法的改进[J].中文信息学报,2000,14(6):8-13. 被引量：120
3李素建,王厚峰,俞士汶,辛乘胜.关键词自动标引的最大熵模型应用研究[J].计算机学报,2004,27(9):1192-1197. 被引量：93
4徐文海,温有奎.一种基于TFIDF方法的中文关键词抽取算法[J].情报理论与实践,2008,31(2):298-302. 被引量：65
5许晓昕,李安贵.一种基于TFIDF的网络聊天关键词提取算法[J].计算机技术与发展,2006,16(3):122-123. 被引量：15
6徐燕,李锦涛,王斌,孙春明.基于区分类别能力的高性能特征选择方法[J].软件学报,2008(1):82-89. 被引量：83
7Zhou Yanao, Tang Jianbo, Wang Jiaqin. An improvedTFIDF feature selection algorithm based on information en.tropy[C]. Proceedings of the26th Chinese Control Confer.ence, 2007,312-315.
8王安,焦美鹏,张小东.国内18信息移频信号检测频谱校正算法的研究[J].计算机测量与控制,2012,20(2):414-417. 被引量：7

二级参考文献24

1李素建,王厚峰,俞士汶,辛乘胜.关键词自动标引的最大熵模型应用研究[J].计算机学报,2004,27(9):1192-1197. 被引量：93
2谢明,丁康.频谱分析的校正方法[J].振动工程学报,1994,7(2):172-179. 被引量：130
3赵世奇,张宇,刘挺,陈毅恒,黄永光,李生.基于类别特征域的文本分类特征选择方法[J].中文信息学报,2005,19(6):21-27. 被引量：21
4王军.词表的自动丰富——从元数据中提取关键词及其定位[J].中文信息学报,2005,19(6):36-43. 被引量：40
5苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：389
6索红光,刘玉树,曹淑英.一种基于词汇链的关键词抽取方法[J].中文信息学报,2006,20(6):25-30. 被引量：88
7丁康,潘成灏,李巍华.ZFFT与Chirp-Z变换细化选带的频谱分析对比[J].振动与冲击,2006,25(6):9-12. 被引量：56
8刘佳宾,陈超,邵正荣,吉翔华.基于机器学习的科技文摘关键词自动提取方法[J].计算机工程与应用,2007,43(14):170-172. 被引量：15
9赵军民,杨平,朱新波.基于DSP的移频信号高分辨率检测方法[J].计算机测量与控制,2007,15(5):561-562. 被引量：5
10铁道部.铁路信号维护规则[M].北京:中国铁道出版社,2006.

共引文献363

1孙星恺,王晓,陆浩.面向活动的网络媒体监测与建模分析:IVFC案例解析[J].智能科学与技术学报,2019,1(4):352-368. 被引量：1
2聂卉.结合词向量和词图算法的用户兴趣建模研究[J].数据分析与知识发现,2019,3(12):30-40. 被引量：8
3曾金,张耀峰,黄新杰,黄廷海.面向用户评论的主题挖掘研究——以美团为例[J].情报科学,2022,40(11):78-84. 被引量：9
4张博凯,李想.基于知识图谱的Android端农技智能问答系统研究[J].农业机械学报,2021,52(S01):164-171. 被引量：12
5周延泉,张传福,张瑞华,李蕾,何华灿.移动个性化信息服务中的用户兴趣模型[J].北京邮电大学学报,2006,29(z2):144-147. 被引量：1
6许增福,梁静国,田晓宇.基于FVSM和自组织映射网络的Web文本自动分类方法[J].哈尔滨工业大学学报,2004,36(9):1168-1172. 被引量：2
7胡卓颖,徐可,万中英,陆玉昌,丁树良.专题型网页搜集系统的设计与实现[J].计算机与现代化,2004(10):1-5.
8王大亮,孙建涛,陆玉昌,夏克俭.一种面向自动文本摘要特征评价的新方法[J].计算机工程与应用,2004,40(33):176-178.
9徐凤亚,罗振声.文本自动分类中特征权重算法的改进研究[J].计算机工程与应用,2005,41(1):181-184. 被引量：56
10吴卫华,袁宁,周劲,王洪军.基于文本集密度的特征词选择与权重计算方法[J].计算机与数字工程,2005,33(3):11-13. 被引量：4

1多功能打印机全方位比拼[J].电脑与电信,2004(04M):28-29.
2张锦华,孙挺.引入像点融合度修补的图像边缘化参差拼接实现[J].微电子学与计算机,2014,31(8):167-170.
3Dying.全能型鼠标推荐[J].电脑迷,2014,0(9):25-25.
4Dying.基于作业系统的过程评价[J].电脑迷,2014,0(9):25-25.
5陈营,刘珂.针对软件项目管理的流程分析和设计探究[J].消费电子,2014,0(18):173-173.
6天蝎星.火眼金睛检测刻录盘[J].电脑爱好者,2003(24):85-85.
7沃尔玛推行RFID（无线射频识别）效果欠佳[J].中国安防产品信息,2005(01X):57-58.
8晓喻.声音好听得不得了 Line Magnetic(丽磁)LM-219IA[J].家庭影院技术,2012(1):52-53.
9经济适用型笔记本[J].个人电脑,2003,9(12):74-74.
10陈怡,陈靖.《大学计算机应用基础》课程改革探索[J].科学大众（智慧教育）,2013(6):145-145. 被引量：1

科技通报

2014年第4期

浏览历史

内容加载中请稍等...

高特征参差性下强收敛性文本的信息处理

参考文献8

二级参考文献24

共引文献363

相关作者

相关机构

相关主题

浏览历史