期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于特征矩阵构造与BP神经网络的垃圾文本过滤模型 被引量:6
1
作者 方瑞 于俊洋 董李锋 《计算机工程》 CAS CSCD 北大核心 2020年第8期271-276,共6页
在网络社交平台海量的信息文本中含有许多垃圾文本,这些文本的广泛散布影响了人们正常社交。为此,提出一种垃圾文本过滤模型。通过BERT模型提取文本的句编码,采用B-Feature方法对句编码进行特征构造,并根据文本与所得特征之间的联系进... 在网络社交平台海量的信息文本中含有许多垃圾文本,这些文本的广泛散布影响了人们正常社交。为此,提出一种垃圾文本过滤模型。通过BERT模型提取文本的句编码,采用B-Feature方法对句编码进行特征构造,并根据文本与所得特征之间的联系进一步将该特征构造为特征矩阵,运用BP神经网络分类器对特征矩阵进行处理,检测出垃圾文本并进行过滤。实验结果表明,该模型在长、中、短文本数据集上的准确率较TFIDF-BP模型分别提高7.8%、3.8%和11.7%,在中、短文本数据集上的准确率较朴素贝叶斯模型分别提高2.1%和13.7%,能有效对垃圾文本进行分类和过滤。 展开更多
关键词 BERT模型 特征构造 BP神经网络 垃圾文本过滤 文本分类 句编码
下载PDF
基于TF-IDF和改进BP神经网络的社交平台垃圾文本过滤 被引量:11
2
作者 王杨 王非凡 +4 位作者 张舒宜 黄少芬 许闪闪 赵晨曦 赵传信 《计算机系统应用》 2019年第3期126-132,共7页
近年来,随着生活节奏的提高和互联网的迅速发展,人们更倾向于在众多社交平台上用短文本进行交流,进而可能有人通过发布垃圾文本妨碍人们的正常社交,扰乱网络的绿色环境.为了解决这个问题,我们提出了基于TF-IDF和改进BP神经网络的社交平... 近年来,随着生活节奏的提高和互联网的迅速发展,人们更倾向于在众多社交平台上用短文本进行交流,进而可能有人通过发布垃圾文本妨碍人们的正常社交,扰乱网络的绿色环境.为了解决这个问题,我们提出了基于TF-IDF和改进BP神经网络的社交平台垃圾文本检测的方法.通过该方法,实现对社交平台上的垃圾文本过滤.首先,通过结巴分词和去停分词构造关键词数据集;其次,对文本表示的关键词向量运用计算各关键词的权重从而对文本向量进行降维,得到特征向量;最后,在此基础上,运用BP神经网络分类器对短文本进行分类,检测出垃圾文本并进行过滤.实验结果表明用该方法在1000维文本特征向量的情况下分类平均准确率达到了97.720%. 展开更多
关键词 TF-IDF 改进BP神经网络 结巴分词 垃圾文本过滤
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部