-
题名基于DPI的用户兴趣实时分类
被引量:4
- 1
-
-
作者
陈康
付华峥
陈翀
张宇艺
韦誉
-
机构
中国电信股份有限公司广州研究院
广东工业大学计算机学院
广州优亿信息科技有限公司
-
出处
《电信科学》
北大核心
2016年第12期109-115,共7页
-
文摘
近年来,随着大数据发展热潮兴起,电信运营商能获得的DPI数据规模越来越大。如何对如此海量的DPI数据进行实时的挖掘和分类是运营商研究的热点。设计了一种基于混合n-gram特征的URL分类算法和基于Doc2Vec模型的文本分类算法相结合的DPI数据分类方法,大大提高了DPI数据的分类速度和分类准确率,为电信运营商进行精准营销提供了良好的基础。
-
关键词
DPI
URL分类
文本分类
N-GRAM
Doc2Vec
-
Keywords
DPI
URL classification
text classification
n-gram
Doc2Vec
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于改进的CBOW与ABiGRU的文本分类研究
被引量:6
- 2
-
-
作者
张宇艺
左亚尧
陈小帮
-
机构
广东工业大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2019年第24期135-140,170,共7页
-
基金
广东省科技计划公益研究(No.17ZK0226)
-
文摘
文本的表示与文本的特征提取是文本分类需要解决的核心问题,基于此,提出了基于改进的连续词袋模型(CBOW)与ABiGRU的文本分类模型。该分类模型把改进的CBOW模型所训练的词向量作为词嵌入层,然后经过卷积神经网络的卷积层和池化层,以及结合了注意力(Attention)机制的双向门限循环单元(BiGRU)神经网络充分提取了文本的特征。将文本特征向量输入到softmax分类器进行分类。在三个语料集中进行的文本分类实验结果表明,相较于其他文本分类算法,提出的方法有更优越的性能。
-
关键词
深度学习
连续词袋模型(CBOW)
注意力机制
神经网络
文本分类
-
Keywords
deep learning
Continuous Bag-of-Word(CBOW)
attention mechanism
neural network
text classification
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-