要:提出一种基于掩码区域卷积神经网络的文本检测模型。首先从扩大模型感受野并尽可能保持模型效率的角度出发,针对残差神经网络中的瓶颈结构进行优化,构建基于结构优化的残差神经网络(residual network based on structural optimizati...要:提出一种基于掩码区域卷积神经网络的文本检测模型。首先从扩大模型感受野并尽可能保持模型效率的角度出发,针对残差神经网络中的瓶颈结构进行优化,构建基于结构优化的残差神经网络(residual network based on structural optimization,ResNetSO);然后去除冗余特征以提高融合后特征质量,并将空间注意力机制应用于特征金字塔网络,构建了基于下层特征指导的特征金字塔网络(feature pyramid network based on lower feature guidance,FPNetLFG)。在两个公开数据集上的实验结果表明:包含ResNetSO和FPNetLFG两个模块的模型应用在级联区域卷积神经网络、递归特征金字塔和可切换空洞卷积的目标检测模型中,分别可以带来0.8%和0.3%左右的F1值提升,从而说明了该方法的有效性和普遍适用性。展开更多
尽管长短期记忆网络(long short-term memory,LSTM)、卷积神经网络(convolutional neural network,CNN)及其结合体在文本分类任务中取得了很大的突破。但这类模型在对序列信息进行编码时,往往无法同时考虑当前时刻之前和之后的状态,从...尽管长短期记忆网络(long short-term memory,LSTM)、卷积神经网络(convolutional neural network,CNN)及其结合体在文本分类任务中取得了很大的突破。但这类模型在对序列信息进行编码时,往往无法同时考虑当前时刻之前和之后的状态,从而导致最后分类效果不佳。此外,多版本预训练词向量比单个版本的预训练词向量包含更多的信息。因此提出了一种基于CNN的多通道特征表示文本分类模型(multi-channel feature representation text classification model based on CNN,MC-CNN)。该模型首先通过两个不同的双向长短期记忆(bi-directional long short-term memory,Bi-LSTM)来对不同来源词向量所表示的文本序列进行正逆序上的特征提取,并以此形成多通道特征;然后利用多尺度卷积网络来进一步使得模型能够同时充分考虑到当前时刻之前以及之后的信息,从而更加有效地进行文本分类。MC-CNN在MR、SST-2、TREC、AG、Yelp_F、Yelp_P数据集上分别达到了81.6%、87.4%、98.6%、94.1%、65.9%、96.8%的准确率,实验结果表明本文模型MC-CNN在文本分类任务中具有优异的效果。展开更多
传统卷积神经网络文本分类的效果依赖输入文本表示的准确度,如果文本表示不准确,则输入的噪音将直接导致分类准确性的大幅下降。针对此问题,本文提出一种基于结合词性概率(coefficient part of speech,CPOS)特征和应用场景(application ...传统卷积神经网络文本分类的效果依赖输入文本表示的准确度,如果文本表示不准确,则输入的噪音将直接导致分类准确性的大幅下降。针对此问题,本文提出一种基于结合词性概率(coefficient part of speech,CPOS)特征和应用场景(application scene,AS)改进的双通道文本卷积神经网络模型Word-CPOS&AS DCNN(WCA-DCNN),通过引入词性的贡献度和设定场景权重2个因子,改善传统方法中短文本表示特征稀疏及不精确的问题。实验结果表明:WCA-DCNN算法在准确率、召回率和F1值等指标上都有明显提升。展开更多
文摘要:提出一种基于掩码区域卷积神经网络的文本检测模型。首先从扩大模型感受野并尽可能保持模型效率的角度出发,针对残差神经网络中的瓶颈结构进行优化,构建基于结构优化的残差神经网络(residual network based on structural optimization,ResNetSO);然后去除冗余特征以提高融合后特征质量,并将空间注意力机制应用于特征金字塔网络,构建了基于下层特征指导的特征金字塔网络(feature pyramid network based on lower feature guidance,FPNetLFG)。在两个公开数据集上的实验结果表明:包含ResNetSO和FPNetLFG两个模块的模型应用在级联区域卷积神经网络、递归特征金字塔和可切换空洞卷积的目标检测模型中,分别可以带来0.8%和0.3%左右的F1值提升,从而说明了该方法的有效性和普遍适用性。
文摘尽管长短期记忆网络(long short-term memory,LSTM)、卷积神经网络(convolutional neural network,CNN)及其结合体在文本分类任务中取得了很大的突破。但这类模型在对序列信息进行编码时,往往无法同时考虑当前时刻之前和之后的状态,从而导致最后分类效果不佳。此外,多版本预训练词向量比单个版本的预训练词向量包含更多的信息。因此提出了一种基于CNN的多通道特征表示文本分类模型(multi-channel feature representation text classification model based on CNN,MC-CNN)。该模型首先通过两个不同的双向长短期记忆(bi-directional long short-term memory,Bi-LSTM)来对不同来源词向量所表示的文本序列进行正逆序上的特征提取,并以此形成多通道特征;然后利用多尺度卷积网络来进一步使得模型能够同时充分考虑到当前时刻之前以及之后的信息,从而更加有效地进行文本分类。MC-CNN在MR、SST-2、TREC、AG、Yelp_F、Yelp_P数据集上分别达到了81.6%、87.4%、98.6%、94.1%、65.9%、96.8%的准确率,实验结果表明本文模型MC-CNN在文本分类任务中具有优异的效果。
文摘传统卷积神经网络文本分类的效果依赖输入文本表示的准确度,如果文本表示不准确,则输入的噪音将直接导致分类准确性的大幅下降。针对此问题,本文提出一种基于结合词性概率(coefficient part of speech,CPOS)特征和应用场景(application scene,AS)改进的双通道文本卷积神经网络模型Word-CPOS&AS DCNN(WCA-DCNN),通过引入词性的贡献度和设定场景权重2个因子,改善传统方法中短文本表示特征稀疏及不精确的问题。实验结果表明:WCA-DCNN算法在准确率、召回率和F1值等指标上都有明显提升。