期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于层级特征和DPCNN的文本数据治理方法
1
作者 丁行硕 鞠通 《青岛远洋船员职业学院学报》 2023年第3期18-20,53,共4页
大规模文本的数据划分是数据治理中的关键问题,而传统的中文文档建模方法容易忽视上下文语义关系和文档层级结构。针对以上问题提出一种基于层级特征和DPCNN的文本数据治理方法。该方法首先通过BERT模型抽取文本的层次特征信息,然后将... 大规模文本的数据划分是数据治理中的关键问题,而传统的中文文档建模方法容易忽视上下文语义关系和文档层级结构。针对以上问题提出一种基于层级特征和DPCNN的文本数据治理方法。该方法首先通过BERT模型抽取文本的层次特征信息,然后将结合全文信息的向量传入DPCNN模型中;经过金字塔型池化层后,最终通过全连接层进行数据划分。该方法能够有效提高特征稀疏文本数据的预测准确率。 展开更多
关键词 数据治理 层级特征 BERT DPCNN
下载PDF
基于标签分层延深建模的企业画像构建方法 被引量:5
2
作者 丁行硕 李翔 谢乾 《计算机应用》 CSCD 北大核心 2022年第4期1170-1177,共8页
标签建模是标签体系建设和画像构建的基本任务。而传统标签建模方法存在模糊标签处理难、标签提取不合理,以及无法有效融合多模实体和多维关系等问题。针对以上问题提出了一种基于标签分层延深建模的企业画像构建方法EPLLD。首先,通过... 标签建模是标签体系建设和画像构建的基本任务。而传统标签建模方法存在模糊标签处理难、标签提取不合理,以及无法有效融合多模实体和多维关系等问题。针对以上问题提出了一种基于标签分层延深建模的企业画像构建方法EPLLD。首先,通过多源信息融合获取多特征信息,并对企业模糊标签(如批发、零售等行业中的不能完整概括企业特点的标签)进行统计和筛选;然后,建立专业领域词库进行特征拓展,并结合BERT语言模型进行多特征提取;其次,利用双向长短期记忆(BiLSTM)网络获取模糊标签延深结果;最后,通过TF-IDF、TextRank、隐含狄利克雷分布(LDA)模型提取关键词,从而实现标签的分层延深建模。在同一企业数据集上进行实验分析,结果表明在模糊标签延深任务中EPLLD的精确率达到91.11%,高于BiLSTM+Attention、BERT+Deep CNN等8种标签处理方法。 展开更多
关键词 企业画像 标签建模 多源信息融合 模糊标签 特征提取
下载PDF
一种基于WSD层级记忆网络建模的文档表示方法
3
作者 张柯文 李翔 +4 位作者 朱全银 方强强 马甲林 成洁怡 丁行硕 《淮阴工学院学报》 CAS 2020年第3期47-53,共7页
针对传统自然语言处理中基于中文文档建模方法忽视了上下文语义关系和文档层级结构的问题,提出一种基于WSD层级记忆网络建模的文档表示方法,以充分利用词句级联的层次关系,增强文档建模内部的语义联系,实现文档分类。该方法首先通过Ber... 针对传统自然语言处理中基于中文文档建模方法忽视了上下文语义关系和文档层级结构的问题,提出一种基于WSD层级记忆网络建模的文档表示方法,以充分利用词句级联的层次关系,增强文档建模内部的语义联系,实现文档分类。该方法首先通过Bert模型进行词到句的表示;然后利用双向长短时记忆网络结合注意力机制输出每个时刻句子信息的重要程度;最后通过全连接层获得连续的文档模型进行分类预测。对THUCNEWS、CHEM&ENGNEWS两个数据集进行仿真实验,结果表明本方法相比传统方法准确性提高7.06%~18.31%,有效地提高了文档分类的预测精度,为文档分类提供借鉴。 展开更多
关键词 自然语言处理 文档建模 层级记忆网络 Attention机制
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部