期刊文献+

基于层级特征和DPCNN的文本数据治理方法

Text Data Governance Method based on Hierarchical Feature and DPCNN
下载PDF
导出
摘要 大规模文本的数据划分是数据治理中的关键问题,而传统的中文文档建模方法容易忽视上下文语义关系和文档层级结构。针对以上问题提出一种基于层级特征和DPCNN的文本数据治理方法。该方法首先通过BERT模型抽取文本的层次特征信息,然后将结合全文信息的向量传入DPCNN模型中;经过金字塔型池化层后,最终通过全连接层进行数据划分。该方法能够有效提高特征稀疏文本数据的预测准确率。 The data division of large-scale text is a key problem in data governance,but the traditional Chinese document modeling method is easy to ignore the contextual semantic relationship and the hierarchical structure of the document.To solve the above problems,a text data governance method based on hierarchical characteristics and DPCNN is proposed.Firstly,the hierarchical feature information of text is extracted by BERT model.Then the vector combined with the fulltext information is passed into DPCNN model,after passing through the pyramid pooling layer;Finally,the data is divided through the full connection layer.This method can effectively improve the prediction accuracy of sparse feature text data.
作者 丁行硕 鞠通 DING Xing-shuo;JU Tong(The Center of Data&Information,Qingdao Ocean Shipping Mariners College,Qingdao266427,China)
出处 《青岛远洋船员职业学院学报》 2023年第3期18-20,53,共4页 Journal of Qingdao Ocean Shipping Mariners College
基金 青岛远洋船员职业学院科研项目:“高职院校航海类专业技能型人才工匠精神培育研究”(2023-R-004) 山东省职业教育教学改革研究项目:“AI时代职业学校技能型人才工匠精神培育研究与实践”(2022286)。
关键词 数据治理 层级特征 BERT DPCNN data governance hierarchical characteristics BERT DPCNN
  • 相关文献

参考文献3

二级参考文献16

共引文献494

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部