基于自然语言处理的建筑企业失信行为信息分类研究

Research onthe Classification of Bad Credit Information inConstruction Market Based on Natural Language Processing

下载PDF

导出

摘要为改善建筑信用管理中对信用信息的文档管理依赖人力劳动的现状,文章提出一种基于自然语言处理技术(NLP)的建筑企业失信行为信息文本分类方法。首先,基于Skip-Gram词向量模型利用已标注数据和大量无标注获取文本的词向量表示;其次,运用融入注意力机制(attention-mechanism)的双向长短期记忆网络模型(BiLSTM)对已标注数据进行特征提取与文本分类。结果表明:在小样本训练中,使用较大的语料库训练词向量模型可有效提高文本分类模型的分类效果,BiLSTM-Attention模型的分类性能优于对照模型,基于NLP的文本分类方法能够实现对建筑企业失信行为信息的快速自动分类。 In order to improve the status quo of relying on human labor for document management of credit information in construction credit management,This paper proposed a text categorization method based on Natural Language Processing(NLP)for the information of construction enterprise's bad credit information.Firstly,the word vector representation of the text was obtained based on Skip-Gram model using labeled data and a large number of unlabeled;secondly,the Bi-directional Long-Short Term Memory Network(BiLSTM),which incorporated the Attention-Mechanism,was used to perform feature extraction and text classification on the labeled data.The results showed that:in small-sample training,using a larger corpus to train the word vector model could effectively improve the classification performance of the text classification model,the NLP-based text classification method could realize the fast and automatic classification of the information about the bad Credit information of construction enterprises.

作者张振森任宇轩曹吉昌 ZHANG Zhensen;REN Yuxuan;CAO Jichang(School of Management Engineering,Qingdao University of Technology,Qingdao 266525)

机构地区青岛理工大学管理工程学院中国科学院大学

出处《九江学院学报（自然科学版）》 CAS 2024年第3期99-105,109,共8页 Journal of Jiujiang University：Natural Science Edition

基金国家自然科学基金(编号72001121) 住房和城乡建设部委托课题(编号JXXTH-2023-103)的研究成果之一。

关键词失信行为信息行政处罚 Skip-Gram词向量注意力机制文本分类 bad credit information administrative penalty Skip-Gram word vector Attention-Mechanism text classification

分类号 F426.92 [经济管理—产业经济]

引文网络
相关文献

参考文献7

1张晨,王建东,罗宵,赵鲲,廖勇.工程管理数字化关键技术研究进展[J].计算机应用,2023,43(S01):187-195. 被引量：10
2王煜,邓晖,李晓瑶,邓逸川.自然语言处理技术在建筑工程中的应用研究综述[J].图学学报,2020,41(4):501-511. 被引量：16
3于游,付钰,吴晓平.中文文本分类方法综述[J].网络与信息安全学报,2019,5(5):1-8. 被引量：41
4李华,陈俞源,高红,何思敏,乔峥元.基于改进Bert模型的建筑事故隐患分类方法研究[J].安全与环境学报,2022,22(3):1421-1429. 被引量：8
5蒋海刚.词向量文本挖掘技术在建筑设施管理应用研究[J].电脑知识与技术,2021,17(33):22-25. 被引量：4
6周红,汤世隆,顾佳楠,王书钰.基于自然语言处理和深度学习的建设工程合同智能分类方法研究[J].科技管理研究,2023,43(8):165-172. 被引量：4
7曾骏,王子威,于扬,文俊浩,高旻.自然语言处理领域中的词嵌入方法综述[J].计算机科学与探索,2024,18(1):24-43. 被引量：9

二级参考文献89

1唐琳,郭崇慧,陈静锋.中文分词技术研究综述[J].数据分析与知识发现,2020,4(2):1-17. 被引量：45
2单丽莉,刘秉权,孙承杰.文本分类中特征选择方法的比较与改进[J].哈尔滨工业大学学报,2011,43(S1):319-324. 被引量：25
3刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：198
4何继善,陈晓红,洪开荣.论工程管理[J].中国工程科学,2005,7(10):5-10. 被引量：61
5李森,马军,赵嫣,雷景生.对数字化科技论文的自动分类研究[J].山东大学学报（理学版）,2006,41(3):14-16. 被引量：5
6苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：389
7黄昌宁,赵海.中文分词十年回顾[J].中文信息学报,2007,21(3):8-19. 被引量：250
8周朴雄.基于神经网络集成的WEB文档分类研究[J].图书情报工作,2008,52(7):110-112. 被引量：4
9朱晓赟,许民利.项目管理研究综述[J].价值工程,2008,27(11):128-131. 被引量：11
10张杰慧,何中市,王健,黄学全.基于自适应蚁群算法的组合式特征选择算法[J].系统仿真学报,2009,21(6):1605-1608. 被引量：11

共引文献83

1刘泳奇,吴环宇,陈珂.智能建造技术在工程造价管理中的应用研究综述[J].建筑经济,2022,43(S01):245-252. 被引量：29
2贾巨涛,张鹏,唐杰,吴伟,詹培旋.智能语音交互中的语义引导回复技术研究[J].家电科技,2022(S01):608-611. 被引量：2
3高云泽,王莉莉,董文睿,冯紫君,胡祖容,赵中楠.基于前后端分离算法的ACM智能管家系统[J].智能计算机与应用,2022,12(3):80-86. 被引量：3
4靳嵩,朱艳,吴可嘉,孟祥松,赵乾菊,王颖.基于BERT的海上船舶安全隐患分类[J].船舶工程,2023,45(S01):381-384.
5石凤贵.基于TF-IDF中文文本分类实现[J].现代计算机,2020,26(6):51-54. 被引量：8
6方侠旋.基于XGBoost模型的文本多分类研究[J].网络安全技术与应用,2020(6):50-52. 被引量：3
7杜思佳,于海宁,张宏莉.基于深度学习的文本分类研究进展[J].网络与信息安全学报,2020,6(4):1-13. 被引量：10
8王玲.基于Word2Vec词嵌入和双向长短时记忆网络的文本分类实现[J].电子技术与软件工程,2020(15):70-71. 被引量：3
9谢剑芳,田英明,徐旭,王方.基于FastText的专利文本自动分类方法研究[J].仪器仪表标准化与计量,2020(4):21-24. 被引量：3
10梁登玉.基于LSTM的中文文本多分类应用研究[J].上海电力大学学报,2020,36(6):598-602. 被引量：3

1黄世奇,王亮,甘甜甜.融合BiGRU与注意力机制的胶囊文本分类模型[J].物联网技术,2024,14(10):130-133.
2陈伟.基于深度学习的大规模文本分类研究[J].信息记录材料,2024,25(9):81-83.
3陈晟涌.信用赋能“干村示范、万村整治”更好引领乡村全面振兴的思考[J].中国信用,2024(9):84-89.
4吕鹏,刘金龙.村庄价值观的共同基调与地方风俗--基于万级村庄村规民约文本的大数据分析[J].济南大学学报（社会科学版）,2024,34(5):111-121.
5张京焘,陈晶晶,姚中才,韩伟健,杨芳菲,祁志广.武器装备供应商信用评价体系建设[J].中国军转民,2024(19):31-32.

九江学院学报（自然科学版）

2024年第3期

浏览历史

内容加载中请稍等...

基于自然语言处理的建筑企业失信行为信息分类研究

参考文献7

二级参考文献89

共引文献83

相关作者

相关机构

相关主题

浏览历史