基于深度学习的Web信息抽取模型研究与应用被引量：2

Research and application of deep learning based Web information extraction model

下载PDF

导出

摘要 Web网页中包含了大量异构的半结构化或非结构化数据,如何准确地从这些网页中提取有价值的信息显得极其重要。文章基于深度学习,结合BERT构建了一种新型的BERT+BiLSTM+CRF信息抽取模型,实验结果表明了该方法的有效性。 Web pages contain large amount of heterogeneous semi-structured or unstructured data, and how to accurately extract valuable information from web pages is extremely important. With the help of deep learning, this paper proposes a new BERT +BiLSTM+CRF information extraction model. The experimental results show the effectiveness of the proposed method.

作者俞鑫吴明晖 Yu Xin;Wu Minghui(Computer and Computing Science School, Zhejiang University City College, Hangzhou 310015, China)

机构地区浙江大学城市学院计算机与计算科学学院

出处《计算机时代》 2019年第9期30-32,共3页 Computer Era

关键词深度学习信息抽取模型 WEB BERT+BiLSTM+CRF deep learning information extraction model Web BERT+BiLSTM+CRF

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献17

1胡露露,刘小勤,孙凯.基于正文特征和网页结构的网页正文抽取方法[J].大气与环境光学学报,2017,12(3):230-235. 被引量：2
2马晓慧,李泓莹.一种DOM树标签路径和行块密度结合的Web信息抽取方法[J].智能计算机与应用,2017,7(4):13-16. 被引量：4
3陈俊洁.web信息提取技术与应用的研究[J].数字技术与应用,2017,35(9):114-114. 被引量：2
4邱奇志,周三三,刘长发,陈晖.基于文体和词表的突发事件信息抽取研究[J].中文信息学报,2018,32(9):56-65. 被引量：13
5魏春光.浅析互联网大数据在媒体业务的支撑应用——以人民公安报社舆情监测系统为例[J].中国传媒科技,2019,0(6):80-82. 被引量：3
6桂思思,张晓娟,王鑫.查询歧义性程度自动标注指标的替代性验证研究[J].数据分析与知识发现,2019,3(2):79-89. 被引量：3
7王雪梅,陈兴蜀,王海舟,王文贤.基于标签和分块特征的新闻网页关键信息自动抽取[J].山东大学学报（理学版）,2019,54(3):67-74. 被引量：6
8汤佳杰,曹永忠,顾浩.基于文本标点密度连续和的网页正文抽取[J].计算机时代,2020,0(1):69-72. 被引量：2
9印杰,蒋宇翔,牛博威,严梓宸,郭延文.基于深度学习的网页篡改远程检测研究[J].南京理工大学学报,2020,44(1):49-54. 被引量：5
10严靓,周欣,何小海,熊淑华,卿粼波.基于集成分类的暴恐图像自动标注方法[J].太赫兹科学与电子信息学报,2020,18(2):306-312. 被引量：1

引证文献2

1董亚男.基于深度学习的Web网页信息标注方法研究[J].现代信息科技,2021,5(22):89-91.
2郑创伟,王泳,陈少彬,邢谷涛,谢志成.Web信息抽取技术在吹哨系统中的研究与应用[J].中国传媒科技,2023(4):154-158.

1隆雪莲.探究小学数学微课教学的有效应用[J].明日,2019,0(41):0389-0389.
2吴建伟.旅游数字足迹:概念、类别及其研究综述[J].旅游纵览（下半月）,2017,0(1):23-24. 被引量：7
3袁微,郭春辉,陈晓维,方英城.基于Web的肇庆市气象灾情管理平台设计与实现[J].广东气象,2019,41(4):78-80. 被引量：6
4王莉军,李旭婕,刘志辉,翟云.基于开放信息源的实体挖掘方法研究[J].情报科学,2019,0(8):139-144. 被引量：6
5朱珊珊,唐慧丰.基于BiLSTM_Att的军事领域实体关系抽取研究[J].智能计算机与应用,2019,9(4):96-99. 被引量：8
6王小根,刘梦恒.在线知识建构中有效引发功能性冲突研究[J].电化教育研究,2019,40(9):34-42. 被引量：6
7任斌斌,谢振平,刘渊.领域资讯的个性化建构抽取建模研究[J].计算机科学与探索,2019,13(8):1370-1379.
8杨明.“微学案”在高中物理教学中的应用——以人教版必修二《曲线运动》为例浅谈在实际教学过程中的模式和反思[J].好日子,2019(1):128-128.
9冯建周,宋沙沙,王元卓,刘亚坤,武红颖,龚昊.基于改进注意力机制的实体关系抽取方法[J].电子学报,2019,47(8):1692-1700. 被引量：18
10尚晖,彭兰,齐爱军,方师师,郭俊华,徐申,徐世平,张志斌,张勇丽,李华君.新闻客户端的发展困境与新策略[J].传媒,2019(16):6-7. 被引量：5

计算机时代

2019年第9期

浏览历史

内容加载中请稍等...

基于深度学习的Web信息抽取模型研究与应用被引量：2

同被引文献17

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于深度学习的Web信息抽取模型研究与应用 被引量：2

同被引文献17

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于深度学习的Web信息抽取模型研究与应用被引量：2