期刊文献+
共找到407篇文章
< 1 2 21 >
每页显示 20 50 100
Tree Automata for Extracting Consensus from Partial Replicas of a Structured Document
1
作者 Maurice Tchoupé Tchendji Milliam M. Zekeng Ndadji 《Journal of Software Engineering and Applications》 2017年第5期432-456,共25页
In an asynchronous cooperative editing workflow of a structured document, each of the co-authors receives in the different phases of the editing process, a copy of the document to insert its contribution. For confiden... In an asynchronous cooperative editing workflow of a structured document, each of the co-authors receives in the different phases of the editing process, a copy of the document to insert its contribution. For confidentiality reasons, this copy may be only a partial replica containing only parts of the (global) document which are of demonstrated interest for the considered co-author. Note that some parts may be a demonstrated interest over a co-author;they will therefore be accessible concurrently. When it’s synchronization time (e.g. at the end of an asynchronous editing phase of the process), we want to merge all contributions of all authors in a single document. Due to the asynchronism of edition and to the potential existence of the document parts offering concurrent access, conflicts may arise and make partial replicas unmergeable in their entirety: they are inconsistent, meaning that they contain conflictual parts. The purpose of this paper is to propose a merging approach said by consensus of such partial replicas using tree automata. Specifically, from the partial replicas updates, we build a tree automaton that accepts exactly the consensus documents. These documents are the maximum prefixes containing no conflict of partial replicas merged. 展开更多
关键词 structured documents WORKFLOW of Cooperative Edition MERGING PARTIAL Replicas CONFLICT CONSENSUS Tree AUTOMATA AUTOMATA Product Lazy Evaluation
下载PDF
Storyline Extraction of Document-Level Events Using Large Language Models
2
作者 Ziyang Hu Yaxiong Li 《Journal of Computer and Communications》 2024年第11期162-172,共11页
This article proposes a document-level prompt learning approach using LLMs to extract the timeline-based storyline. Through verification tests on datasets such as ESCv1.2 and Timeline17, the results show that the prom... This article proposes a document-level prompt learning approach using LLMs to extract the timeline-based storyline. Through verification tests on datasets such as ESCv1.2 and Timeline17, the results show that the prompt + one-shot learning proposed in this article works well. Meanwhile, our research findings indicate that although timeline-based storyline extraction has shown promising prospects in the practical applications of LLMs, it is still a complex natural language processing task that requires further research. 展开更多
关键词 document-Level Storyline Extraction TIMELINE Large Language Models Topological structure of Storyline Prompt Learning
下载PDF
基于修辞结构的篇章级神经机器翻译
3
作者 姜云卓 贡正仙 《计算机工程与科学》 北大核心 2025年第1期180-190,共11页
虽然篇章级神经机器翻译发展多年,并取得了长足的进步,但是其大部分工作都是从模型的角度出发,利用上下文字词信息来构建有效的网络结构,忽视了使用跨句子的篇章结构和修辞信息对模型进行指导。针对这一问题,在修辞结构理论的指导下,提... 虽然篇章级神经机器翻译发展多年,并取得了长足的进步,但是其大部分工作都是从模型的角度出发,利用上下文字词信息来构建有效的网络结构,忽视了使用跨句子的篇章结构和修辞信息对模型进行指导。针对这一问题,在修辞结构理论的指导下,提出了对篇章单元和修辞结构树特征分别进行编码的方法。实验结果表明,所提方法加强了编码器对篇章结构和修辞上的表征能力,使用该方法对模型进行改进后,其翻译结果在多个数据集上都获得了明显提升,性能超过了多个优质的基线模型,并且在提出的定量评估方法和人工分析中译文质量上也表现出了明显改善。 展开更多
关键词 神经机器翻译 篇章分析 篇章翻译 修辞结构理论
下载PDF
Advances in Structural Geology and Tectonics in the Late 20th Century: A Review 被引量:3
4
作者 DONG Shuwen ZHENG Yadong +1 位作者 CHEN Xuanhua SHI Jing 《Acta Geologica Sinica(English Edition)》 SCIE CAS CSCD 2006年第3期349-375,共27页
Based on analyses of the share of documents of structural geology and tectonics in the GeoRef system over 100 years in the last century, and the historical change of international (31 years) and domestic (16 years... Based on analyses of the share of documents of structural geology and tectonics in the GeoRef system over 100 years in the last century, and the historical change of international (31 years) and domestic (16 years) document counts of various topics in structural geology and tectonics, the position of structural geology and tectonics in the geosciences is evaluated and the major advaces in fields of plate tectonics, continental dynamics and global dynamics are reviewed. Our attention mainly focuses on the advances in studies of structural analysis, deformation mechanisms and rheology of rocks, contractional tectonics and late- and post-orogenic extensional collapse in orogens, large-scale strikeslip faults and indentation-extrusion tectonics, active tectonics and natural hazards. The relationships of structural geology and tectonics with petrology and geochronology are also discussed in terms of intersection of scientific disciplines. Finally, some suggestions are proposed for the further development of structural geology and tectonics in China. 展开更多
关键词 plate tectonics RHEOLOGY structural geology continental dynamics document statistics
下载PDF
Seismological study on the crustal structure of Tengchong volcanic-geothermal area 被引量:4
5
作者 王椿镛 楼海 +3 位作者 吴建平 白志明 皇甫岗 秦嘉政 《Acta Seismologica Sinica(English Edition)》 CSCD 2002年第3期247-259,共13页
Based upon the deep seismic sounding profile conducted in the Tengchong volcanic-geothermal area, a two-dimensional crustal P velocity structure is obtained by use of the finite-difference inversion and the forward tr... Based upon the deep seismic sounding profile conducted in the Tengchong volcanic-geothermal area, a two-dimensional crustal P velocity structure is obtained by use of the finite-difference inversion and the forward travel-time fitting method. The crustal model shows that there is a low velocity zone in upper crust in the Tengchong area, which may be related to the volcanic-geothermal activities, and two intracrustal faults (the LonglingRuili fault and Tengchong fault) exist on the profile, where the Tengchong fault may extend to the Moho discontinuity. Meanwhile, based on teleseismic data recorded by a temporary seismic network, we obtained the S-wave velocity structures beneath the RehaiRetian region in the Tengchong area, which show the low S-wave velocity anomaly in upper crust. The authors discuss the causes of Tengchong volcanic eruption based on the deep crustal structure. The crustal structure in the Tengchong volcanic-geothermal area is characterized by low P-wave and S-wave velocity, low resistivity, high heat-flow value and low Q value. The P-wave velocity in the upper mantle is also low. For this information, it can be induced that the magma in the crust is derived from the upper mantle, and the low velocity anomaly in upper crust in the Tengchong area may be related to the differentiation of magma. The Tengchong volcanoes are close to an active plate boundary and belong to plate boundary volcanoes. 展开更多
关键词 Tengchong volcanic area crustal structure deep seismic sounding travel-time fitting teleseismic waveform CLC number: P315.63 document code: A
下载PDF
A Stable and Consistent Document Model Suitable for Asynchronous Cooperative Edition
6
作者 Maurice Tchoupé Tchendji Rodrigue D. Djeumen Marcellin T. Atemkeng 《Journal of Computer and Communications》 2017年第8期69-82,共14页
Complex structured documents can be intentionally represented as a tree structure decorated with attributes. Ignoring attributes (these are related to semantic aspects that can be treated separately from purely struct... Complex structured documents can be intentionally represented as a tree structure decorated with attributes. Ignoring attributes (these are related to semantic aspects that can be treated separately from purely structural aspects which interest us here), in the context of a cooperative edition, legal structures are characterized by a document model (an abstract grammar) and each intentional representation can be manipulated independently and eventually asynchronously by several co-authors through various editing tools that operate on its “partial replicas”. For unsynchronized edition of a partial replica, considered co-author must have a syntactic document local model that constraints him to ensure minimum consistency of local representation that handles with respect to the global model. This consistency is synonymous with the existence of one or more (global) intentional representations towards the global model, assuming the current local representation as her/their partial replica. The purpose of this paper is to present the grammatical structures which are grammars that permit not only to specify a (global) model for documents published in a cooperative manner, but also to derive automatically via a so call projection operation, consistent (local) models for each co-authors involved in the cooperative edition. We also show some properties that meet these grammatical structures. 展开更多
关键词 structured documents documents Models GRAMMARS Cooperative EDITION structured EDITION Projections VIEWS Partial Replicas
下载PDF
Document Clustering Based on Constructing Density Tree
7
作者 戴维迪 王文俊 +2 位作者 侯越先 王英 张璐 《Transactions of Tianjin University》 EI CAS 2008年第1期21-26,共6页
This paper focuses on document clustering by clustering algorithm based on a DEnsityTree (CABDET) to improve the accuracy of clustering. The CABDET method constructs a density-based treestructure for every potential c... This paper focuses on document clustering by clustering algorithm based on a DEnsityTree (CABDET) to improve the accuracy of clustering. The CABDET method constructs a density-based treestructure for every potential cluster by dynamically adjusting the radius of neighborhood according to local density. It avoids density-based spatial clustering of applications with noise (DBSCAN) ′s global density parameters and reduces input parameters to one. The results of experiment on real document show that CABDET achieves better accuracy of clustering than DBSCAN method. The CABDET algorithm obtains the max F-measure value 0.347 with the root node's radius of neighborhood 0.80, which is higher than 0.332 of DBSCAN with the radius of neighborhood 0.65 and the minimum number of objects 6. 展开更多
关键词 document handling clustering tree structure vector space model
下载PDF
Preparation , Structure and DC Conductivity of Organic Semiconductor PA NI-C_4H_6O_6
8
作者 AdulkaderM.Elamin YAOKai-lun 《Semiconductor Photonics and Technology》 CAS 1999年第3期166-170,共5页
A new organic semiconductor tartaric acid doped salt of emeraldine polyaniline (PANI-C 4H 6O 6) has been obtained by the method of oxidative polymerization of monomeric aniline with ammonium persulfate in acidic solut... A new organic semiconductor tartaric acid doped salt of emeraldine polyaniline (PANI-C 4H 6O 6) has been obtained by the method of oxidative polymerization of monomeric aniline with ammonium persulfate in acidic solution. The structure was characterized by Fourier Transform Infrared technique (FTIR) and X-ray diffraction (XRD). The temperature dependence dc conductivity δ dc ( T ) shows a semiconductor behavior and follows the quasi one dimensional variable range hopping (Q1D-VRH) model. Data on δ dc ( T ) are also discussed. 展开更多
关键词 DC Conductivity Organic Semiconductor Polyaniline structure Tartaric Acid CLC number:O631.23 O632.7 TN304.52 document code:A
下载PDF
A Tree Pattern Matching Algorithm for XML Queries with Structural Preferences
9
作者 Maurice Tchoupé Tchendji Lionel Tadonfouet Thomas Tébougang Tchendji 《Journal of Computer and Communications》 2019年第1期61-83,共23页
In the XML community, exact queries allow users to specify exactly what they want to check and/or retrieve in an XML document. When they are applied to a semi-structured document or to a document with an overly comple... In the XML community, exact queries allow users to specify exactly what they want to check and/or retrieve in an XML document. When they are applied to a semi-structured document or to a document with an overly complex model, the lack or the ignorance of the explicit document model (DTD—Document Type Definition, Schema, etc.) increases the risk of obtaining an empty result set when the query is too specific, or, too large result set when it is too vague (e.g. it contains wildcards such as “*”). The reason is that in both cases, users write queries according to the document model they have in mind;this can be very far from the one that can actually be extracted from the document. Opposed to exact queries, preference queries are more flexible and can be relaxed to expand the search space during their evaluations. Indeed, during their evaluation, certain constraints (the preferences they contain) can be relaxed if necessary to avoid precisely empty results;moreover, the returned answers can be filtered to retain only the best ones. This paper presents an algorithm for evaluating such queries inspired by the TreeMatch algorithm proposed by Yao et al. for exact queries. In the proposed algorithm, the best answers are obtained by using an adaptation of the Skyline operator (defined in relational databases) in the context of documents (trees) to incrementally filter into the partial solutions set, those which satisfy the maximum of preferential constraints. The only restriction imposed on documents is No-Self-Containment. 展开更多
关键词 semi-structured documents Preference QUERIES TREE Pattern Matching TreeMatch Algorithm XML The SKYLINE Operator
下载PDF
公文结构的理论研究述评与前瞻
10
作者 杨霞 《秘书》 2024年第3期83-93,共11页
当前的公文结构研究在形式要素结构、写作思维结构、写作结构模式、整体篇章结构等方面已取得显著成果。然而,由于多数研究集中在形式的静态考察和表层的宏观描写,导致结论的适用性和解释力有限。因此,未来的研究应重点关注内容信息结构... 当前的公文结构研究在形式要素结构、写作思维结构、写作结构模式、整体篇章结构等方面已取得显著成果。然而,由于多数研究集中在形式的静态考察和表层的宏观描写,导致结论的适用性和解释力有限。因此,未来的研究应重点关注内容信息结构,在篇章语言学视角下结合中国文件制度语境,运用跨学科研究方法,深入探讨公文结构的语言表达、话语结构、信息组织模式以及篇章结构系统要素之间的关系等问题。这将有助于形成科学的理论知识体系,为社会组织进行公文写作和交流沟通提供有力的理论支撑。 展开更多
关键词 公文文本 公文结构 信息结构 语言结构体 篇章语言学
下载PDF
转录与传习:西周诰类文献生成机制研究
11
作者 林甸甸 《北京师范大学学报(社会科学版)》 CSSCI 北大核心 2024年第2期65-73,共9页
西周的“诰”是受诰方对“王告”这一话语行为的尊称,并在“王告”落实为书面文献时,作为文体名词使用。由于下位者参与了“诰”类文献的整理写作,受诰者在话语权力关系中的被动地位被表达出来,并呈现在仪式话语转录为经典文本的传习过... 西周的“诰”是受诰方对“王告”这一话语行为的尊称,并在“王告”落实为书面文献时,作为文体名词使用。由于下位者参与了“诰”类文献的整理写作,受诰者在话语权力关系中的被动地位被表达出来,并呈现在仪式话语转录为经典文本的传习过程中。传世诰类文献的核心文本为册命、赏赐仪式上所发布的原始诰辞;其附属的结构性成分为交代作诰历史背景的叙事导语,以及以“某人曰”为代表的结构性部件。“某人曰”在书面诰文中重复、平行地出现,有助于澄清和整肃话语主体,但也提示了诰文在传习过程中的可变异性。“王若曰”的插入位置,一定程度上反映了传习者对原始诰辞内容层次的理解,同时推动了诰辞转录为文本篇章的进程。 展开更多
关键词 诰类文献 文本结构 文献生成 话语权力 文本转录
下载PDF
基于命名实体识别的铁路应急预案智能管理方法 被引量:1
12
作者 王华 《铁道运输与经济》 北大核心 2024年第4期75-82,共8页
铁路应急预案是应对自然灾害、事故灾难、社会安全等突发事件,快速做出科学决策、组织救援的行动指南。由于应急预案多以非结构化文档存储,针对其结构化及检索过程中信息损失的问题,提出基于命名实体识别的铁路应急预案智能管理方法。首... 铁路应急预案是应对自然灾害、事故灾难、社会安全等突发事件,快速做出科学决策、组织救援的行动指南。由于应急预案多以非结构化文档存储,针对其结构化及检索过程中信息损失的问题,提出基于命名实体识别的铁路应急预案智能管理方法。首先,应用排版样式、编辑语义、文本语义等信息,实现流式文档结构的智能解析、附件识别及时序文档的信息综合;然后,以运维知识图谱中实体及其类别构建实体类别集,嵌入实体类别信息并与字符嵌入拼接生成增强特征,对文本进行实体的命名标识及段属性标识;最后,采用递归神经网络并引入注意力机制构建命名实体层次表达,融合结构和语义因素实现检索结果的智能排序。实验证明,该方法能准确解析文档结构并在低标注下识别命名实体,实现应急预案的智能检索与排序,可有效提高铁路应急预案管理的智能化水平。 展开更多
关键词 铁路 应急预案 命名实体识别 文档结构解析 知识图谱
下载PDF
高效MFe_(2)O_(4)(M=Zn、Mg、Cu和Mn)尖晶石催化剂应用于费托合成
13
作者 王超 陈建刚 +3 位作者 朱华青 张文绍 白洪彬 张娟 《燃料化学学报(中英文)》 EI CAS CSCD 北大核心 2024年第5期667-676,共10页
一系列尖晶石催化剂,包括ZnFe_(2)O_(4)、MgFe_(2)O_(4)、CuFe_(2)O_(4)和MnFe_(2)O_(4)被用于费托合成反应(Fischer-Tropsch synthesis,FTS)。Zn、Mg、Cu和Mn很容易与Fe形成尖晶石。其中,在前处理和反应过程中,Zn和Mg能够显著维持尖晶... 一系列尖晶石催化剂,包括ZnFe_(2)O_(4)、MgFe_(2)O_(4)、CuFe_(2)O_(4)和MnFe_(2)O_(4)被用于费托合成反应(Fischer-Tropsch synthesis,FTS)。Zn、Mg、Cu和Mn很容易与Fe形成尖晶石。其中,在前处理和反应过程中,Zn和Mg能够显著维持尖晶石结构,使得CO转化率较低。在反应过程中,Cu和Mn有利于碳化铁的生成,导致CuFe_(2)O_(4)和MnFe_(2)O_(4)对FTS性能影响显著。C_(2)^(=)-C_(4)^(=)ZnFe_(2)O_(4)对烃分布和C_(2)−C_(4)烯/烷比影响很小。MgFe_(2)O_(4)的C_(5+)选择性较低,同时由于Mg的碱性作用,从而提高了选择性和C_(2)−C_(4)烯/烷比。Cu可以促进催化剂的碳化,从而使CuFe_(2)O_(4)具有较高的活性。同时,CuFe_(2)O_(4)可以显著提高C_(5+)选C_(2)^(=)-C_(4)^(=)择性。此外,Cu可以促进H_(2)的解离和活化,从而有利于烯烃的二次加氢,降低选择性和C_(2)−C_(4)烯/烷比。虽然Mn在反应过程中会促进催化剂的碳化,但MnFe_(2)O_(4)对碳链的长短影响很小。然而,Mn能促进少量ε-Fe_(2)C的生成,这是导C_(2)^(=)-C_(4)^(=)致MnFe_(2)O_(4)具有较高选择性和C_(2)−C_(4)烯/烷比的原因。同时,所有尖晶石催化剂都具有较低的二氧化碳选择性,符合当前的绿色环保发展要求。 展开更多
关键词 费托合成 尖晶石 物相结构 C_(2)-C_(4)烯/烷比
下载PDF
篇章级神经机器翻译语篇结构研究
14
作者 姜云卓 贡正仙 李军辉 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第6期993-1004,共12页
[目的]当前篇章级机器翻译系统通过使用上下文信息来生成更好的翻译,但大部分工作都是从模型的角度出发,利用上下文字词信息来构建有效的网络结构,从而忽略了源端文本内部的结构,这导致了对上下文的利用不足.[方法]在修辞结构理论的指导... [目的]当前篇章级机器翻译系统通过使用上下文信息来生成更好的翻译,但大部分工作都是从模型的角度出发,利用上下文字词信息来构建有效的网络结构,从而忽略了源端文本内部的结构,这导致了对上下文的利用不足.[方法]在修辞结构理论的指导下,设计丰富的基本语篇单元(EDU)表示,从而刻画其文本覆盖范围、携带信息量和简单的主从修辞关系,并提出相应的算法将修辞结构树中复杂修辞关系映射到EDU中.[结果]本文方法可以在不增加序列长度的基础上最大程度地保留EDU的修辞关系信息,在两个语言对的4个数据集上的实验结果表明,改进的模型在多个优质的基线系统上实现了大于1 BLEU分数的显著性能提升,并且在本文根据EDU分布特征提出的定量评估中也表现出较为明显的改进结果.[结论]本文提出的方法可以方便应用于多个篇章级神经机器翻译模型中,具有高效灵活的特点和广泛的适用性. 展开更多
关键词 神经机器翻译 语篇分析 篇章翻译 修辞结构理论
下载PDF
基于自适应结构学习的深度文本聚类
15
作者 潘伟 黄瑞章 +1 位作者 任丽娜 薛菁菁 《计算机工程》 CAS CSCD 北大核心 2024年第11期89-97,共9页
近年来,将结构信息应用于深度文本聚类中以提升聚类效果取得了较优的成果。然而,结构信息的构造方法大多只进行简单的距离测算且近邻数量固定,导致构建的图难以获得较精确的文本结构信息。另外,众多方法对近邻文本只进行一阶挖掘,使图... 近年来,将结构信息应用于深度文本聚类中以提升聚类效果取得了较优的成果。然而,结构信息的构造方法大多只进行简单的距离测算且近邻数量固定,导致构建的图难以获得较精确的文本结构信息。另外,众多方法对近邻文本只进行一阶挖掘,使图结构信息未得到完全挖掘,限制了结合结构信息的深度文本聚类性能。为此,提出一种基于自适应结构学习的深度文本聚类模型DCMBS。首先,设计一种阈值构图方法,动态调整近邻文本数量,解决因近邻文本固定存在结构信息不精确的问题;其次,引入一种拓扑探索近邻的方法,对近邻文本进行多阶挖掘,解决以往方法只进行一阶挖掘存在结构信息不完整的问题。此外,设计了1个阈值衰减策略,避免拓扑过程中因拓扑阶数增加导致学习泛化。在4个真实数据集的实验结果表明,DCMBS与现有较好的聚类模型相比,准确度、归一化互信息(NMI)和调整兰德指数(ARI)平均提高了6.83、2.93、6.23个百分点。 展开更多
关键词 阈值 深度文本聚类 文本结构信息 图神经网络 自适应结构学习
下载PDF
基于伪触发词的并行预测篇章级事件抽取方法
16
作者 秦海涛 线岩团 +1 位作者 相艳 黄于欣 《电子技术应用》 2024年第4期67-74,共8页
篇章级事件抽取一般将事件抽取任务分为候选实体识别、事件检测和论元识别3个子任务,然后采用级联的方式依次进行,这样的方式会造成误差传递;另外,现有的大多数模型在解码事件时,对事件数量的预测隐含在解码过程中,且只能按照预定义的... 篇章级事件抽取一般将事件抽取任务分为候选实体识别、事件检测和论元识别3个子任务,然后采用级联的方式依次进行,这样的方式会造成误差传递;另外,现有的大多数模型在解码事件时,对事件数量的预测隐含在解码过程中,且只能按照预定义的事件顺序及预定义的角色顺序预测事件论元,使得先抽取的事件并没有考虑到后面抽取的事件。针对以上问题提出一种多任务联合的并行预测事件抽取框架。首先,使用预训练语言模型作为文档句子的编码器,检测文档中存在的事件类型,并使用结构化自注意力机制获取伪触发词特征,预测每种事件类型的事件数量;然后将伪触发词特征与候选论元特征进行交互,并行预测每个事件对应的事件论元,在大幅缩减模型训练时间的同时获得与基线模型相比更好的性能。最终事件抽取结果F1值为78%,事件类型检测子任务F1值为98.7%,事件数量预测子任务F1值为90.1%,实体识别子任务F1值为90.3%。 展开更多
关键词 篇章级事件抽取 多任务联合 预训练语言模型 结构化自注意力机制 并行预测
下载PDF
基于异构图分层学习的细粒度多文档摘要抽取
17
作者 翁裕源 许柏炎 蔡瑞初 《计算机工程》 CAS CSCD 北大核心 2024年第3期336-344,共9页
抽取的目标是在多个文档中提取共有关键信息,其对简洁性的要求高于单文档摘要抽取。现有的多文档摘要抽取方法通常在句子级别进行建模,容易引入较多的冗余信息。为了解决上述问题,提出一种基于异构图分层学习的多文档摘要抽取框架,通过... 抽取的目标是在多个文档中提取共有关键信息,其对简洁性的要求高于单文档摘要抽取。现有的多文档摘要抽取方法通常在句子级别进行建模,容易引入较多的冗余信息。为了解决上述问题,提出一种基于异构图分层学习的多文档摘要抽取框架,通过层次化构建单词层级图和子句层级图来有效建模语义关系和结构关系。针对单词层级图和子句层级图这2个异构图的学习问题,设计具有不同层次更新机制的两层学习层来降低学习多种结构关系的难度。在单词层级图学习层,提出交替更新机制更新不同的粒度节点,以单词节点为载体通过图注意网络进行语义信息传递;在子句层级图学习层,提出两阶段分步学习更新机制聚合多种结构关系,第一阶段聚合同构关系,第二阶段基于注意力聚合异构关系。实验结果表明,与抽取式基准模型相比,该框架在Multinews数据集上取得了显著的性能提升,ROUGE-1、ROUGE-2和ROUGE-L分别提高0.88、0.23和2.27,消融实验结果也验证了两层学习层及其层次更新机制的有效性。 展开更多
关键词 抽取式多文档摘要 细粒度建模 异构图 分层学习 语义关系 结构关系
下载PDF
基于轻量化卷积神经网络的文档版面分析算法
18
作者 蔡云冰 杨词慧 +1 位作者 崔国昊 陈思宇 《南昌航空大学学报(自然科学版)》 CAS 2024年第3期45-52,共8页
现有的文档版面分析方法复杂,模型参数较多,且资源消耗较高,在低功耗移动终端上很难部署。因此,提出一种基于轻量化卷积神经网络的文档版面分析算法。首先,设计一种轻量化文档特征提取结构,通过结构重参数化实现隐式特征重用,提高文档... 现有的文档版面分析方法复杂,模型参数较多,且资源消耗较高,在低功耗移动终端上很难部署。因此,提出一种基于轻量化卷积神经网络的文档版面分析算法。首先,设计一种轻量化文档特征提取结构,通过结构重参数化实现隐式特征重用,提高文档特征提取的效率和速度。其次,引入SPD-Conv模块,通过空间转深度操作对特征图进行尺寸调整和通道数扩展,更好地保留细粒度信息,同时解决图像模糊和小型版面基元检测困难。最后,提出一种简洁的特征融合方法,并通过模型压缩实现性能和推理效率的平衡。实验结果显示,该方法在PubLayNet数据集上仅使用了160万个模型参数,可达到93.8%的mAP@0.5:0.95得分。这说明该算法能够在减少参数数量的情况下实现出色的检测精度,能够满足移动终端环境下高性能文档布局分析的要求。 展开更多
关键词 文档版面分析 卷积神经网络 轻量化 结构重参数化
下载PDF
基于自适应注意力机制的表格结构识别模型
19
作者 郑剑锋 张广涛 刘英莉 《化工自动化及仪表》 CAS 2024年第3期449-455,共7页
针对图像中表格结构识别问题,提出了基于自适应注意力机制的编码-解码架构,预测图像中表格的HTML标签。采用轻量化LCNet和CSP-PAN作为特征编码网络,获得全局图像特征;为解码器设计自适应注意力机制,在解码器的每个时间步骤添加语义特征... 针对图像中表格结构识别问题,提出了基于自适应注意力机制的编码-解码架构,预测图像中表格的HTML标签。采用轻量化LCNet和CSP-PAN作为特征编码网络,获得全局图像特征;为解码器设计自适应注意力机制,在解码器的每个时间步骤添加语义特征,使模型自主选择关注图像信息或语义特征。另外,为提升研究效率,对训练图片数量与模型准确率之间的关系进行研究,结果表明合适的图像数量在70k~100k之间,实验从公开数据集PubTabNet中随机选择100k图片进行训练,模型的TEDS-Struct分数达到了95.1%。 展开更多
关键词 表格结构识别 注意力机制 文档智能 深度学习 模式识别 图像描述
下载PDF
张景碑文校释与文书构成
20
作者 陈金泉 《出土文献》 CSSCI 2024年第3期130-136,173,共8页
张景碑原碑文按形制推断,应共计14行,满行23字。其中一些文字可根据同类型简牍文书进行校补,第5行“会廿■”最后一字应释为“九”,第6行“起”下可补释一“府”字。与近年来刊布的东汉简牍文书进行比较,碑文应当由三部分构成,即府记、... 张景碑原碑文按形制推断,应共计14行,满行23字。其中一些文字可根据同类型简牍文书进行校补,第5行“会廿■”最后一字应释为“九”,第6行“起”下可补释一“府”字。与近年来刊布的东汉简牍文书进行比较,碑文应当由三部分构成,即府记、县的下行转发文与另一府记。前两部分共同构成一件文书,书写于合檄之上,第三部分应是省略了上行文书之后,郡再次下发的府记。 展开更多
关键词 张景碑 碑文校释 文书结构
下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部