期刊文献+
共找到693篇文章
< 1 2 35 >
每页显示 20 50 100
Research and Analysis of Grammatical Error Correction Technology for Chinese Documents
1
作者 Wei Jin Feng Jiang +2 位作者 Xiulai Wang Ningling Ma Yutao Zhang 《Journal of Computer and Communications》 2024年第8期202-223,共22页
With the widespread use of Chinese globally, the number of Chinese learners has been increasing, leading to various grammatical errors among beginners. Additionally, as domestic efforts to develop industrial informati... With the widespread use of Chinese globally, the number of Chinese learners has been increasing, leading to various grammatical errors among beginners. Additionally, as domestic efforts to develop industrial information grow, electronic documents have also proliferated. When dealing with numerous electronic documents and texts written by Chinese beginners, manually written texts often contain hidden grammatical errors, posing a significant challenge to traditional manual proofreading. Correcting these grammatical errors is crucial to ensure fluency and readability. However, certain special types of text grammar or logical errors can have a huge impact, and manually proofreading a large number of texts individually is clearly impractical. Consequently, research on text error correction techniques has garnered significant attention in recent years. The advent and advancement of deep learning have paved the way for sequence-to-sequence learning methods to be extensively applied to the task of text error correction. This paper presents a comprehensive analysis of Chinese text grammar error correction technology, elaborates on its current research status, discusses existing problems, proposes preliminary solutions, and conducts experiments using judicial documents as an example. The aim is to provide a feasible research approach for Chinese text error correction technology. 展开更多
关键词 Chinese Text Error Judicial documents Neural network Deep Learning TRANSFORMER
下载PDF
Study on Documents ofCampus Network
2
作者 万伟太 杨林 宋为 《International Journal of Mining Science and Technology》 SCIE EI 1997年第2期66-69,共4页
Campus network establishment belongs to the field of system engineering. It is necessary to carry on cooperation among departments. Standardization is the key to solve the problem, and its core is standardization of d... Campus network establishment belongs to the field of system engineering. It is necessary to carry on cooperation among departments. Standardization is the key to solve the problem, and its core is standardization of documents. Therefore, this paper will be concentrated on the discussion of relevant problems in combination with our campus network practice. 展开更多
关键词 CAMPUS network ENGINEERING document
下载PDF
基于词-主题-文本异质网络的短文本分类方法
3
作者 徐涛 赵星甲 卢敏 《计算机应用与软件》 北大核心 2024年第1期146-152,182,共8页
针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学... 针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学;构建以词、主题和文本为节点的异质网络,并采用图卷积学习节点之间的高阶邻域信息,丰富短文本语义。相较于基准分类模型,该方法在五个公开短文本数据集上的分类准确率平均提高1.56%。 展开更多
关键词 词-主题-文本异质网络 词共现 文本-主题分布 短文本分类
下载PDF
基于多粒度阅读器和图注意力网络的文档级事件抽取
4
作者 薛颂东 李永豪 赵红燕 《计算机应用研究》 CSCD 北大核心 2024年第8期2329-2335,共7页
文档级事件抽取面临论元分散和多事件两大挑战,已有工作大多采用逐句抽取候选论元的方式,难以建模跨句的上下文信息。为此,提出了一种基于多粒度阅读器和图注意网络的文档级事件抽取模型,采用多粒度阅读器实现多层次语义编码,通过图注... 文档级事件抽取面临论元分散和多事件两大挑战,已有工作大多采用逐句抽取候选论元的方式,难以建模跨句的上下文信息。为此,提出了一种基于多粒度阅读器和图注意网络的文档级事件抽取模型,采用多粒度阅读器实现多层次语义编码,通过图注意力网络捕获实体对之间的局部和全局关系,构建基于实体对相似度的剪枝完全图作为伪触发器,全面捕捉文档中的事件和论元。在公共数据集ChFinAnn和DuEE-Fin上进行了实验,结果表明提出的方法改善了论元分散问题,提升了模型事件抽取性能。 展开更多
关键词 多粒度阅读器 图注意力网络 文档级事件抽取
下载PDF
网络共享文档的雨洪灾害“求救”事件时空分析
5
作者 梁明 晏实江 +1 位作者 杨根 黄晴晴 《地理空间信息》 2024年第6期66-70,共5页
城市雨洪灾害频发、急需快速掌握灾害过程中“求救”事件类型、位置,并开展制图。提出了基于“网络共享文档”的文本挖掘方法。为分析不同“求救”事件在时空上分布特征,提出了核密度估计、最近邻分析等方法。以河南雨洪灾害过程中传播... 城市雨洪灾害频发、急需快速掌握灾害过程中“求救”事件类型、位置,并开展制图。提出了基于“网络共享文档”的文本挖掘方法。为分析不同“求救”事件在时空上分布特征,提出了核密度估计、最近邻分析等方法。以河南雨洪灾害过程中传播较为广泛的网络共享文档为例,验证了方案的可行性。结果表明:城市雨洪灾害过程中不同类型的“求救”事件在的扩散规律有较大差异;大多数求救事件在时间和空间尺度上都呈现为聚集的模式;基于网络共享文档的灾害分析和应急制图,能够在时效性、时间粒度等方面弥补传统雨洪灾害监测手段的不足。 展开更多
关键词 网络共享文档 城市雨洪灾害 时空分析 核密度估计
下载PDF
特征与前瞻:中国契约文书研究演化与发展的计量分析
6
作者 贺琳 黑维强 《地方文化研究》 2024年第2期102-112,共11页
契约文书是中国历史变迁的载体,是民间历史档案的重要组成部分,从形态多样的契约文书中可以审视中国民间社会的务实、契约和法治精神。21世纪以来,我国契约文书的研究成果丰富,文章以中国知网(CNKI)核心期刊中的契约文书研究成果为样本... 契约文书是中国历史变迁的载体,是民间历史档案的重要组成部分,从形态多样的契约文书中可以审视中国民间社会的务实、契约和法治精神。21世纪以来,我国契约文书的研究成果丰富,文章以中国知网(CNKI)核心期刊中的契约文书研究成果为样本,通过关键词共现、聚类分析、多维尺度分析、社会网络分析等统计计量研究方法,系统分析了中国契约文书研究的六大领域发展特征及前沿演进趋势,并认为契约文书研究领域亟待实现学科的话语体系建设,用时代语境对契约精神的内涵进行解读。 展开更多
关键词 契约文书 矩阵特征 多维尺度 社会网络 文献计量
下载PDF
融合目标端上下文的篇章神经机器翻译
7
作者 贾爱鑫 李军辉 +1 位作者 贡正仙 张民 《中文信息学报》 CSCD 北大核心 2024年第4期59-68,共10页
神经机器翻译在句子级翻译任务上取得了令人瞩目的效果,但是句子级翻译的译文会存在一致性、指代等篇章问题,篇章翻译通过利用上下文信息来解决上述问题。不同于以往使用源端上下文建模的方法,该文提出了融合目标端上下文信息的篇章神... 神经机器翻译在句子级翻译任务上取得了令人瞩目的效果,但是句子级翻译的译文会存在一致性、指代等篇章问题,篇章翻译通过利用上下文信息来解决上述问题。不同于以往使用源端上下文建模的方法,该文提出了融合目标端上下文信息的篇章神经机器翻译。具体地,该文借助推敲网络的思想,对篇章源端进行二次翻译,第一次基于句子级翻译,第二次翻译参考了全篇的第一次翻译结果。基于LDC中英篇章数据集和WMT英德篇章数据集的实验结果表明,在引入较少的参数的条件下,该文方法能显著提高翻译性能。同时,随着第一次翻译(即句子级译文)质量的提升,所提方法也更有效。 展开更多
关键词 神经机器翻译 推敲网络 篇章翻译
下载PDF
基于大规模预训练模型的地质矿物属性识别方法及应用
8
作者 王彬彬 周可法 +3 位作者 王金林 汪玮 李超 程寅益 《新疆地质》 CAS CSCD 2024年第1期139-144,共6页
地球科学的研究成果通常记录在技术报告、期刊论文、书籍等文献中,但许多详细的地球科学报告未被使用,这为信息提取提供了机遇。为此,我们提出了一种名为GMNER(Geological Minerals named entity recognize,MNER)的深度神经网络模型,用... 地球科学的研究成果通常记录在技术报告、期刊论文、书籍等文献中,但许多详细的地球科学报告未被使用,这为信息提取提供了机遇。为此,我们提出了一种名为GMNER(Geological Minerals named entity recognize,MNER)的深度神经网络模型,用于识别和提取矿物类型、地质构造、岩石与地质时间等关键信息。与传统方法不同,本次采用了大规模预训练模型BERT(Bidirectional Encoder Representations from Transformers,BERT)和深度神经网络来捕捉上下文信息,并结合条件随机场(Conditional random field,CRF)以获得准确结果。实验结果表明,MNER模型在中文地质文献中表现出色,平均精确度为0.8984,平均召回率0.9227,平均F1分数0.9104。研究不仅为自动矿物信息提取提供了新途径,也有望促进矿产资源管理和可持续利用。 展开更多
关键词 矿物信息提取 深度神经网络 矿物文献 命名实体识别
下载PDF
公文知识图谱构建与应用
9
作者 李炜卓 周文博 +5 位作者 卢冰洁 高辉 边宇阳 张浩魏 那崇宁 许文杰 《小型微型计算机系统》 CSCD 北大核心 2024年第6期1281-1291,共11页
海量电子公文的高效管理一直是社会服务研究的热门话题.现有的研究工作主要聚焦在公文归档与要素抽取上,但并未提供开源的公文数据集,同时对于公文之间的关联性与时效性缺乏深入分析.文中的工作致力于从多个领域收集公文,构建一个高质... 海量电子公文的高效管理一直是社会服务研究的热门话题.现有的研究工作主要聚焦在公文归档与要素抽取上,但并未提供开源的公文数据集,同时对于公文之间的关联性与时效性缺乏深入分析.文中的工作致力于从多个领域收集公文,构建一个高质量、开源的公文知识图谱,以此来填补上述研究工作存在的鸿沟.文中详细地展示了公文知识图谱的构建框架,包括轻量级本体的设计、面向小样本场景的要素抽取算法以及面向实体对齐的知识融合算法,以此让不同来源的公文能够共享更多的链接.此外,文中进一步讨论了公文知识图谱的潜在应用,并面向公文关联发现场景提出了一种基于要素抽取增强的网络表示学习公文推荐算法.实验表明,所提方法在评估指标Rankmin与MAP上整体效果均好于已有方法. 展开更多
关键词 知识图谱 要素抽取 公文归档 公文推荐 网络表示学习
下载PDF
储热技术研究展望
10
作者 高海涛 明智源 赵丹 《能源与环保》 2024年第8期134-139,共6页
近年来,储热技术被广泛认为是实现碳中和、碳达峰的一项关键技术备受关注。通过从CNKI、Web of Science等数据库中筛选储热技术相关文献,运用CiteSpace软件进行知识映射,展开系统分析、统计及可视化,绘制出储热技术研究力量合作网络图谱... 近年来,储热技术被广泛认为是实现碳中和、碳达峰的一项关键技术备受关注。通过从CNKI、Web of Science等数据库中筛选储热技术相关文献,运用CiteSpace软件进行知识映射,展开系统分析、统计及可视化,绘制出储热技术研究力量合作网络图谱,展示该技术研究力量的分布与科研合作情况。同时针对关键词进行分析,总结储热技术的研究热点、研究前沿及发展趋势,指出相变储热和混合储热模式是未来研究的重点。针对储热材料稳定性差、使用寿命短,有机相变材料成本高、安全性低,系统设备初始造价高、成本回收期长等储热技术现存问题,从政策干预和市场需求角度提出了改进建议。 展开更多
关键词 储热技术 文件计量 相变储热 关键词共现 合作网络
下载PDF
基于异构图和关键词的抽取式文本摘要模型 被引量:1
11
作者 朱颀林 王羽 徐建 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期259-270,共12页
抽取式文本摘要使用一定的策略从冗长的文本中选择一些句子组成摘要,其关键在于要尽可能多地利用文本的语义信息和结构信息。为了更好地挖掘这些信息,进而利用它们指导摘要的抽取,提出了一种基于异构图和关键词的抽取式文本摘要模型(HGK... 抽取式文本摘要使用一定的策略从冗长的文本中选择一些句子组成摘要,其关键在于要尽可能多地利用文本的语义信息和结构信息。为了更好地挖掘这些信息,进而利用它们指导摘要的抽取,提出了一种基于异构图和关键词的抽取式文本摘要模型(HGKSum)。该模型首先将文本建模为由句子节点和词语节点构成的异构图,在异构图上使用图注意力网络学习节点的特征,之后将关键词抽取任务作为文本摘要任务的辅助任务,使用多任务学习的方式进行训练,得到候选摘要,最后对候选摘要进行精炼以降低冗余度,得到最终摘要。在基准数据集上的对比实验表明,该模型性能优于基准模型,此外,消融实验也证明了引入异构节点和关键词的必要性。 展开更多
关键词 抽取式文本摘要 异构图 关键词 图注意力网络 多任务学习
下载PDF
城镇燃气管网应急处置知识图谱构建与应用 被引量:1
12
作者 姚卫华 葛悦 +2 位作者 邓兵兵 叶雯静 徐亚博 《科学技术与工程》 北大核心 2024年第10期4343-4351,共9页
标准是一种重要的信息传导工具和知识载体,其为社会经济的持续发展提供了必要的技术支持。当前城市燃气管网领域已具有相对充分的标准资源,但非系统化的燃气标准规范难以满足事故应急响应快速性和精准性查询和匹配要求。聚焦城镇燃气管... 标准是一种重要的信息传导工具和知识载体,其为社会经济的持续发展提供了必要的技术支持。当前城市燃气管网领域已具有相对充分的标准资源,但非系统化的燃气标准规范难以满足事故应急响应快速性和精准性查询和匹配要求。聚焦城镇燃气管网应急标准文献,借助知识图谱构建技术,针对城镇燃气领域的标准文献进行逻辑辨析和整理,构建城镇燃气管网应急处置和救援的知识图谱,通过实例挖掘展现出知识图谱在燃气管网事故应急处置中的决策支持价值以及相关标准化系统自我完善中的纠错工具价值。 展开更多
关键词 燃气管网 标准文献 知识图谱 应急救援 突发事件
下载PDF
基于篇章图模型的中文事件时序关系识别
13
作者 李婧 徐昇 李培峰 《中文信息学报》 CSCD 北大核心 2024年第1期107-114,共8页
事件时序关系识别是信息抽取中一项十分重要且极具挑战性的任务。此前大部分工作都集中在句子级别上,忽略了篇章级别(同句、邻句和跨句)的事件时序关系识别。针对此问题,该文提出了一种基于篇章图模型的篇章级事件时序关系识别方法,该... 事件时序关系识别是信息抽取中一项十分重要且极具挑战性的任务。此前大部分工作都集中在句子级别上,忽略了篇章级别(同句、邻句和跨句)的事件时序关系识别。针对此问题,该文提出了一种基于篇章图模型的篇章级事件时序关系识别方法,该方法通过分别构造句法层次和篇章级别的图卷积神经网络将篇章中融合了句法特征的所有事件进行信息交互,以达到丰富特征的目的,进而使得模型可更好地识别篇章级时序关系。该文提出的方法在ACE2005-extended中文事件时序关系语料库上的微平均F1值达到71.81%,比最好的基准系统提升了1.76个百分点。 展开更多
关键词 事件时序关系 篇章级别 图卷积神经网络
下载PDF
基于BERT和图注意力网络的篇章级事件论元识别
14
作者 王凯 廖涛 《现代计算机》 2024年第6期14-19,64,共7页
事件论元识别是事件抽取的子任务之一,其目的在于识别文本中与事件相关的论元及论元对应的论元角色。研究表明,句子的依存句法关系有助于事件论元任务识别,然而,在构造篇章的依存句法关系时容易引入不相关的论元产生噪声问题,现有方法... 事件论元识别是事件抽取的子任务之一,其目的在于识别文本中与事件相关的论元及论元对应的论元角色。研究表明,句子的依存句法关系有助于事件论元任务识别,然而,在构造篇章的依存句法关系时容易引入不相关的论元产生噪声问题,现有方法对噪声问题处理不佳。针对该问题,提出了一个基于BERT和图注意力网络的篇章级事件论元识别模型。该模型从两个角度去解决噪声问题,一方面,通过获取充分的篇章语义特征作为辅助,去构建更有效的篇章依存句法特征;另一方面,采用图注意力网络对不同的论元节点分配不同的权重,从而去除掉无效的论元。在RAMS语料库上的实验结果表明,该方法有效解决了篇章依存句法关系中存在的噪声问题,取得了较好的篇章级事件论元识别结果。 展开更多
关键词 篇章级事件论元识别 依存句法关系 BERT 图注意力网络
下载PDF
一种面向法律文书的命名实体识别模型
15
作者 卢睿 李林瑛 《信息网络安全》 CSCD 北大核心 2024年第11期1783-1792,共10页
准确识别法律文书中的实体是构建智慧司法的基础,但通用的命名实体识别模型不能很好地识别法律文书中实体边界,识别结果不能与法律业务紧密结合。为有效提高法律文书中各实体的识别效果,文章提出一种面向法律文书的命名实体识别模型BBAG... 准确识别法律文书中的实体是构建智慧司法的基础,但通用的命名实体识别模型不能很好地识别法律文书中实体边界,识别结果不能与法律业务紧密结合。为有效提高法律文书中各实体的识别效果,文章提出一种面向法律文书的命名实体识别模型BBAG-NER。该模型首先利用BERT对字符序列进行编码,然后运用双向长短记忆神经网络和Attention分配不同权重以提高对实体边界的划分能力,最后采用全局指针识别备选司法实体片段,并通过实体分类器得到最终的实体类别。实验结果表明,在法律文书语料数据集上,BBAG-NER模型的F1值达到了89.18%,较BERT-CRF模型提高了2.1%,验证了模型整体的有效性。 展开更多
关键词 法律文书 命名实体识别 全局指针网络 双向长短时记忆
下载PDF
浅议科研院所档案“三个体系”对招标档案管理的启示
16
作者 刘薇 李倩雯 《办公自动化》 2024年第22期13-15,共3页
在2011年的全国档案学会工作年会上,《全国档案事业发展“十二五”规划纲要》明确“三个体系”建设,使越来越多单位更加注重各类档案的管理和发展。在招标档案管理工作中加强“三个体系”建设已成为重点管理项目之一,因此,文章针对在“... 在2011年的全国档案学会工作年会上,《全国档案事业发展“十二五”规划纲要》明确“三个体系”建设,使越来越多单位更加注重各类档案的管理和发展。在招标档案管理工作中加强“三个体系”建设已成为重点管理项目之一,因此,文章针对在“三个体系”建设的大前提下,如何对招标文件档案进行信息化、规范化管理,通过多方面着手,浅议档案“三个体系”建设带给招标文件档案管理的启示。 展开更多
关键词 招标档案 招标文件 档案管理 网络技术
下载PDF
基于轻量化卷积神经网络的文档版面分析算法
17
作者 蔡云冰 杨词慧 +1 位作者 崔国昊 陈思宇 《南昌航空大学学报(自然科学版)》 CAS 2024年第3期45-52,共8页
现有的文档版面分析方法复杂,模型参数较多,且资源消耗较高,在低功耗移动终端上很难部署。因此,提出一种基于轻量化卷积神经网络的文档版面分析算法。首先,设计一种轻量化文档特征提取结构,通过结构重参数化实现隐式特征重用,提高文档... 现有的文档版面分析方法复杂,模型参数较多,且资源消耗较高,在低功耗移动终端上很难部署。因此,提出一种基于轻量化卷积神经网络的文档版面分析算法。首先,设计一种轻量化文档特征提取结构,通过结构重参数化实现隐式特征重用,提高文档特征提取的效率和速度。其次,引入SPD-Conv模块,通过空间转深度操作对特征图进行尺寸调整和通道数扩展,更好地保留细粒度信息,同时解决图像模糊和小型版面基元检测困难。最后,提出一种简洁的特征融合方法,并通过模型压缩实现性能和推理效率的平衡。实验结果显示,该方法在PubLayNet数据集上仅使用了160万个模型参数,可达到93.8%的mAP@0.5:0.95得分。这说明该算法能够在减少参数数量的情况下实现出色的检测精度,能够满足移动终端环境下高性能文档布局分析的要求。 展开更多
关键词 文档版面分析 卷积神经网络 轻量化 结构重参数化
下载PDF
基于互信息最大化的文档相关性模型
18
作者 陆敏锋 张启飞 +1 位作者 卢成浪 吴菁 《计算机工程与设计》 北大核心 2024年第9期2712-2718,共7页
针对传统的文档相关性识别方法在训练过程中文档信息提取不充分的问题,提出一种互信息最大化框架下的深度学习方法。涉及一个无监督学习过程,使用全局和局部互信息学习文档表示,最大化神经网络的输入表示和输出表示之间的互信息,提取更... 针对传统的文档相关性识别方法在训练过程中文档信息提取不充分的问题,提出一种互信息最大化框架下的深度学习方法。涉及一个无监督学习过程,使用全局和局部互信息学习文档表示,最大化神经网络的输入表示和输出表示之间的互信息,提取更为丰富的文档内容和结构信息,优化模型预测结果。经过在多项任务上的评估,实验结果表明了该方法的可行性和有效性,与一些传统的方法相比,其在准确度上有相当或更好的表现。 展开更多
关键词 互信息 文档表示 文档相关性 最大化 无监督学习 残差网络 全局特征
下载PDF
针对长距离实体的双图路径推理模型
19
作者 祝涛杰 卢记仓 +2 位作者 周刚 皮乾坤 丁肖摇 《信息工程大学学报》 2024年第3期272-277,共6页
文档中句间实体关系往往无法直接获取,现有方法通常利用语法知识及共指、邻接、共现等方式将文档构建为文档图,捕获实体之间的交互。然而图节点和图边数量及类型较多,极大地限制了模型的推理能力。因此,提出一种结构简单且推理效果更好... 文档中句间实体关系往往无法直接获取,现有方法通常利用语法知识及共指、邻接、共现等方式将文档构建为文档图,捕获实体之间的交互。然而图节点和图边数量及类型较多,极大地限制了模型的推理能力。因此,提出一种结构简单且推理效果更好的双图模型。首先,采用启发式规则提取提及交互和证据句,并基于此构建基于证据句的提及图和实体图;其次,利用注意力机制捕获实体图中实体节点之间的推理路径;最后,根据推理路径,采用合适的评分函数预测实体关系事实。在文档级通用领域数据集DocRED中的实验表明,所提模型取得了较好的效果。 展开更多
关键词 文档级关系抽取 图神经网络 注意力机制
下载PDF
基于异质图神经网络预训练的多标签文档分类研究
20
作者 吴家伟 方全 +1 位作者 胡骏 钱胜胜 《计算机科学》 CSCD 北大核心 2024年第1期143-149,共7页
多标签文档分类是一种将文档实例与相关标签相关联的技术,近年来受到越来越多研究者的关注。现有的多标签文档分类方法尝试探索文本之外的信息的融合,如文档元数据或标签结构。然而,这些方法要么简单地利用元数据的语义信息,要么没有考... 多标签文档分类是一种将文档实例与相关标签相关联的技术,近年来受到越来越多研究者的关注。现有的多标签文档分类方法尝试探索文本之外的信息的融合,如文档元数据或标签结构。然而,这些方法要么简单地利用元数据的语义信息,要么没有考虑标签的长尾分布,因此忽略了文档及其元数据之间的高阶关系和标签的分布规律等信息,从而影响到多标签文档分类的准确性。因此,文中提出一种新的基于异质图神经网络预训练的多标签文档分类方法。该方法通过构造文档与其元数据的异质图,采用两种对比学习预训练方法捕获文档与其元数据之间的关系,并通过平衡标签长尾分布的损失函数来提高多标签文档分类的准确性。在基准数据集上的实验结果表明,所提方法的准确率比Transformer提高了8%,比BertXML提高了4.75%,比MATCH提高了1.3%。 展开更多
关键词 多标签文档分类 元数据 异质图神经网络 预训练 长尾分布
下载PDF
上一页 1 2 35 下一页 到第
使用帮助 返回顶部