期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
融合标签知识的中文医学命名实体识别
1
作者 尹宝生 周澎 《计算机科学》 CSCD 北大核心 2024年第S01期128-134,共7页
医学领域命名实体识别是信息抽取任务重要的研究内容之一,其训练数据主要来源于临床实验数据、健康档案、电子病历等非结构化文本,然而标注这些数据需要专业人员耗费大量人力、物力和时间资源。在缺乏大规模医学训练数据的情况下,医学... 医学领域命名实体识别是信息抽取任务重要的研究内容之一,其训练数据主要来源于临床实验数据、健康档案、电子病历等非结构化文本,然而标注这些数据需要专业人员耗费大量人力、物力和时间资源。在缺乏大规模医学训练数据的情况下,医学领域命名实体识别模型很容易出现识别错误的情况。为解决这一难题,文中提出了一种融合标签知识的中文医学命名实体识别方法,即通过专业领域词典获得文本标签的释义后,分别将文本、标签及标签释义编码,基于自适应融合机制进行融合,有效平衡特征提取模块和语义增强模块的信息流,从而提高模型性能。其核心思想在于医学实体标签是通过总结归纳大量医学数据得到的,而标签释义是对标签进行科学解释和说明的结果,模型融入这些蕴含了丰富的医学领域内的先验知识,可以使其更准确地理解实体在医学领域中的语义并提升其识别效果。实验结果表明,该方法在中文医学实体抽取数据集(CMeEE-V2)3个基线模型上分别取得了0.71%,0.53%和1.17%的提升,并且为小样本场景下的实体识别提供了一个有效的解决方案。 展开更多
关键词 中文医学命名实体识别 标签知识 先验知识 自适应融合机制 小样本
下载PDF
基于Electra预训练模型并融合依存关系的中文事件检测模型
2
作者 尹宝生 孔维一 《计算机科学》 CSCD 北大核心 2024年第S01期223-228,共6页
事件检测是信息提取领域的一个重要研究方向。现存的事件检测模型受到语言模型训练目标的限制,只能被动地获取词与词之间的依赖关系,使得模型在训练的过程中过多地关注与训练目标不相关的成分,从而导致检测结果错误。以往的研究表明,充... 事件检测是信息提取领域的一个重要研究方向。现存的事件检测模型受到语言模型训练目标的限制,只能被动地获取词与词之间的依赖关系,使得模型在训练的过程中过多地关注与训练目标不相关的成分,从而导致检测结果错误。以往的研究表明,充分理解上下文信息对于基于深度学习的事件检测技术至关重要。因此,在Electra预训练模型的基础上,引入KVMN网络来捕捉单词之间的依赖关系,以增强单词的语义特征,并采用了一种门控机制来加权这些特征。然后,为了解决中文事件检测中模型识别错误决策的问题,在输入中加入负样本,对不同样本加入不同程度的噪声,使模型学习更好的嵌入表示,有效提高了模型对未知样本的泛化能力。最后,在公共数据集LEVEN上的实验结果表明,该方法优于现有方法,取得了93.43%的F1值。 展开更多
关键词 事件检测 依存关系 键值记忆网络 门控机制 负采样
下载PDF
融入线性句法信息的神经网络双语词对齐算法
3
作者 尹宝生 张斌斌 李绍鸣 《计算机应用与软件》 北大核心 2023年第9期278-282,319,共6页
目前的双语词对齐模型主要依赖大量人工标注语料,不仅耗费时间成本并且人工标注质量不稳定,为了解决这一问题,提出一种基于双语句对齐语料构建双语词对齐神经网络模型的方法。使用GIZA++进行双语词对齐,设计标注方案,生成双语词对齐语料... 目前的双语词对齐模型主要依赖大量人工标注语料,不仅耗费时间成本并且人工标注质量不稳定,为了解决这一问题,提出一种基于双语句对齐语料构建双语词对齐神经网络模型的方法。使用GIZA++进行双语词对齐,设计标注方案,生成双语词对齐语料,作为神经网络初始训练输入;为了充分挖掘句子间潜在的语言特征,提出一种在神经网络的编码层融入双语线性句法信息的词对齐方法。实验基于英中专利与标准句对齐语料进行,神经网络对齐的准确率达到89.05%。 展开更多
关键词 线性句法 词对齐 神经网络
下载PDF
汉语时间识别转换技术在计划任务提醒系统中的应用 被引量:1
4
作者 尹宝生 张桂平 蔡东风 《语言文字应用》 CSSCI 北大核心 2006年第2期134-138,共5页
汉语时间信息的识别和提取是汉语分析中的重要内容,并广泛应用于机器翻译和文本标注分析等方面。本文从具体应用需求出发,针对计划任务系统中任务描述语句的特点,提出了基于时间六元组描述模型的时间识别和精确转换技术,并简要阐述了一... 汉语时间信息的识别和提取是汉语分析中的重要内容,并广泛应用于机器翻译和文本标注分析等方面。本文从具体应用需求出发,针对计划任务系统中任务描述语句的特点,提出了基于时间六元组描述模型的时间识别和精确转换技术,并简要阐述了一个具有计算机辅助时间定位功能的汉语计划任务系统的实现方法。 展开更多
关键词 汉语分析 时间转换 计划任务 提醒系统 定位功能
下载PDF
人机接口的智能化设计 被引量:2
5
作者 尹宝生 张桂平 《中文信息学报》 CSCD 北大核心 1999年第5期57-63,共7页
本文通过对计算机大众用户的水平和需求的分析,针对现有操作系统的人机交互方式的优缺点指出了未来操作系统的三个主要发展方向:可视化、自然语言化和主动服务。
关键词 人机交互 自然语言 主动服务
下载PDF
大规模无参考译文质量自动评测技术的研究 被引量:3
6
作者 尹宝生 苗雪雷 +2 位作者 季铎 蔡东风 张桂平 《沈阳航空航天大学学报》 2012年第1期70-74,共5页
传统的译文质量自动评测方法主要针对机器自动翻译结果并通过与参考译文的对比实现译文质量的评估。提出一种大规模无参考译文质量自动评测方法,该方法可以在无参考译文的情况下,从正确性、流畅性和忠实度等方面对人工译文进行质量检查... 传统的译文质量自动评测方法主要针对机器自动翻译结果并通过与参考译文的对比实现译文质量的评估。提出一种大规模无参考译文质量自动评测方法,该方法可以在无参考译文的情况下,从正确性、流畅性和忠实度等方面对人工译文进行质量检查并标注可能的错误点,即利用语言规则实现正确性的判断,利用语言模型实现流畅性的判断,利用词对齐结果和词典信息实现忠实度的判断。基于该方法实现的译文质量辅助检查系统在国家知识产权局百万专利翻译项目中的应用效果表明,使用该系统的测试组较未使用该系统的测试组的平均译文质量和终稿完成效率均有明显提升。 展开更多
关键词 译文质量自动评测 语言模型 错误标注
下载PDF
知识管理在军工企业中的应用 被引量:3
7
作者 尹宝生 廉鹏 +1 位作者 陈建军 张桂平 《沈阳航空工业学院学报》 2010年第4期47-49,共3页
针对我国军工制造业企业信息化水平并结合未来发展需要,提出基于军工企业信息管理系统构建企业知识管理平台的设计方案。包括知识库总体结构的设计、以及知识积累和共享应用工具包的设计等。目的在于通过对工程数据信息和设计经验知识... 针对我国军工制造业企业信息化水平并结合未来发展需要,提出基于军工企业信息管理系统构建企业知识管理平台的设计方案。包括知识库总体结构的设计、以及知识积累和共享应用工具包的设计等。目的在于通过对工程数据信息和设计经验知识的有效融合,完善设计流程,优化设计方案,加快设计速度,提高设计质量,节约设计成本。 展开更多
关键词 军工企业 知识管理 系统集成
下载PDF
基于知识管理技术的翻译Robot的设计与应用 被引量:3
8
作者 尹宝生 陈建军 张桂平 《沈阳航空工业学院学报》 2008年第5期68-70,共3页
从机器翻译实用化角度出发,提出了基于知识管理技术构建翻译Robot的设计方案。通过知识管理与机器翻译技术的融合,进一步改善翻译系统对知识的获取能力和应用能力,从而提高机器翻译系统的智能性和实用性。
关键词 知识管理 机器翻译 翻译Robot
下载PDF
双向词典和语义相似度计算相结合的词对齐算法 被引量:1
9
作者 尹宝生 杨阳 《沈阳航空航天大学学报》 2015年第2期67-74,共8页
基于统计的词对齐方法需要大规模的双语语料作为输入,难以避免数据稀疏的问题并且算法时间开销大。针对句子或段落级的实时性对齐需求,提出了一种基于双向词典和语义相似度计算的高效词对齐算法,通过采用动态组块切分和匹配、基于知网... 基于统计的词对齐方法需要大规模的双语语料作为输入,难以避免数据稀疏的问题并且算法时间开销大。针对句子或段落级的实时性对齐需求,提出了一种基于双向词典和语义相似度计算的高效词对齐算法,通过采用动态组块切分和匹配、基于知网的语义相似度计算、基于最大匹配的冲突消解和剪枝消歧等策略,有效地解决了由于翻译的灵活性和多样性带来的近似译文的词对齐问题。实验表明,该算法不仅继承了基于词典词对齐算法的优点,同时还改进了传统基于词典词对齐算法的不足,有效提升了词对齐的正确率和召回率,在小规模双语语料和实时性对齐方面具有更好的适用性。 展开更多
关键词 词对齐 双向词典 动态组块切分和匹配 语义相似度计算
下载PDF
基于互联网的汉语近似词频的分析与应用
10
作者 尹宝生 蔡东风 +1 位作者 张桂平 贾楠 《沈阳工程学院学报(自然科学版)》 2005年第4期57-59,共3页
通过对中文互联网的信息内容特点和信息提取难点的分析,阐述了基于现有搜索引擎进行互联网汉语近似网络词频的提取方法,并对汉语近似网络词频的特点和应用进行了初步探讨.
关键词 网络词频 中文互联网 搜索引擎 信息提取
下载PDF
通过N-gram增强局部上下文视野感知的中文生成式摘要
11
作者 尹宝生 安鹏飞 《中文信息学报》 CSCD 北大核心 2022年第8期135-143,153,共10页
基于序列到序列模型的生成式文档摘要算法已经取得了良好的效果。鉴于中文N-gram蕴含着丰富的局部上下文信息,该文提出将N-gram信息整合到现有模型的神经框架NgramSum,即利用N-gram信息增强神经模型局部上下文语义感知能力。该框架以现... 基于序列到序列模型的生成式文档摘要算法已经取得了良好的效果。鉴于中文N-gram蕴含着丰富的局部上下文信息,该文提出将N-gram信息整合到现有模型的神经框架NgramSum,即利用N-gram信息增强神经模型局部上下文语义感知能力。该框架以现有的神经模型为主干,从本地语料库提取N-gram信息,提出了一个局部上下文视野感知增强模块和一个门模块,并来分别对这些信息进行编码和聚合。在NLPCC 2017中文单文档摘要评测数据集上的实验结果表明:该框架有效增强了基于LSTM、Transformer、预训练模型三种不同层次的序列到序列的强基线模型,其中ROUGE-1/2/L相较基线模型平均分别提高了2.76,3.25,3.10个百分点。进一步的实验和分析也证明了该框架在不同N-gram度量方面的鲁棒性。 展开更多
关键词 生成式文摘 N-GRAM 局部上下文视野感知增强 门模块
下载PDF
面向专利文献的中文分词技术的研究 被引量:17
12
作者 张桂平 刘东生 +2 位作者 尹宝生 徐立军 苗雪雷 《中文信息学报》 CSCD 北大核心 2010年第3期112-116,共5页
针对专利文献的特点,该文提出了一种基于统计和规则相结合的多策略分词方法。该方法利用文献中潜在的切分标记,结合切分文本的上下文信息进行最大概率分词,并利用术语前后缀规律进行后处理。该方法充分利用了从大规模语料中获取的全局... 针对专利文献的特点,该文提出了一种基于统计和规则相结合的多策略分词方法。该方法利用文献中潜在的切分标记,结合切分文本的上下文信息进行最大概率分词,并利用术语前后缀规律进行后处理。该方法充分利用了从大规模语料中获取的全局信息和切分文本的上下文信息,有效地解决了专利分词中未登录词难以识别问题。实验结果表明,该文方法在封闭和开放测试下分别取得了较好的结果,对未登录词的识别也有很好的效果。 展开更多
关键词 计算机应用 中文信息处理 中文分词 专利文献 上下文信息
下载PDF
双语知识库中关联实例的多策略提取机制 被引量:1
13
作者 张桂平 姚天顺 +2 位作者 尹宝生 蔡东风 宋彦 《中文信息学报》 CSCD 北大核心 2007年第3期34-39,共6页
双语库是翻译记忆系统最重要的组成部分之一。从有限规模的双语库中提取更多的符合用户当前翻译需要的关联实例是翻译记忆技术研究的主要内容,本文首先对当前基于单一方法的实例检索算法存在的局限性进行了分析,并在对双语库进行知识化... 双语库是翻译记忆系统最重要的组成部分之一。从有限规模的双语库中提取更多的符合用户当前翻译需要的关联实例是翻译记忆技术研究的主要内容,本文首先对当前基于单一方法的实例检索算法存在的局限性进行了分析,并在对双语库进行知识化表示的基础上,提出了基于多策略的关联实例提取机制,即综合运用句子句法结构匹配、句子编辑距离计算、句子短语片段匹配、词汇语义泛化、基于扩展信息(如:句子来源、所属专业、应用频度等信息)的优选等策略进行关联实例提取。试验结果表明,该方法有效提高了关联实例的召回数量和质量,明显改善了对用户的辅助效果。 展开更多
关键词 人工智能 机器翻译 双语知识库 关联实例 多策略提取机制 翻译记忆
下载PDF
新一代Windows多文种处理平台——“环球使者”的设计与实现 被引量:1
14
作者 张桂平 尹宝生 +3 位作者 刘伟松 韩沛林 徐立军 吕建峰 《中文信息学报》 CSCD 北大核心 1998年第2期17-24,共8页
本文针对当今多文种处理所面临的各种困难,首先介绍了进行多文种处理的必要性和要实现一个良好的多文种处理平台所面临的一些急待解决的关键性技术问题;在此基础上,论述了一个新型的Windows多文种处理平台—“环球使者”的设... 本文针对当今多文种处理所面临的各种困难,首先介绍了进行多文种处理的必要性和要实现一个良好的多文种处理平台所面临的一些急待解决的关键性技术问题;在此基础上,论述了一个新型的Windows多文种处理平台—“环球使者”的设计和实现原理及方法,由于该系统首次提出并采用了一种基于智能识别技术的面向目标的“动态编码”方案,所以它不仅解决了多文种文本的混排、输入、输出等问题,而且解决了多文种平台设计中编码冲突和全方位兼容这一瓶颈问题。 展开更多
关键词 WINDOWS 多文种平台 智能识别 操作系统 设计
下载PDF
钢纤维混凝土技术在道路桥梁施工中的应用分析 被引量:8
15
作者 尹宝生 《智能城市》 2021年第13期165-166,共2页
近年来,我国开始重视交通运输行业发展情况,保证其能够与现阶段经济发展相适应,相关人员在道路桥梁建设方面增加了投入,也出现了一些新技术如钢纤维混凝土技术。文章对钢纤维混凝土的优势进行总结,并从铺装桥面、加固桥墩及桩结构应用... 近年来,我国开始重视交通运输行业发展情况,保证其能够与现阶段经济发展相适应,相关人员在道路桥梁建设方面增加了投入,也出现了一些新技术如钢纤维混凝土技术。文章对钢纤维混凝土的优势进行总结,并从铺装桥面、加固桥墩及桩结构应用、防护隧道和边坡、路面施工、防冻和修复路面、遵循连贯性原则六个方面,结合实际情况论述了钢纤维混凝土技术在道路桥梁施工中实际应用。 展开更多
关键词 钢纤维混凝土 道路桥梁 边坡施工
下载PDF
知识管理综述 被引量:14
16
作者 张桂平 尹宝生 蔡东风 《沈阳航空工业学院学报》 2008年第5期46-52,共7页
随着知识经济的发展,知识管理作为管理科学和信息科学交叉研究领域引起越来越多的关注。在对知识管理与知识工程,以及知识管理与信息管理等相关概念进行阐述的基础上,描述了知识管理的实施现状及其存在的问题,并从信息处理技术角度对知... 随着知识经济的发展,知识管理作为管理科学和信息科学交叉研究领域引起越来越多的关注。在对知识管理与知识工程,以及知识管理与信息管理等相关概念进行阐述的基础上,描述了知识管理的实施现状及其存在的问题,并从信息处理技术角度对知识采集、知识表示和知识应用等知识管理的三大要素以及制造业企业实施知识管理的关键技术进行了论述,最后对知识管理相关技术的研究方向进行了展望。 展开更多
关键词 知识管理 知识集成 领域本体 智能检索
下载PDF
道路施工过程中的路基路面质量控制分析 被引量:2
17
作者 尹宝生 《智能城市》 2017年第5期158-158,共1页
就目前来讲,路基路面的建设工程无疑是当前施工发展的基础,在道路施工建设中发挥着重要作用。在公路路基的建设中,存在很多的质量问题,都需要从路基路面的建设中找到对应的施工质量控制调查,才能就其原因进行分析。不负责的路基路面建... 就目前来讲,路基路面的建设工程无疑是当前施工发展的基础,在道路施工建设中发挥着重要作用。在公路路基的建设中,存在很多的质量问题,都需要从路基路面的建设中找到对应的施工质量控制调查,才能就其原因进行分析。不负责的路基路面建设在整体道路施工埋下了很深的隐患,能够在很大程度上影响到道路施工的质量。本文结合道路施工过程中的路基路面施工建设问题简要分析,并结合材料控制的影响进行判断,为促进质量控制作出努力。 展开更多
关键词 道路施工 路基路面 质量控制
下载PDF
新形势下公路桥梁施工技术相关问题分析
18
作者 尹宝生 《中文科技期刊数据库(全文版)工程技术》 2017年第3期50-50,共1页
随着社会的快速发展,我们国家道路桥梁改建、扩大范围和数量同时增大增多,施工过程中,对技术方面要求也变得很严格,因此,一定要在这方面重视,相关部门和人员也做了针对性的研究,其中的非常多的技术都得到了广泛的运用,本文通过分析目前... 随着社会的快速发展,我们国家道路桥梁改建、扩大范围和数量同时增大增多,施工过程中,对技术方面要求也变得很严格,因此,一定要在这方面重视,相关部门和人员也做了针对性的研究,其中的非常多的技术都得到了广泛的运用,本文通过分析目前其现在的真实状况,对公路桥梁技术遇到的问题及改进措施进行了探究。 展开更多
关键词 公路 桥梁 施工 技术 管理
下载PDF
一种高效的基于启发式规则和词典相结合的双语词对齐方法 被引量:2
19
作者 任志敏 蔡东风 尹宝生 《沈阳航空工业学院学报》 2010年第5期73-77,共5页
双语词对齐是指在互译的双语句对中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题。本文在对当前主流的词对齐方法进行实验分析的基础上,综合考虑了各种因素,提出了基于启发式统计规则和词典相结合的方法... 双语词对齐是指在互译的双语句对中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题。本文在对当前主流的词对齐方法进行实验分析的基础上,综合考虑了各种因素,提出了基于启发式统计规则和词典相结合的方法,该方法充分利用现有资源,同时考虑到了后续的应用问题。实验表明,该方法在训练语料规模较小的情况下,取得了较好的对齐结果。 展开更多
关键词 自然语言处理 双语词对齐 锚点 启发式规则 高效
下载PDF
基于web的日英词典自动获取技术的研究
20
作者 项田帅 尹宝生 +1 位作者 季铎 蔡东风 《沈阳航空航天大学学报》 2012年第2期37-41,共5页
双语词典资源对于自然语言处理研究的巨大价值已经得到越来越多的认可,尤其是在机器翻译、跨语言信息检索等方面。传统人工构建词典存在规模小、时效性差、语种不够灵活等问题,而且耗费大量的人力财力。提出了一种基于web的获取日英释... 双语词典资源对于自然语言处理研究的巨大价值已经得到越来越多的认可,尤其是在机器翻译、跨语言信息检索等方面。传统人工构建词典存在规模小、时效性差、语种不够灵活等问题,而且耗费大量的人力财力。提出了一种基于web的获取日英释义的新方法。该方法采用双向融合计算技术,首先对日语单词进行启发式搜索,在返回的网页摘要中应用基于距离和频率的方法挖掘出其候选英语单词;在第二阶段对候选英语单词进行二次搜索,并对两个阶段的结果进行融合计算来确定日英释义。 展开更多
关键词 双语词典 启发式搜索 双向融合
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部