期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
Internet上文本的自动摘要技术 被引量:13
1
作者 尹存燕 戴新宇 陈家骏 《计算机工程》 EI CAS CSCD 北大核心 2006年第3期88-90,共3页
主要研究了Internet上的文本自动摘要,介绍了自动摘要的主流技术;讨论Internet上文本摘要的新需求以及网页上与自动摘要相关的信息,介绍了摘要处理过程和当前自动摘要的主要评估方法;对Internet上文本的自动摘要作出了总结和展望。
关键词 自动摘要 抽取型摘要 概括型摘要 互联网
下载PDF
公文流转系统的授权机制 被引量:7
2
作者 尹存燕 刘祎 +1 位作者 李振东 谢俊元 《计算机工程与应用》 CSCD 北大核心 2002年第9期218-220,223,共4页
该文针对政府公文流转系统中特有的用户权限管理需求,提出了一种授权机制。该机制综合应用了RBAC和OMG的RAD工具的思想,实现了静态授权和动态授权。
关键词 办公自动化系统 公文流转系统 授权机制 用户权限管理
下载PDF
中英命名实体识别及对齐中的中文分词优化 被引量:6
3
作者 尹存燕 黄书剑 +1 位作者 戴新宇 陈家骏 《电子学报》 EI CAS CSCD 北大核心 2015年第8期1481-1487,共7页
中文分词结果对中英命名实体识别及对齐有着直接的影响,本文提出了一种命名实体识别及对齐中的中文分词优化方法.该方法利用实体词汇的对齐信息,首先修正命名实体识别结果,然后根据实体对齐结果调整分词粒度、修正错误分词.分词优化后... 中文分词结果对中英命名实体识别及对齐有着直接的影响,本文提出了一种命名实体识别及对齐中的中文分词优化方法.该方法利用实体词汇的对齐信息,首先修正命名实体识别结果,然后根据实体对齐结果调整分词粒度、修正错误分词.分词优化后的结果使得双语命名实体尽可能多地实现一一对应,进而提高中英命名实体翻译抽取和统计机器翻译的效果.实验结果表明了本文优化方法的有效性. 展开更多
关键词 分词 命名实体识别 双语对齐 机器翻译
下载PDF
面向新闻语料的中日命名实体翻译抽取 被引量:3
4
作者 尹存燕 黄书剑 +1 位作者 戴新宇 陈家骏 《小型微型计算机系统》 CSCD 北大核心 2015年第6期1393-1397,共5页
命名实体翻译可以有效地提高跨语言信息检索、统计机器翻译等系统的性能.双语新闻语料包含了丰富的命名实体,利用统计方法可以从中抽取出命名实体翻译.基于中日双语新闻语料,对中日命名实体的翻译特征进行了分析,基于这些特征,提出一种... 命名实体翻译可以有效地提高跨语言信息检索、统计机器翻译等系统的性能.双语新闻语料包含了丰富的命名实体,利用统计方法可以从中抽取出命名实体翻译.基于中日双语新闻语料,对中日命名实体的翻译特征进行了分析,基于这些特征,提出一种中日双语命名实体翻译自动抽取的方法,该方法融合了中日汉字翻译概率、片假名词汇和中文音译词汇的拼音相似度以及双语词汇共现等特征.实验表明本文方法充分利用这些特征,在语料规模不大的情况下,也可以取得较好的效果. 展开更多
关键词 命名实体 双语语料 对齐模型 拼音相似度 词汇共现
下载PDF
一个公平、有效的安全电子交易协议 被引量:7
5
作者 尹存燕 谢俊元 《计算机应用研究》 CSCD 北大核心 2002年第1期58-60,63,共4页
SET(安全电子交易 )协议是由MasterCard和VISA制定的 ,基于信用卡的安全支付协议。在SET协议基础上提出了一种有效公平的安全电子交易协议 (SET 1 ) ,该协议不仅保持了SET原有安全和有效的特性 ,而且实现了交易有效证据的生成和保存 ,... SET(安全电子交易 )协议是由MasterCard和VISA制定的 ,基于信用卡的安全支付协议。在SET协议基础上提出了一种有效公平的安全电子交易协议 (SET 1 ) ,该协议不仅保持了SET原有安全和有效的特性 ,而且实现了交易有效证据的生成和保存 ,从而保证了交易的公平性 ,同时还引入交易状态机制。最后 ,讨论该协议的安全性。 展开更多
关键词 SET协议 电子商务 公平性 数字签名 加密 电子交易协议 网上购物 INTERNET
下载PDF
激发学生编程兴趣的程序设计实验教学实践 被引量:9
6
作者 尹存燕 刘奇志 陈家骏 《计算机教育》 2018年第3期81-83,共3页
程序设计基础实验课重在训练和提高学生的编程能力,针对单纯的编程训练形式单一、学生感觉枯燥和积极性不高的情况,分析影响学生编程兴趣的原因,指出程序设计基础实验课程的教学实践应以激发学生学习兴趣为导向,并从实验形式和实验内容... 程序设计基础实验课重在训练和提高学生的编程能力,针对单纯的编程训练形式单一、学生感觉枯燥和积极性不高的情况,分析影响学生编程兴趣的原因,指出程序设计基础实验课程的教学实践应以激发学生学习兴趣为导向,并从实验形式和实验内容两方面说明如何激发学生兴趣,提高实验教学质量和教学效果。 展开更多
关键词 实验教学实践 学习兴趣 学习主动性
下载PDF
机器翻译研究现状与展望 被引量:28
7
作者 戴新宇 尹存燕 +1 位作者 陈家骏 郑国梁 《计算机科学》 CSCD 北大核心 2004年第11期176-179,184,共5页
本文回顾机器翻译研完的历史,介绍典型的机器翻译方法,包括:基于规则、基于统计以及基于实例的机器翻译方法;针对机器翻译的研究现状,详细介绍和分析了基于混合策略的机器翻译方法,对统计以及机器学习方法在机器翻译中的应用进行了描述... 本文回顾机器翻译研完的历史,介绍典型的机器翻译方法,包括:基于规则、基于统计以及基于实例的机器翻译方法;针对机器翻译的研究现状,详细介绍和分析了基于混合策略的机器翻译方法,对统计以及机器学习方法在机器翻译中的应用进行了描述;论文还介绍了当前机器翻译评测技术;最后对机器翻译进行总结和展望。 展开更多
关键词 机器翻译 基于实例 评测技术 机器学习方法 混合策略 描述 规划 统计 展望
下载PDF
基于层叠条件随机场模型的中文机构名自动识别 被引量:112
8
作者 周俊生 戴新宇 +1 位作者 尹存燕 陈家骏 《电子学报》 EI CAS CSCD 北大核心 2006年第5期804-809,共6页
中文机构名的自动识别是自然语言处理中的一个比较困难的问题.本文提出了一种新的基于层叠条件随机场模型的中文机构名自动识别算法.该算法在低层条件随机场模型中解决对人名、地名等简单命名实体的识别,将识别结果传递到高层模型,为高... 中文机构名的自动识别是自然语言处理中的一个比较困难的问题.本文提出了一种新的基于层叠条件随机场模型的中文机构名自动识别算法.该算法在低层条件随机场模型中解决对人名、地名等简单命名实体的识别,将识别结果传递到高层模型,为高层的机构名条件随机场模型实现对复杂机构名的识别提供决策支持.文中为机构名条件随机场模型设计了有效的特征模板和特征自动选择算法.对大规模真实语料的开放测试中,召回率达到90.05%,准确率达到88.12%,性能优于其它中文机构名识别算法. 展开更多
关键词 命名实体 中文机构名识别 条件随机场
下载PDF
一种规则与统计相结合的汉语分词方法 被引量:35
9
作者 赵伟 戴新宇 +1 位作者 尹存燕 陈家骏 《计算机应用研究》 CSCD 北大核心 2004年第3期23-25,共3页
汉语自动分词是中文信息处理领域的一项基础性课题,对现有的汉语分词方法作了简单的概述和分析,然后提出了一种新的分词方法,该方法基于一个标注好了的语料库,并且结合了规则和语料库统计两种分词方法。
关键词 中文信息处理 分词 语料库 交集型歧义
下载PDF
一个基于积件思想的新一代多媒体辅助教学系统的设计与实现 被引量:14
10
作者 施农 冷静 +2 位作者 尹存燕 郦莉 谢俊元 《计算机应用研究》 CSCD 北大核心 2001年第4期108-111,共4页
从我国当前多媒体辅助教学软件的发展情况出发,在积件思想和多媒体著作系统设计思想指导下,介绍了一个多媒体辅助教学系统的设计与实现,其中主要讨论了系统总体结构、积件平台的选取,提出了一个平台制作的课件的结构模型.
关键词 多媒体辅助教学系统 课件 积件思想 计算机辅助教学
下载PDF
基于语义树的中文词语相似度计算与分析 被引量:36
11
作者 张亮 尹存燕 陈家骏 《中文信息学报》 CSCD 北大核心 2010年第6期23-30,共8页
词语相似度的分析与计算是自然语言处理关键技术之一,对句法分析、机器翻译、信息检索等能提供很好的帮助。基于语义资源Hownet的中文词语相似度计算是近年来的研究热点,但大多数的研究都是对中国科学院计算技术研究所刘群提出的计算方... 词语相似度的分析与计算是自然语言处理关键技术之一,对句法分析、机器翻译、信息检索等能提供很好的帮助。基于语义资源Hownet的中文词语相似度计算是近年来的研究热点,但大多数的研究都是对中国科学院计算技术研究所刘群提出的计算方法的改进和完善。该文充分分析和利用新版Hownet(2007)的概念架构和语义多维表达形式,从概念的主类义原、主类义原框架以及概念特性描述三个方面综合分析词语相似度,并在计算中区分语义特征相似度和句法特征相似度。实验结果理想,与人的直观判断基本一致。 展开更多
关键词 语义树 词语相似度 《知网》2007 语义距离
下载PDF
基于差异性和重要性的问句特征组合 被引量:7
12
作者 杨思春 高超 +2 位作者 戴新宇 尹存燕 陈家骏 《电子学报》 EI CAS CSCD 北大核心 2014年第5期918-924,共7页
在问答系统问句分类研究中,对问句特征进行组合有助于构造高效的问句分类器.针对当前问句分类中的特征组合问题,提出一种基于差异性和重要性的特征组合(Diversity and Importance based Feature Combination,DIFC)方法.通过计算待组合... 在问答系统问句分类研究中,对问句特征进行组合有助于构造高效的问句分类器.针对当前问句分类中的特征组合问题,提出一种基于差异性和重要性的特征组合(Diversity and Importance based Feature Combination,DIFC)方法.通过计算待组合特征与当前特征组合的错分差异度和正分差异度,以及待组合特征本身的重要度,从候选特征集中动态获取优化的特征组合.在哈工大中文问句集上对词袋绑定特征进行组合的实验结果表明,与其他特征组合方法相比,DIFC方法灵活高效,准确率更高. 展开更多
关键词 问句分类 特征组合 差异性 重要性
下载PDF
自然语言信息抽取中的机器学习方法研究 被引量:8
13
作者 周俊生 戴新宇 +1 位作者 尹存燕 陈家骏 《计算机科学》 CSCD 北大核心 2005年第3期186-189,199,共5页
信息抽取是一种用于处理各种类型文本文档的非常有效的方法,然而建立一个文本信息抽取系统却是非常困难和耗费时间的。近年来,基于统计的机器学习方法在信息抽取领域的研究受到了广泛关注。本文深入探讨了当前自然语言信息抽取领域广泛... 信息抽取是一种用于处理各种类型文本文档的非常有效的方法,然而建立一个文本信息抽取系统却是非常困难和耗费时间的。近年来,基于统计的机器学习方法在信息抽取领域的研究受到了广泛关注。本文深入探讨了当前自然语言信息抽取领域广泛采用的几种非常有效的统计学习方法,比较分析了各种方法的统计推断过程和学习算法及其优缺点,讨论了各种统计学习方法所面临的训练语料匮乏问题的主要解决方法,并指出了今后进一步研究的方向。 展开更多
关键词 自然语言 信息抽取 机器学习方法 统计学习 命名实体
下载PDF
一种命名实体翻译等价对的抽取方法 被引量:10
14
作者 陈怀兴 尹存燕 陈家骏 《中文信息学报》 CSCD 北大核心 2008年第4期55-60,共6页
有关命名实体的翻译等价对在多语言处理中有着非常重要的意义。在过去的几年里,双语字典查找,音译模型等方法先后被提出。另一种极具价值的方法是从平行语料库中自动抽取有关命名实体的翻译等价对,现有的方法要求预先对双语语料库的两... 有关命名实体的翻译等价对在多语言处理中有着非常重要的意义。在过去的几年里,双语字典查找,音译模型等方法先后被提出。另一种极具价值的方法是从平行语料库中自动抽取有关命名实体的翻译等价对,现有的方法要求预先对双语语料库的两种语言文本进行命名实体标注。提出了一种只要求对语料库中源语言进行命名实体标注,目标语言不需标注,然后利用训练得到的HMM词对齐结果来抽取有关命名实体翻译等价对的方法。在实验中,把中文作为源语言,英文作为目标语言。实验结果表明用该方法,即使在对齐模型只是部分准确的情况下,也得到了较高正确率的命名实体翻译等价对。 展开更多
关键词 人工智能 机器翻译 命名实体 翻译等价对 HMM 对齐模型
下载PDF
一种基于实例的汉英机器翻译策略 被引量:5
15
作者 胡国全 陈家骏 +1 位作者 戴新宇 尹存燕 《计算机工程与设计》 CSCD 北大核心 2005年第4期900-903,906,共5页
介绍了一种基于实例的汉英机器翻译策略,重点讨论了汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也... 介绍了一种基于实例的汉英机器翻译策略,重点讨论了汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也是基于实例机器翻译的难点之一,在这方面也采取了相应的解决方法。没有对翻译句子的连接装配进行更深入的研究,这是因为该翻译策略是用于多翻译引擎系统的,它要与其它翻译策略配合使用,以提高翻译结果的正确率。基于实例的机器翻译需要大量的双语语料库作为翻译时的依据,而人工建设大型语料库费时费力,所以尝试采用计算机进行汉英双语语料库的自动建立,包括篇章对齐和单词级的对齐。 展开更多
关键词 自然语言处理 机器翻译 实例 EBMT技术
下载PDF
面向政府部门的安全电子邮件系统的设计与实现 被引量:1
16
作者 刘祎 尹存燕 +1 位作者 李振东 谢俊元 《计算机工程与应用》 CSCD 北大核心 2002年第10期140-142,154,共4页
文章针对目前邮件系统的安全隐患,提出一个面向政府部门的安全电子邮件系统的模型,并介绍其实现的关键技术。该模型主要解决了邮件系统中存在的身份鉴别、防止抵赖、保密性、完整性等安全问题。最后根据当前常用的电子邮件攻击手段给出... 文章针对目前邮件系统的安全隐患,提出一个面向政府部门的安全电子邮件系统的模型,并介绍其实现的关键技术。该模型主要解决了邮件系统中存在的身份鉴别、防止抵赖、保密性、完整性等安全问题。最后根据当前常用的电子邮件攻击手段给出该系统的安全评估。 展开更多
关键词 政府部门 安全电子邮件系统 设计 身份鉴别 计算机网络
下载PDF
一个基于格语法和转换策略的日汉机器翻译系统 被引量:1
17
作者 陈家骏 戴新宇 +1 位作者 尹存燕 王启祥 《中文信息学报》 CSCD 北大核心 2006年第B03期61-65,共5页
本文介绍一个基于规则和转换翻译策略的日汉机器翻译系统的设计和实现。该系统的日语分析采用了基于短语结构文法和格语法的句法、语义分析技术。在句法分析中识别出动词短语时,利用动词格框架进行格短语的格角色识别。分析规则采用了... 本文介绍一个基于规则和转换翻译策略的日汉机器翻译系统的设计和实现。该系统的日语分析采用了基于短语结构文法和格语法的句法、语义分析技术。在句法分析中识别出动词短语时,利用动词格框架进行格短语的格角色识别。分析规则采用了复杂特征集和舍一运算,并按层次进行设计。日语分析结果为带格角色标记的日语分析树。基于得到的日语分析树,系统采用了转影生成一体化的汉语生成策略。按深度优先遍历分析树转换/生成汉语。另外,谊翻译系统在基于规则的主框架之上,还辅助以翻译记忆的方法。本文的系统参加了863组织的三次机器翻译评测,其中,在2005年的评测中,自动评测的结果(NIST)为:6.3052(对话)和6.7836(篇章)。 展开更多
关键词 机器翻译 日语 汉语 转换 规则 格语法
下载PDF
一种规则和贝叶斯方法相结合的文本自动分类策略 被引量:7
18
作者 刘静 尹存燕 陈家骏 《计算机应用研究》 CSCD 北大核心 2005年第7期84-86,89,共4页
文本自动分类技术是信息处理领域的重要研究方向,在介绍文本分类应用以及其关键技术的同时,讨论了几种文本分类方法,并且在对这些分类方法分析的基础上,提出了一种规则和统计相结合的文本自动分类策略。该策略通过规则方法来放宽贝叶斯... 文本自动分类技术是信息处理领域的重要研究方向,在介绍文本分类应用以及其关键技术的同时,讨论了几种文本分类方法,并且在对这些分类方法分析的基础上,提出了一种规则和统计相结合的文本自动分类策略。该策略通过规则方法来放宽贝叶斯方法所要求的强独立性假设条件,同时当规则不能满足时,可以通过贝叶斯方法来得到更好的分类结果。 展开更多
关键词 文本分类 向量空间 概率模型 规则
下载PDF
一种基于元规则的自然语言生成规则解释技术 被引量:1
19
作者 孙明欣 尹存燕 +1 位作者 戴新宇 陈家骏 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第1期69-75,共7页
结合一个基于规则的日汉机器翻译系统,给出了自然语言生成规则的一种解释技术.该技术着眼于汉语生成规则语言的表达能力、自然性以及可扩充性,在实现中采用了基于元规则的方法,可以很方便地对规则语言进行扩充;另外,元规则的描述主要采... 结合一个基于规则的日汉机器翻译系统,给出了自然语言生成规则的一种解释技术.该技术着眼于汉语生成规则语言的表达能力、自然性以及可扩充性,在实现中采用了基于元规则的方法,可以很方便地对规则语言进行扩充;另外,元规则的描述主要采用了自动机模型.所述的原则和技术也适用于一般的基于规则的自然语言处理系统. 展开更多
关键词 机器翻译 生成 规则语言 元规则 自动机
下载PDF
一种基于语料库的日语动词格框架自动构造技术
20
作者 倪瑞煜 戴新宇 +1 位作者 尹存燕 陈家骏 《计算机应用研究》 CSCD 北大核心 2007年第6期66-68,共3页
结合一个基于格语法的日汉机器翻译系统,针对现有系统日语动词格框架缺乏的现状,提出一种日语动词格框架自动构造方法。该方法基于类比与统计思想,从现有的少量人工构造的动词格框架和大量生语料出发,自动构造日语动词格框架。
关键词 机器翻译 日语 格语法 动词格框架 构造 规则 统计
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部