期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
中文文本中抽取特征信息的区域与技术 被引量:45
1
作者 刘开瑛 薛翠芳 +1 位作者 郑家恒 周晓强 《中文信息学报》 CSCD 北大核心 1998年第2期1-7,共7页
本文探讨了各种从中文文本中抽取特征信息的区域和技术。本文以新闻语料、科技论文、公文类文献为例,详细论述了从各类文本中抽取特征信息的区域与技术,对科技论文,还给出了一些可操作的产生式规则。无论对自动标引、自动分类,还是... 本文探讨了各种从中文文本中抽取特征信息的区域和技术。本文以新闻语料、科技论文、公文类文献为例,详细论述了从各类文本中抽取特征信息的区域与技术,对科技论文,还给出了一些可操作的产生式规则。无论对自动标引、自动分类,还是自动文摘的研究者而言。 展开更多
关键词 中文文本 特征信息 本文处理 自动标引 抽取技术
下载PDF
基于《金融档案分类表》的自动分类算法研究 被引量:7
2
作者 刘开瑛 郑家恒 刘静 《情报学报》 CSSCI 北大核心 1997年第5期346-353,共8页
本文介绍基于《中国档案分类法金融档案分类表》(以下简称《金融档案分类表》)的中文文本自动分类算法。提出了类别词概念,介绍了类别词库和分类规则词库建造法以及自动分类的三维加权算法等内容。经过对真实金融档案文本测试,自动... 本文介绍基于《中国档案分类法金融档案分类表》(以下简称《金融档案分类表》)的中文文本自动分类算法。提出了类别词概念,介绍了类别词库和分类规则词库建造法以及自动分类的三维加权算法等内容。经过对真实金融档案文本测试,自动分类正确率可达81%以上。 展开更多
关键词 自动分类 金融档案 档案分类
下载PDF
现代汉语自动分词评测技术研究 被引量:15
3
作者 刘开瑛 《语言文字应用》 CSSCI 北大核心 1997年第1期103-108,共6页
对现代汉语自动分词软件评测技术提出了理论依据和实用算法。提出了分词软件的质量评价原则;评测语料库、歧义切分、人名、地名等各项评测内容的选择依据;《分词规范》
关键词 汉语自动分词 现代汉语 计算语言学 歧义切分 语料库 正确率 分词单位 自动辨识 软件质量 中国地名
下载PDF
汉语框架语义网构建及其应用技术研究 被引量:23
4
作者 刘开瑛 《中文信息学报》 CSCD 北大核心 2011年第6期46-52,62,共8页
汉语框架语义网(Chinese FrameNet,CFN)是一个以Fillmore的框架语义学为理论基础、以英文FrameNet为参照、以汉语语料事实为依据的供计算机使用的汉语词汇语义数据库。该文首先介绍了汉语框架语义网的构建基础——框架语义学以及英语的... 汉语框架语义网(Chinese FrameNet,CFN)是一个以Fillmore的框架语义学为理论基础、以英文FrameNet为参照、以汉语语料事实为依据的供计算机使用的汉语词汇语义数据库。该文首先介绍了汉语框架语义网的构建基础——框架语义学以及英语的框架语义网工程,然后具体分析了汉语框架语义网的构建技术,并对基于汉语框架网的语义角色自动标注研究进行了介绍,25个框架的交叉验证的实验结果的准确率、召回率、F1-值分别达到74.16%,52.70%,61.62%;最后,介绍了几个基于汉语框架语义网的研究课题的进展情况。 展开更多
关键词 汉语框架网 语义角色标注 框架语义依存图
下载PDF
歧义切分与专有名词识别软件 被引量:4
5
作者 刘开瑛 《语言文字应用》 CSSCI 北大核心 2001年第3期9-15,共7页
关键词 中文文本自动切词 中文信息处理 理论意义 应用价值 歧义字段切分 专有名词识别 识别软件 汉语
下载PDF
外文期刊编目与检索计算机处理系统
6
作者 刘开瑛 《现代图书情报技术》 1981年第1期31-38,共8页
关键词 计算机处理系统 期刊信息 外文期刊 编目程序 分量 磁带 现刊 检索程序 出版频率 中心图书馆
下载PDF
汉语框架语义知识库及软件描述体系 被引量:49
7
作者 郝晓燕 刘伟 +1 位作者 李茹 刘开瑛 《中文信息学报》 CSCD 北大核心 2007年第5期96-100,138,共6页
汉语框架网络工程是以框架语义学为理论基础的基于语料库的计算词典编纂工程,用于语言学、计算语言学研究及自然语言处理研究。该工程的结果包括两部分:汉语框架语义知识库(即词典资源)和相关软件。其中,汉语框架网络知识库包括框架库... 汉语框架网络工程是以框架语义学为理论基础的基于语料库的计算词典编纂工程,用于语言学、计算语言学研究及自然语言处理研究。该工程的结果包括两部分:汉语框架语义知识库(即词典资源)和相关软件。其中,汉语框架网络知识库包括框架库、句子库和词元库三部分,相关软件主要包括汉语框架语义知识库管理系统和基于Web的展示系统。本文介绍了汉语框架语义知识库的语义描述体系以及软件描述体系。 展开更多
关键词 计算机应用 中文信息处理 汉语框架网络 框架语义 描述体系 软件
下载PDF
基于变换的中国地名自动识别研究(英文) 被引量:23
8
作者 谭红叶 郑家恒 刘开瑛 《软件学报》 EI CSCD 北大核心 2001年第11期1608-1613,共6页
专有名词中的中国地名的自动识别是中文信息处理中要解决的一个重要问题 .完全依靠统计方法只能保证一定的召回率 ,而准确率偏低 .提出了一种基于变换的策略 ,可以有效地克服这一缺陷 .经测试 ,系统最终的准确率提高了 7% ,达到了 90 .9% .
关键词 中国地名 自动识别 专有名词 中文信息处理 计算机
下载PDF
汉语语义分析模型研究述评 被引量:22
9
作者 由丽萍 范开泰 刘开瑛 《中文信息学报》 CSCD 北大核心 2005年第6期57-63,共7页
这篇述评的目的是为汉语语义处理的研究工作提供参考。我们首先分别分析了三种语义分析模型———词语依存(WD)、概念依存(CD)和核心依存(KD)的理论基础和表达方式;然后,重点从功能和可操作性方面比较三者在语义表示方面的特点。结论是... 这篇述评的目的是为汉语语义处理的研究工作提供参考。我们首先分别分析了三种语义分析模型———词语依存(WD)、概念依存(CD)和核心依存(KD)的理论基础和表达方式;然后,重点从功能和可操作性方面比较三者在语义表示方面的特点。结论是(1)词语依存可操作性好但功能弱,概念依存功能强但可操作性差,二者的缺点都是极难解决的问题,核心依存兼顾词语和概念,可能是最适合汉语语义处理需要的;(2)要使模型达到实用要求,需要在句法标注、词典编纂和规范化方面做大量复杂的工作。 展开更多
关键词 计算机应用 中文信息处理 依存语法 概念依存理论 框架语义学 语义表示
下载PDF
基于案例的推理在农业专家系统中的应用 被引量:20
10
作者 李茹 任海涛 +1 位作者 刘开瑛 梁吉业 《计算机工程与应用》 CSCD 北大核心 2004年第25期196-198,204,共4页
该文将基于案例的推理方法CBR应用到农业专家系统中。在对CBR方法作了简单介绍后,提出了在农业专家系统中面向对象的案例表示、案例库组织的两层结构,并以大豆专家系统中病虫害诊断模块为例阐述了CBR推理在农业专家系统中的具体实现过程。
关键词 基于案例的推理 专家系统 面向对象 案例检索策略
下载PDF
中国地名自动识别系统的设计与实现 被引量:16
11
作者 谭红叶 郑家恒 刘开瑛 《计算机工程》 CAS CSCD 北大核心 2002年第8期128-129,270,共3页
按照统计与规则相结合的策略,设计实现了一个中国地名自动识别实验系统;同时提出了地名可信度的计算方法。对系统开放测试后,准确率为,召回率为。
关键词 中国地名 自动识别系统 设计 中文信息处理
下载PDF
基于COSA算法的中文文本聚类 被引量:9
12
作者 谷波 李济洪 刘开瑛 《中文信息学报》 CSCD 北大核心 2007年第6期65-70,共6页
传统聚类算法在计算两个对象间的距离时,每个属性对距离的贡献相同。COSA(Clustering On Subsets of Attributes)算法[1]认为在不同的分组中,每个属性对计算距离所起的作用可能并不相等,因为不同分组中的对象可能在不同的属性子集上聚... 传统聚类算法在计算两个对象间的距离时,每个属性对距离的贡献相同。COSA(Clustering On Subsets of Attributes)算法[1]认为在不同的分组中,每个属性对计算距离所起的作用可能并不相等,因为不同分组中的对象可能在不同的属性子集上聚集。文献[1]在此基础上定义了新的距离,并提出了两种COSA算法:COSA1算法是一种分割的聚类算法;COSA2算法是一种层次聚类算法。为了对比COSA距离和传统的欧氏距离在文本聚类中的表现,本文对中文文本进行了分割聚类和层次聚类的实验。实验结果显示出COSA算法较基于欧氏距离的聚类算法有更好的性能,而且对于属性数的变化,COSA算法更加稳定。 展开更多
关键词 计算机应用 中文信息处理 文本聚类 COSA算法 K—means算法
下载PDF
中文阅读理解语料库构建技术研究 被引量:3
13
作者 郝晓燕 李济洪 +1 位作者 由丽萍 刘开瑛 《中文信息学报》 CSCD 北大核心 2007年第6期29-35,共7页
阅读理解问答系统指的是能够自动分析一个自然语言文章,并且根据文中的信息为每个问题生成一个答案的系统,具有很高的研究价值。然而,缺乏中文阅读理解语料库已经成为制约汉语阅读理解问答系统发展的主要障碍。本文对于中文阅读理解语... 阅读理解问答系统指的是能够自动分析一个自然语言文章,并且根据文中的信息为每个问题生成一个答案的系统,具有很高的研究价值。然而,缺乏中文阅读理解语料库已经成为制约汉语阅读理解问答系统发展的主要障碍。本文对于中文阅读理解语料库的构建过程进行了详细的介绍,包括语料选材、编写问句,标注答案句、语料加工和评测机制,尤其是基于汉语框架语义知识库对语料进行了框架元素、短语类型和句法功能三个层面标注的深加工技术。 展开更多
关键词 计算机应用 中文信息处理 阅读理解问答系统 中文阅读理解语料库 汉语框架语义知识库
下载PDF
采用预测策略的Earley算法 被引量:4
14
作者 谷波 李茹 刘开瑛 《计算机科学》 CSCD 北大核心 2010年第1期229-232,共4页
在自然语言处理中,句法分析主要有基于统计的方法和基于规则的方法。Earley算法是一种基于规则的方法,可以分析任意上下文无关文法(CFG),而不需要对文法进行修改。详细分析了Earley算法的特点。在通常的Earley算法中增加了多种预测机制... 在自然语言处理中,句法分析主要有基于统计的方法和基于规则的方法。Earley算法是一种基于规则的方法,可以分析任意上下文无关文法(CFG),而不需要对文法进行修改。详细分析了Earley算法的特点。在通常的Earley算法中增加了多种预测机制,这些预测机制借鉴了LL,LR以及SLR等确定性分析算法的一些思想,并对这几种不同的预测机制及其组合在相同条件下进行了中文句法分析实验。结果显示,引入这些预测机制通常可以减少产生项目的数量,从而节省存储空间,减少运行时间。 展开更多
关键词 上下文无关文法 句法分析 Earley算法
下载PDF
汉语姓名自动辨识初探 被引量:4
15
作者 郑家恒 刘开瑛 《语言文字应用》 CSSCI 1994年第2期65-68,共4页
分析了汉语姓名在各种类型汉语文本中的分布情况、汉语姓名组成的复杂性和自动识别姓名的难点,提出了自动识别姓名的策略和规则。
关键词 汉语姓名 自动辨识 汉语姓氏 语料库 自动识别 自动分词 兼类 政务信息 情报检索 中文姓名辨识
下载PDF
中国人民银行山西省分行信贷、现金计划执行检查表计算程序
16
作者 刘开瑛 王振齐 《山西财经大学学报》 1979年第0期80-88,共9页
前 言 本程序是在TQ—16型电子计算机上,用ALGOL—60语言编写的一个专用程序。它用于计算中国人民银行山西省分行每月信贷、现金等项目电报月报表及各类分析表。计算结果以各类月报表及分析表的内容形式打出,其结果准确无误,现在人民银... 前 言 本程序是在TQ—16型电子计算机上,用ALGOL—60语言编写的一个专用程序。它用于计算中国人民银行山西省分行每月信贷、现金等项目电报月报表及各类分析表。计算结果以各类月报表及分析表的内容形式打出,其结果准确无误,现在人民银行山西省分行开始试验性使用。 展开更多
关键词 月报表 山西 检查表 信贷 计划执行情况 减额 中国人民银行 电报 计算程序 分析表
下载PDF
计算语言学概述
17
作者 刘开瑛 《中国计算机用户》 1990年第11期31-33,共3页
关键词 计算语言学 计算机应用 语言学
下载PDF
汉语名、动、形兼类词的两种鉴别方法 被引量:7
18
作者 温锁林 刘开瑛 《语文研究》 CSSCI 北大核心 1998年第1期31-35,共5页
汉语名、动、形三大词类的兼类问题是语法学界和计算语言学中历来存在争议的焦点问题。根据词类划分的目的和标准,特别是计算机处理自然语言的特点和需要,本文提出了鉴别兼类词的两种方法:并列类推法和同境类推法。
关键词 兼类词 形动兼类 词类划分 并列关系 自然语言处理 语法研究 计算语言学 种鉴别 类推法 汉语
原文传递
自动分词软件切分正确率评测方法研究
19
作者 郑家恒 刘开瑛 《模式识别与人工智能》 EI CSCD 北大核心 1992年第2期85-89,共5页
关键词 汉语 软件 自动分词 信息处理
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部