期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于字串内部结合紧密度的汉语自动抽词实验研究 被引量:32
1
作者 罗盛芬 孙茂松 《中文信息学报》 CSCD 北大核心 2003年第3期9-14,共6页
自动抽词是文本信息处理中的重要课题之一。当前比较通行的解决策略是通过评估候选字串内部结合紧密度来判断该串成词与否。本文分别考察了九种常用统计量在汉语自动抽词中的表现 ,进而尝试将它们组合在一起 ,以期提高性能。为了达到尽... 自动抽词是文本信息处理中的重要课题之一。当前比较通行的解决策略是通过评估候选字串内部结合紧密度来判断该串成词与否。本文分别考察了九种常用统计量在汉语自动抽词中的表现 ,进而尝试将它们组合在一起 ,以期提高性能。为了达到尽可能好的组合效果 ,采用了遗传算法来自动调整组合权重。对二字词的自动抽词实验结果表明 ,这九种常用统计量中 ,互信息的抽词能力最强 ,F measure可达 5 4 77% ,而组合后的F measure为 5 5 4 7% ,仅比互信息提高了 0 70 % ,效果并不显著。我们的结论是 :( 1)上述统计量并不具备良好的互补性 ;( 2 )通常情况下 ,建议直接选用互信息进行自动抽词 ,简单有效。 展开更多
关键词 计算机应用 中文信息处理 自动抽词 统计量的组合 遗传算法
下载PDF
自动抽词与自动分词 被引量:12
2
作者 张琪玉 《图书馆杂志》 CSSCI 北大核心 2002年第3期13-14,共2页
自动抽词与自动分词既有紧密联系又有重大差别。自动抽词标引除编制题内关键词索引外,至今没有突破性进展,主要是检准率太低。本文指出自动抽词标引研究注重在各种更有效的算法的寻找,而忽视对相关问题的深入、系统的研究,是其进展缓慢... 自动抽词与自动分词既有紧密联系又有重大差别。自动抽词标引除编制题内关键词索引外,至今没有突破性进展,主要是检准率太低。本文指出自动抽词标引研究注重在各种更有效的算法的寻找,而忽视对相关问题的深入、系统的研究,是其进展缓慢的重要原因之一,并具体列举了一些相关问题。 展开更多
关键词 自动抽词 自动 文献标引 文献检索 人机结合
下载PDF
缺乏抽词词典是自动抽词标引难以普及的主要原因 被引量:7
3
作者 张琪玉 《图书与情报》 CSSCI 北大核心 1998年第2期27-27,80,共2页
缺乏抽词词典是自动抽词标引难以普及的主要原因张琪玉(空军政治学院信息管理系上海200433)1.自动抽词标引的两个必备条件全文检索目前还难以做到无遗漏的抽词标引。从检索过程及其效果看,抽词标引系统比无标引系统(包括仅... 缺乏抽词词典是自动抽词标引难以普及的主要原因张琪玉(空军政治学院信息管理系上海200433)1.自动抽词标引的两个必备条件全文检索目前还难以做到无遗漏的抽词标引。从检索过程及其效果看,抽词标引系统比无标引系统(包括仅提供任意字词匹配检索即模糊检索功能... 展开更多
关键词 自动抽词标引 文献标引 自动标引
下载PDF
文献题名自动抽词——分类标引系统 被引量:8
4
作者 张琪玉 《图书馆杂志》 CSSCI 北大核心 1998年第4期8-11,共4页
本文对“文献题名自动抽词-分类标引系统”作了概述,并给出了全部程序。这是一种比较简易实用的自然语言检索法。
关键词 分类标引系统 自然语言检索 文献题名 自动抽词
下载PDF
汉语科技文献自动抽词的探讨与试验 被引量:3
5
作者 何建章 《情报科学》 1987年第4期35-45,共11页
文中探讨了汉语科技文献自动抽词标引的理论和技术问题,介绍了自动抽词系统SAET(System of Automatic Extracting Terms)的功能、结构以及采用的方法。给出了SAET系统对300篇机械工程领域的文摘进行处理所得出的数据,并对这些数据进行... 文中探讨了汉语科技文献自动抽词标引的理论和技术问题,介绍了自动抽词系统SAET(System of Automatic Extracting Terms)的功能、结构以及采用的方法。给出了SAET系统对300篇机械工程领域的文摘进行处理所得出的数据,并对这些数据进行了分析。 展开更多
关键词 主题 主题 自动抽词 科技文献 主题内容 语法功能 字符串 子系统 标引 机器
下载PDF
中文标题自动抽词的递归校正法
6
作者 王维 《图书馆杂志》 1988年第6期23-26,共4页
论文提要中文标题自动抽词标引是一个正在探索中的课题,本文在研究前人所取得的经验、成果的基础上,提出了一种新的实现方法:递归校正法。文中论述了这种方法的基本思想及其依据,并在初步试验中获得了预期的效果。
关键词 标引 自动抽词 校正法 计算机模拟 标题 最长匹配法 基本思想 递归 有效 中文
下载PDF
基于多词表的自动标引技术研究——新华社新闻稿自动标引的实验 被引量:18
7
作者 查贵庭 侯汉清 《情报学报》 CSSCI 北大核心 2002年第3期273-277,共5页
避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自... 避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。 展开更多
关键词 新闻标引 自动标引 自动分类 表技术 自然语言标引 表构建 自动抽词 中文信息处理
下载PDF
无词典抽词的RMMFS和BMMFS方法及其比较研究 被引量:5
8
作者 姜韶华 党延忠 宣照国 《情报学报》 CSSCI 北大核心 2006年第4期499-503,共5页
针对作为中文信息处理基础的抽词问题,本文在作者提出的正向串频最大匹配法(MMFS)的基础上,提出了逆向串频最大匹配法(RMMFS)及双向串频最大匹配法(BMMFS).这两种方法分别采用逆向和双向长串优先与串频统计的思路,并引进规则和支... 针对作为中文信息处理基础的抽词问题,本文在作者提出的正向串频最大匹配法(MMFS)的基础上,提出了逆向串频最大匹配法(RMMFS)及双向串频最大匹配法(BMMFS).这两种方法分别采用逆向和双向长串优先与串频统计的思路,并引进规则和支持度指标筛选,不需要词典,不需要事先进行语料库学习,不需要建立字索引,通过串匹配获取中文文本中的汉字共现模式,实时地抽取出包含专业术语及专有名词等未登录词在内的专指语义串、短语和词.实验研究了抽词准确率受规则的影响及随文本大小和词频变化的分布,结果表明BMMFS可以取得更好的抽词效果. 展开更多
关键词 逆向串频最大匹配 双向串频最大匹配 自动抽词 汉字共现模式
下载PDF
汉语文献字处理抽词
9
作者 欧金森 《情报理论与实践》 CSSCI 北大核心 1994年第2期31-35,共5页
论述一种采用字处理方式用计算机从汉语文献中抽词的方法。该方法从目标词的外部着手,利用语法关系去掉目标词外围的词和字,同时注意区分去留字和词间的切分点,从而提高抽词效果。这种字处理运行机制的算法,为汉语主题抽调提出了新... 论述一种采用字处理方式用计算机从汉语文献中抽词的方法。该方法从目标词的外部着手,利用语法关系去掉目标词外围的词和字,同时注意区分去留字和词间的切分点,从而提高抽词效果。这种字处理运行机制的算法,为汉语主题抽调提出了新方法,并可与位控赋词并联运行,构成一整套字处理取词系统。 展开更多
关键词 自动抽词 自动标引 汉语文献
下载PDF
利用新型B^+树的算法自动提取文稿的主题词
10
作者 王晓梅 《电脑与信息技术》 1996年第2期10-12,共3页
本文论述了一种新型的B^+树算法,并以此法实际应用于文稿主题词的自动提取上.新型B^+树继承了传统的B^+树的优点,并有所创新.它采用了一种新型的数据结构,使查询快速且内容全面.利用新型B^+树的算法结合新闻叙词库,可快速准确地提取文... 本文论述了一种新型的B^+树算法,并以此法实际应用于文稿主题词的自动提取上.新型B^+树继承了传统的B^+树的优点,并有所创新.它采用了一种新型的数据结构,使查询快速且内容全面.利用新型B^+树的算法结合新闻叙词库,可快速准确地提取文稿的主题词.主要应用于报社、图书馆等机构,方便用户,节约时间. 展开更多
关键词 主题 文稿 B+树 算法 自动抽词
全文增补中
分类法主题法一体化自动标引系统的基本原理和方法 被引量:21
11
作者 张琪玉 《图书馆论坛》 CSSCI 北大核心 1995年第6期3-4,57,共3页
本文阐述基于文献题名的自动标引系统的原理和方法,该系统是分类法主题法一体化的。文中说明了依据文献题名对文献进行分类和主题标引的可行性、从题名中自动抽词、以体系分类法为基础的自动分类用分类词表、自动分类规则及以分面分类... 本文阐述基于文献题名的自动标引系统的原理和方法,该系统是分类法主题法一体化的。文中说明了依据文献题名对文献进行分类和主题标引的可行性、从题名中自动抽词、以体系分类法为基础的自动分类用分类词表、自动分类规则及以分面分类法为基础的文献自动分类、自由体系自动分类、半自动抽词、检索系统的分类法主题法一体化检索功能、保证检索系统质量的关键因素等问题。 展开更多
关键词 自动分类 自动抽词 检索系统 分类法主题法一体化
下载PDF
汉语关键词法探讨 被引量:7
12
作者 张琪玉 《图书馆论坛》 CSSCI 北大核心 1993年第1期3-7,25,共6页
为适应图书馆改革发展形势,敝刊本着“尊重知识、尊重人才”精神,特设“图书馆名人论坛”专栏,刊登在图书馆界具有影响的专家、学者对图书馆改革与业务建设的言论,以求起到导向或争鸣作用。诚望各地专家、学者慷慨赐稿,以新颖的观点、... 为适应图书馆改革发展形势,敝刊本着“尊重知识、尊重人才”精神,特设“图书馆名人论坛”专栏,刊登在图书馆界具有影响的专家、学者对图书馆改革与业务建设的言论,以求起到导向或争鸣作用。诚望各地专家、学者慷慨赐稿,以新颖的观点、翔实的信息,引人入胜;字数不限,文体无拘,稿费从优。 展开更多
关键词 关键 中文文献 题名 自动抽词 人工
下载PDF
试论虚拟图书馆的词汇控制 被引量:7
13
作者 臧国全 《图书情报知识》 CSSCI 北大核心 2002年第1期53-55,共3页
本文从虚拟图书馆的词汇控制分析、虚拟图书馆中后控词表的实现方法以及具有后控词表的虚拟图书馆的逻辑结构分析三个方面 。
关键词 虚拟图书馆 后控 网络信息组织 网络信息检索 人工赋标引 自动抽词标引 汇控制
下载PDF
中文文献自动分类研究概述 被引量:3
14
作者 叶新明 《情报理论与实践》 CSSCI 北大核心 1992年第5期39-41,共3页
概要性地论述了中文文献自动分类的问题,提出了中文文献自动分类的一般模式, 同时也分析了要实现中文文献自动分类目前所面临的一些实际问题。
关键词 自动分类 自动抽词 自动标引
下载PDF
中文自动标引初探——正则文法的标引 被引量:1
15
作者 郁亦明 方正 《情报学报》 1987年第3期177-183,共7页
作者提出了一种根据形式文法所构成的推理库原理的中文自动标引方法。文章利用科技文献的特点,用一个比较简单的形式语言文法来描述,以利中文自动抽词,而不需对自然语言的理解。作者讨论了推理库自动生成系统、自动抽词系统、候选标... 作者提出了一种根据形式文法所构成的推理库原理的中文自动标引方法。文章利用科技文献的特点,用一个比较简单的形式语言文法来描述,以利中文自动抽词,而不需对自然语言的理解。作者讨论了推理库自动生成系统、自动抽词系统、候选标引词优化系统,以及标引系统的设计思想和方法。 展开更多
关键词 自动标引 文法 中文 自动生成系统 自动抽词 标引方法 科技文献 形式语言
下载PDF
实现汉字科技文献自动标引的字典法 被引量:1
16
作者 吴蔚天 田鹤卿 《情报学报》 1988年第2期97-105,共9页
作者们提出了实现汉字科技文献自动标引的一种语词分离方法——非用字后缀表法。文章介绍了该方法的设计思想、字典构造、自动抽词和文句切分的具体做法。文中附用非用字后缀表的实例,并给出了抽词和切分的逻辑框图以及自动标引的举例... 作者们提出了实现汉字科技文献自动标引的一种语词分离方法——非用字后缀表法。文章介绍了该方法的设计思想、字典构造、自动抽词和文句切分的具体做法。文中附用非用字后缀表的实例,并给出了抽词和切分的逻辑框图以及自动标引的举例。采用该方法在微型机上实现标引,简单易行并可获得较高的准确率。 展开更多
关键词 自动标引 科技文献 字典 汉字 分离方法 设计思想 自动抽词 准确率
下载PDF
中文自动标引与检索软件系统研制成功
17
作者 张贤俭 《图书馆杂志》 1985年第2期55-55,共1页
上海交通大学计算机中心、上海图书馆《全国报刊索引》编辑部和《应用科学学报》编辑部联合研制的中文自动抽词、自动索引、自动编排、自动检索系统,于1985年4月13日在上海市高教局主持下通过鉴定。参加鉴定的专家们认为,这一系统的研... 上海交通大学计算机中心、上海图书馆《全国报刊索引》编辑部和《应用科学学报》编辑部联合研制的中文自动抽词、自动索引、自动编排、自动检索系统,于1985年4月13日在上海市高教局主持下通过鉴定。参加鉴定的专家们认为,这一系统的研制成功标志着中文信息处理从探索进入实用的新阶段。 展开更多
关键词 研制成功 全国报刊索引 中文信息处理 上海图书馆 自动检索系统 联合研制 自动索引 编辑部 计算机中心 自动抽词
下载PDF
北大“汉语科技文献自动标引系统”通过签定
18
作者 王雅丽 《现代图书情报技术》 1987年第2期37-37,共1页
关键词 汉语科 自动标引 北大 自动抽词 汉语文献 机械工程 主题 文摘 切分 标引要求
下载PDF
大数据时代数字资源的主题标引研究 被引量:10
19
作者 肖雯 李鑫 《图书馆理论与实践》 CSSCI 北大核心 2016年第11期67-70,共4页
主题标引是对数字资源进行组织的有效手段,标引的质量直接影响到数字资源的质量和利用,因此,大数据时代应重视主题标引的发展。本文在对国内外数字资源的主题标引现状进行调研的基础上,分析了大数据时代数字资源主题标引面临的挑战,探... 主题标引是对数字资源进行组织的有效手段,标引的质量直接影响到数字资源的质量和利用,因此,大数据时代应重视主题标引的发展。本文在对国内外数字资源的主题标引现状进行调研的基础上,分析了大数据时代数字资源主题标引面临的挑战,探讨了数字资源主题标引的发展趋势。 展开更多
关键词 自动标引 受控标引 自然语言标引 自动抽词标引 自动标引
下载PDF
引索概念的鉴别和标引——人工标引规律探索之一 被引量:2
20
作者 梁树柏 董剑英 《情报杂志》 CSSCI 北大核心 2002年第10期F002-F002,共1页
人工标引注重对文献整体的把握 ,通过分析文献语词之间、概念之间的联系 ,力求使文献记录的思维重现 ,再把得到的思维转换成检索语言。
关键词 索引概念 检索语言 人工标引 思维标引 真概念 标引规律 自动抽词标引
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部