期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于内容的中文网页自动分类系统
1
作者 孙瑶琴 《中国校外教育》 2009年第7期161-161,共1页
文章阐述了国内在基于内容的中文网页自动分类方面所做研究工作的发展现状,分析了已有工作的特点;在此基础上,结合自己的工作提出了一个基于内容的中文网页自动分类系统分析。给出了系统的总体结构设计思想和总体结构框架,以及组成系统... 文章阐述了国内在基于内容的中文网页自动分类方面所做研究工作的发展现状,分析了已有工作的特点;在此基础上,结合自己的工作提出了一个基于内容的中文网页自动分类系统分析。给出了系统的总体结构设计思想和总体结构框架,以及组成系统的各个模块的功能和结构描述。按照该系统的设计思想和进一步的详细设计可以搭建一个系统化的、功能较为全面的、具有较高效率的中文网页自动分类系统平台。 展开更多
关键词 中文网页自动分类系统 文本 特征 分类 测试
下载PDF
一种基于Oracle Text的中文网页自动分类系统
2
作者 刘杰 刘冰 +1 位作者 刘猛 陈晓红 《网络安全技术与应用》 2007年第5期72-74,共3页
Oracle Text是一种创建文本搜索和文档分类应用的技术。本文提出了一种基于该技术实现中文网页自动分类系统的解决方案。实验结果表明该方案准确有效,具有较好的性能,满足中文网页自动分类的需求。
关键词 ORACLE TEXT 中文网页 自动分类
原文传递
中文网页自动分类现状的研究 被引量:1
3
作者 张莉 康耀红 +1 位作者 王曙光 张春元 《福建电脑》 2004年第5期3-4,共2页
本文重点阐述中文网页自动分类关键技术的现状,介绍分析了两个中文网页自动分类系统。并在文章最后对未来研究提出建议。
关键词 中文网页自动分类系统 特征提取 分类算法 网页
下载PDF
中文文档自动分类系统的设计与实现 被引量:45
4
作者 邹涛 王继成 +1 位作者 黄源 张福炎 《中文信息学报》 CSCD 北大核心 1999年第3期26-32,共7页
文档自动分类是信息处理领域中的一项重要研究课题。本文阐述了一个中文文档自动分类系统的设计与实现,并着重介绍了系统实现中的一些主要技术问题的处理,如文本分类模型、特征提取、词典构造等。
关键词 VSM 特征提取 中文文档 文档分类 自动分类系统
下载PDF
一个基于向量空间模型的中文文本自动分类系统 被引量:45
5
作者 朱华宇 孙正兴 张福炎 《计算机工程》 CAS CSCD 北大核心 2001年第2期15-17,63,共4页
介绍了一个基于向量空间模型的中文文本自动分类系统,重点阐述了特征提取、空间降维、层次分类和分类器训练等技术的实现方法。实践表明:该系统对文本分类具有较高的平均查全率和平均精度。
关键词 中文文本自动分类系统 向量空间模型 自然语言处理
下载PDF
基于知识库的网页自动标引和自动分类系统的设计 被引量:37
6
作者 侯汉清 薛鹏军 《大学图书馆学报》 CSSCI 北大核心 2004年第1期50-55,64,共7页
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库... 针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。 展开更多
关键词 知识库 网页标引 自动标引 自动分类系统 概念语义网络
下载PDF
基于内容的中文网页自动分类研究 被引量:5
7
作者 张义忠 赵明生 朱精南 《信息与控制》 CSCD 北大核心 2001年第5期408-412,共5页
本文主要介绍基于内容的网页自动分类系统 ,具体介绍了类别词典的建造方法 ,网页超文本类别词切分的方法 ,中文网页自动分类算法以及利用类别词与网页间的模糊关系对网页文本进行自动分类等内容 .通过对旅游网页进行测试 ,自动分类正确... 本文主要介绍基于内容的网页自动分类系统 ,具体介绍了类别词典的建造方法 ,网页超文本类别词切分的方法 ,中文网页自动分类算法以及利用类别词与网页间的模糊关系对网页文本进行自动分类等内容 .通过对旅游网页进行测试 ,自动分类正确率可达 93.37%以上 。 展开更多
关键词 自动分类 信息检索 中文网页 计算机网络
下载PDF
关于“中文网页自动分类竞赛”结果的分析 被引量:6
8
作者 冯是聪 王继民 《中文信息学报》 CSCD 北大核心 2003年第5期34-40,共7页
在最近召开的"全国搜索引擎与网上信息挖掘学术研讨会"上,举办了一场"中文网页自动分类竞赛",共有来自全国各地的10个队参加。本文在介绍本次竞赛活动规则和过程的基础上,详细分析了竞赛的结果,从而使我们对于目前... 在最近召开的"全国搜索引擎与网上信息挖掘学术研讨会"上,举办了一场"中文网页自动分类竞赛",共有来自全国各地的10个队参加。本文在介绍本次竞赛活动规则和过程的基础上,详细分析了竞赛的结果,从而使我们对于目前中文网页自动分类技术的现状有了一种具体的认识:目前已有分类器的性能没有呈现出明显的差距,中文网页的分类比普通文本的分类要困难的多。同时,本文还尝试推出一个标准的中文网页分类的实例样本集,希望通过不断完善,最终作为中文网页分类技术研究的基本语料。 展开更多
关键词 计算机应用 中文信息处理 机器学习 中文网页自动分类 TREC评测
下载PDF
基于标题的中文新闻网页自动分类 被引量:7
9
作者 钱爱兵 江岚 《现代图书情报技术》 CSSCI 北大核心 2008年第10期59-68,共10页
借鉴tf-idf加权思想,利用新闻标题来做中文新闻网页自动分类的依据,构建基于标题的中文新闻自动分类方法,并设计多个实验对各种基于标题的中文新闻网页自动分类方法进行评测。实验结果表明,基于标题对中文新闻网页进行自动分类,可以大... 借鉴tf-idf加权思想,利用新闻标题来做中文新闻网页自动分类的依据,构建基于标题的中文新闻自动分类方法,并设计多个实验对各种基于标题的中文新闻网页自动分类方法进行评测。实验结果表明,基于标题对中文新闻网页进行自动分类,可以大大缩短判断处理时间,节省存储空间,且准确率较高,特别是改进的类目加权法分类效果最好。 展开更多
关键词 词频/逆文档频率 新闻标题 中文新闻网页 自动分类
下载PDF
中文网页自动分类研究 被引量:3
10
作者 徐德智 阳绿云 《计算机工程与科学》 CSCD 2001年第6期33-35,42,共4页
本文以实践经验为基础 ,对网页的源程序公共结构进行了分析 ,并充分考虑到中文网页的文字特点 ,给出了一种中文网页的分类方法与实现手段 。
关键词 中文网页 自动分类 WWW 信息搜索 INTERNET
下载PDF
一个网页自动分类系统的设计 被引量:2
11
作者 谭立球 谷士文 费耀平 《计算技术与自动化》 2002年第1期58-61,共4页
本文介绍了设计的一个网页自动分类系统。介绍了预处理 ,批量训练 ,特征选择 ,在线测试和重归档等模块的设计过程。系统采用有指导的学习方法 ,选取 Naive Bayes作分类模型和信息增益作为特征提取方法。测试结果表明 。
关键词 简单贝叶斯 信息增益 监督学习 网页自动分类系统 设计 INTERNET 计算机网络
下载PDF
中文网页分类查询系统的设计与实现
12
作者 崔伟东 李 星 《计算机工程与应用》 CSCD 北大核心 2000年第11期144-147,共4页
分类查询是网络信息检索的重要组成部分.文章介绍了一个中文网页分类查询系统的设计与实现方法.由于人工分类费时费力,而自动分类需要大量训练数据,因此在实现该系统时提出了一种基于用户推荐机制的解决方案.
关键词 搜索引擎 信息检索 中文网页分类查询系统 设计
下载PDF
面向教学的网页自动分类系统的设计和实现 被引量:1
13
作者 强庆华 王强 +1 位作者 王继成 武港山 《计算机工程》 CAS CSCD 北大核心 2002年第8期107-110,共4页
提出一个面向教学的页面自动分类的框架,并详细叙述了这一框架的实现。重点在于页面元数据的提取,页面特征的选取和量Web化。系统采用基于决策树的分类方法,采用机器学习算法,通过对大量人工标注页面的学习形成分类规则,并利用链接相关... 提出一个面向教学的页面自动分类的框架,并详细叙述了这一框架的实现。重点在于页面元数据的提取,页面特征的选取和量Web化。系统采用基于决策树的分类方法,采用机器学习算法,通过对大量人工标注页面的学习形成分类规则,并利用链接相关性对分类结C4.5果进行优化,以提高精度。 展开更多
关键词 机器学习 WEB 信息检索 计算机网络 教学 网页自动分类系统 设计
下载PDF
基于向量空间模型的文本自动分类系统的研究与实现 被引量:293
14
作者 庞剑锋 卜东波 白硕 《计算机应用研究》 CSCD 北大核心 2001年第9期23-26,共4页
随着网络信息的迅猛发展 ,信息处理已经成为人们获取有用信息不可缺少的工具。文本自动分类系统是信息处理的重要研究方向 ,它是指在给定的分类体系下 ,根据文本的内容自动判别文本类别的过程。对文本分类中所涉及的关键技术 ,包括向量... 随着网络信息的迅猛发展 ,信息处理已经成为人们获取有用信息不可缺少的工具。文本自动分类系统是信息处理的重要研究方向 ,它是指在给定的分类体系下 ,根据文本的内容自动判别文本类别的过程。对文本分类中所涉及的关键技术 ,包括向量空间模型、特征提取、机器学习方法等进行了研究和探讨 ,并且提出了基于向量空间模型的文本分类系统的结构 。 展开更多
关键词 中文信息处理 向量空间模型 文本自动分类系统 人工智能 计算机
下载PDF
基于VSM的中文网页自动分类模型
15
作者 陈鑫 《晋东南师范专科学校学报》 2004年第2期34-35,共2页
通过对文本分类的相关技术进行深入研究 。
关键词 中文网页 自动分类模型 中文信息处理 信息检索 文本分类 VSM 向量空间模型
下载PDF
中文文献自动分类系统——以肿瘤学专业文献为例
16
作者 金巍 《文献工作研究》 1995年第5期23-23,共1页
关键词 中文文献 自动分类系统 计算机 文献标引
下载PDF
中文自动分类在搜索引擎中的应用研究 被引量:2
17
作者 李红宇 刘庆江 《计算机科学》 CSCD 北大核心 2008年第5期292-293,297,共3页
为了提高搜索引擎的查准率,帮助用户快速地定位其感兴趣的网页,可应用中文网页自动分类技术,实现快速准确的搜索引擎系统,使其具有较高的查准率。
关键词 中文自动分类 搜索引擎 WEB挖掘 网页
下载PDF
中文文献自动分类的理论与实践 被引量:9
18
作者 朱兰娟 《情报学报》 1987年第6期433-437,共5页
本文介绍的中文文献自动分类实践,是基于文献主题属性的分析,运用概率标引技术和Bayes分类准则等理论依据,防人工实际工作过程而实现的一种仿人算法。系统使用了以加权的题中关键词为基础的切实可行的方法,借助中文文献自动抽词系... 本文介绍的中文文献自动分类实践,是基于文献主题属性的分析,运用概率标引技术和Bayes分类准则等理论依据,防人工实际工作过程而实现的一种仿人算法。系统使用了以加权的题中关键词为基础的切实可行的方法,借助中文文献自动抽词系统的技术成果,以期达到科学性、继承性、实用性兼顿的目的。算法在微型机IBM-5550上实现。 展开更多
关键词 理论与实践 自动分类 中文文献 仿人算法 系统使用 文献主题 标引技术 技术成果
下载PDF
用于中文信息自动分类的《中图法》知识库的构建 被引量:3
19
作者 侯汉清 薛春香 《中国索引》 2005年第3期31-36,共6页
分类号、主题词、关键词是三种主题概念标识,三者之间存在着概念对应关系,即兼容关系。中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干组织各学... 分类号、主题词、关键词是三种主题概念标识,三者之间存在着概念对应关系,即兼容关系。中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。本文详细讨论了该知识库的构建原理、结构、编制使用的关键技术以及主要应用等。 展开更多
关键词 《中国图书馆分类法》《中国分类主题词表》知识库 知识组织系统 自动标引 自动分类 中文文献数据库 信息自动分类 《中图法》 知识库 主题概念 对应关系
下载PDF
基于Google Web API的中文训练库自动获取方法研究 被引量:1
20
作者 胡燕 张颂扬 《计算机与数字工程》 2008年第5期8-10,共3页
主要研究中文训练库自动获取方法,提出基于Google Web API的方法收集训练样本,然后给出自动获取训练库的方法。通过实验,初步实现中文训练库的自动建立。
关键词 中文网页自动分类 训练库 GOOGLE WEB API
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部