期刊文献+
共找到117篇文章
< 1 2 6 >
每页显示 20 50 100
基于供需理论的生成式人工智能赋能情报工作范式模型构建与应用研究 被引量:7
1
作者 白如江 陈鑫 任前前 《情报理论与实践》 CSSCI 北大核心 2024年第1期75-83,共9页
[目的/意义]当前生成式人工智能的发展对社会产生了强烈冲击。为响应国家创新发展的迫切需求,如何利用生成式人工智能更好地完成情报工作,以满足用户的情报需求,已成为当前情报学领域关注的热点问题。[方法/过程]基于供需理论提出从数... [目的/意义]当前生成式人工智能的发展对社会产生了强烈冲击。为响应国家创新发展的迫切需求,如何利用生成式人工智能更好地完成情报工作,以满足用户的情报需求,已成为当前情报学领域关注的热点问题。[方法/过程]基于供需理论提出从数据供给侧(Supply)、智慧情报分析中台(Analysis)、情报需求侧(Demand)三方构建生成式人工智能赋能情报工作范式模型——SAD范式模型,深入分析生成式人工智能赋能情报工作机理,并结合国际前沿项目案例探讨生成式人工智能与情报工作的前瞻性融合发展。[结果/结论]生成式人工智能赋能情报工作范式模型SAD,可以更好地促进生成式人工智能赋能情报工作的各个环节,提高情报工作效率,为情报工作范式研究提供了新思路。 展开更多
关键词 供需理论 生成式人工智能 情报工作 范式模型
下载PDF
信息资源管理一级学科更名背景下研究主题历史演化及未来发展趋势研究
2
作者 白如江 任前前 陈鑫 《现代情报》 CSSCI 北大核心 2024年第2期43-54,共12页
[目的/意义]为服务国家重大战略需求,抓住学科更名的历史机遇,把握一级学科的整体发展脉络成为构建中国自主的信息资源管理知识体系的重要环节。[方法/过程]以CNKI收录的学科核心期刊文献为数据源,首先采用K-Means聚类算法以及融合TF-ID... [目的/意义]为服务国家重大战略需求,抓住学科更名的历史机遇,把握一级学科的整体发展脉络成为构建中国自主的信息资源管理知识体系的重要环节。[方法/过程]以CNKI收录的学科核心期刊文献为数据源,首先采用K-Means聚类算法以及融合TF-IDF算法和LDA主题模型的分类方法计算最佳主题数量并识别研究主题内容;然后从更名前后的主题强度、主题新颖度、研究主题发展变化情况3个方面深入分析;最后,本研究提出主题词交叉联立的分析方法预测研究主题未来发展方向。[结果/结论]信息资源管理一级学科的更名会刺激新主题的产生与发展,新主题在研究内容、研究范围等方面的拓展反过来丰富了本学科的内涵和外延,对于学科未来的守正创新发展具有一定参考价值。 展开更多
关键词 信息资源管理 学科更名 一级学科 研究主题 发展演变
下载PDF
基于引文-主题双重测度的交叉前沿识别研究
3
作者 白如江 张亚辉 +2 位作者 张玉洁 鞠孜涵 冯梦莹 《现代情报》 CSSCI 北大核心 2024年第10期27-40,63,共15页
[目的/意义]交叉学科正在成为我国科技创新的重要驱动力,并不断催生新的科学前沿。如何识别并测度交叉前沿主题,对于理解学科知识流转、把握新的交叉前沿方向至关重要。[方法/过程]本文从引文分析和主题分析相结合的角度,提出基于引文... [目的/意义]交叉学科正在成为我国科技创新的重要驱动力,并不断催生新的科学前沿。如何识别并测度交叉前沿主题,对于理解学科知识流转、把握新的交叉前沿方向至关重要。[方法/过程]本文从引文分析和主题分析相结合的角度,提出基于引文—主题双重测度的交叉前沿识别方法。首先,综合运用自然语言处理、文本主题识别、引文关系矩阵等方法获取交叉主题;其次,通过构建基于引文—主题的交叉测度指标进一步遴选交叉主题;最后,提出主题影响力、新颖度、吸引度及热度的多维测度指标,获取交叉前沿。[结果/结论]通过信息科技与宇航交叉领域进行实证研究,结果表明该方法能够有效识别出该领域的热点交叉前沿、新兴交叉前沿、潜在交叉前沿以及衰弱交叉前沿。 展开更多
关键词 学科交叉 研究前沿 交叉前沿 引文—主题识别方法 多维测度指标
下载PDF
基于内容挖掘的学术论文影响力研究现状与展望 被引量:1
4
作者 辛晓梦 白如江 +1 位作者 孔玲 王效岳 《数字图书馆论坛》 CSSCI 2024年第1期23-32,共10页
当前,以ChatGPT为代表的人工智能技术飞速发展,文本挖掘平台的功能优化加快有关内容挖掘的学术论文影响力研究进程,全面梳理基于内容挖掘的学术论文影响力测度的研究现状和进展迫在眉睫。通过梳理国内外利用内容挖掘方法测度学术论文影... 当前,以ChatGPT为代表的人工智能技术飞速发展,文本挖掘平台的功能优化加快有关内容挖掘的学术论文影响力研究进程,全面梳理基于内容挖掘的学术论文影响力测度的研究现状和进展迫在眉睫。通过梳理国内外利用内容挖掘方法测度学术论文影响力的研究,提出从学术、社会和技术3个维度阐述学术论文影响力的内涵。在其基础上,以时间为轴线,重点论述“学术论文影响什么、怎么影响,以及影响程度如何”的相关内容,深入阐述借助内容挖掘技术的学术论文影响力测度指标和方法。目前,基于内容挖掘的学术论文影响力测度还需利用以ChatGPT为代表的文本挖掘平台和数智技术进一步挖掘相关语义特征,深入探究引文背后的影响机制及理论,尝试从学术、社会和技术等维度,词语、句子、篇章等粒度深入文本内容,综合测度论文影响力。 展开更多
关键词 学术论文 内容挖掘 学术影响力 社会影响力 技术影响力
下载PDF
面向情报感知的多源多模态数据融合方法研究 被引量:8
5
作者 白如江 鞠孜涵 +2 位作者 张玉洁 张亚辉 冯梦莹 《情报杂志》 CSSCI 北大核心 2023年第10期124-131,共8页
[研究目的]针对多源多模态数据在情报感知应用中存在的问题,在梳理多源多模态数据融合方法的基础上提出一种新的多模态数据融合思路,以支撑细粒度情报感知的相关研究。[研究方法]首先,系统梳理了情报感知和多源多模态数据的特征,总结了... [研究目的]针对多源多模态数据在情报感知应用中存在的问题,在梳理多源多模态数据融合方法的基础上提出一种新的多模态数据融合思路,以支撑细粒度情报感知的相关研究。[研究方法]首先,系统梳理了情报感知和多源多模态数据的特征,总结了多源多模态数据融合面临的挑战。其次,从不同的融合粒度详细调研了多源异构数据的融合方法;从不同的融合深度总结了多模态数据的语义融合方法。最后,提出了时序数据和地理空间数据辅助的多模态数据融合思路。[研究结论]面向情报感知的多源多模态数据融合中,细粒度的融合是基础,语义融合是核心,基于深度学习的融合方法是大势所趋,基于异质图神经网络的融合方法推动了情报感知更准确、全面和智慧的发展。 展开更多
关键词 情报感知 多源多模态数据 数据融合 细粒度 语义融合
下载PDF
科研数据学术不端影响因素研究 被引量:4
6
作者 白如江 秦明艳 张玉洁 《科技进步与对策》 CSSCI 北大核心 2023年第20期110-121,共12页
系统分析我国科研数据学术不端影响因素,为构建我国科研数据学术不端预防机制提供新依据、新思路。首先,采用匿名反馈函询法构建我国科研数据学术不端影响因素体系,抽取影响因素集。其次,利用决策实验室分析法生成综合影响矩阵,明晰各... 系统分析我国科研数据学术不端影响因素,为构建我国科研数据学术不端预防机制提供新依据、新思路。首先,采用匿名反馈函询法构建我国科研数据学术不端影响因素体系,抽取影响因素集。其次,利用决策实验室分析法生成综合影响矩阵,明晰各因素因果属性及其重要程度,识别关键影响因素。最后,基于解释结构模型法构建影响因素多级递阶结构模型,形成最简层次化有向拓扑图,深入分析因素间逻辑层次关系。研究发现,我国科研数据学术不端受多元因素综合影响,包含个人、组织、期刊、社会4个维度11个因素;不同因素的因果属性、重要程度存在差异,其中,科研诚信环境、监督惩治机制、数据审查、数据学术不端检测技术、论文代写代发属于关键影响因素;因素间存在浅表层、过渡层、本质层3层逻辑层次关系,且存在跨级关联现象。为构建我国科研数据学术不端预防机制,提出综合多元因素、协调多方配合,把握关键制控点、强化推动作用,立足层次关系、开展阶梯管理等新思路。 展开更多
关键词 科研数据 科研伦理 学术不端 决策实验室分析法 解释结构模型法
下载PDF
数据融合视角下颠覆性技术的演化脉络与演化特征研究 被引量:5
7
作者 刘博文 白如江 《科技管理研究》 CSSCI 北大核心 2023年第8期32-41,共10页
为有效利用现存文献资源,深度剖析和挖掘颠覆性技术的演化脉络与演化特征,为把握科学动向、提升科技竞争力提供支撑,在系统梳理颠覆性技术演化相关研究进展的基础上,融合Web of Science论文、德温特专利索引数据库专利和美国临床试验数... 为有效利用现存文献资源,深度剖析和挖掘颠覆性技术的演化脉络与演化特征,为把握科学动向、提升科技竞争力提供支撑,在系统梳理颠覆性技术演化相关研究进展的基础上,融合Web of Science论文、德温特专利索引数据库专利和美国临床试验数据库临床试验等数据源,运用主题识别、深度学习、网络分析、可视化分析等技术,利用专利、论文文献的Word2Vec词向量模型构建结果和LDA主题识别结果,结合临床试验应用范围,研究干细胞治疗技术在“科学发现—技术创新—技术应用”生命周期中的演化脉络与演化特征。实验结果梳理得到干细胞治疗技术发展演化路线图,分为萌芽期、起步期、突变发展期和快速发展期4个阶段,并分别从数据表现、实证技术本身和颠覆性技术3个层面归纳技术发展的滞后性、复合性、突变性、扩张性等4个演化特征,与干细胞治疗技术发展的科学事实以及当前学界对其的基本认识均相符。 展开更多
关键词 颠覆性技术 数据融合 深度学习 技术路线 干细胞治疗技术
下载PDF
复杂信息环境下多源数据情报价值发现研究
8
作者 鞠孜涵 白如江 +2 位作者 冯梦莹 张亚辉 辛晓梦 《图书与情报》 CSSCI 北大核心 2023年第3期61-70,共10页
复杂信息环境下,情报数据更多源,结构更复杂,规模更庞大,如何从多源数据中及时甄别出有情报价值的信息是当前亟待解决的问题。文章深入分析了复杂信息环境给多源数据情报价值发现提出的新要求。在此基础上,提出了多源数据情报价值发现... 复杂信息环境下,情报数据更多源,结构更复杂,规模更庞大,如何从多源数据中及时甄别出有情报价值的信息是当前亟待解决的问题。文章深入分析了复杂信息环境给多源数据情报价值发现提出的新要求。在此基础上,提出了多源数据情报价值发现模型。首先,构建动态的多源数据空间;其次,从多源数据外部基础特征、内容语义特征以及用户情报需求特征3个维度分别提出了情报价值发现的设计方案。复杂信息环境下,多源数据的情报价值发现需要快速感知、细粒度挖掘、精细化研判和智能化分析。需要时刻关注用户的情报需求,并结合深度学习等技术实现多源数据情报价值发现的高效化、精准化和智能化发展。 展开更多
关键词 情报价值 多源数据 复杂信息环境 语义特征 情报需求
下载PDF
数字人文视域下稷下人物知识重构与时空可视化研究
9
作者 张亚辉 白如江 +2 位作者 张玉洁 耿振东 王志民 《数字图书馆论坛》 CSSCI 2023年第6期1-12,共12页
数字人文视域下,以稷下人物事件梳理史实脉络,实现人物、时间、地点、事件、思想影响、研究记载等多元数据的重构和时空可视化,对于分析稷下人物的思想变化及历史意义至关重要。首先构建稷下人物元数据组织描述规范,形成统一的知识表述... 数字人文视域下,以稷下人物事件梳理史实脉络,实现人物、时间、地点、事件、思想影响、研究记载等多元数据的重构和时空可视化,对于分析稷下人物的思想变化及历史意义至关重要。首先构建稷下人物元数据组织描述规范,形成统一的知识表述和组织规范;其次,利用事件抽取、思想分类等技术对研究文本进行细粒度处理,以时间叙事为主、事件叙事为辅进行知识重构;最后,利用地理信息系统可视化技术实现重构知识的时空可视化。通过对稷下人物规范化组织与重构,解决数字人文研究中历史人物数据碎片化和关联性不足等问题,并充分挖掘稷下人物隐性知识,丰富稷下人物知识发现视角与可视化维度,为数字人文知识发现与利用提供新思路。 展开更多
关键词 知识重构 人物历程 时空可视化 稷下人物 数字人文
下载PDF
单篇学术论文评价研究现状与发展趋势 被引量:26
10
作者 白如江 杨京 王效岳 《情报理论与实践》 CSSCI 北大核心 2015年第11期11-17,共7页
学术论文作为科学研究的主要成果形式之一,如何有效评价学术论文的学术水平和影响力一直是文献计量学领域的研究重点。文章在分析学术论文评价外在与内在影响因素的基础之上,梳理了目前国内外主要的学术论文评价方法,包括基于外在引用... 学术论文作为科学研究的主要成果形式之一,如何有效评价学术论文的学术水平和影响力一直是文献计量学领域的研究重点。文章在分析学术论文评价外在与内在影响因素的基础之上,梳理了目前国内外主要的学术论文评价方法,包括基于外在引用指标分析方法、基于网络分析方法、同行评议方法、替代计量学方法、基于论文内容评价方法、综合评价方法。最后,指出了学术论文评价方法的未来发展趋势。 展开更多
关键词 学术论文 影响因素 评价方法 替代计量学 研究现状 发展趋势
下载PDF
科学研究前沿探测主要方法比较与发展趋势研究 被引量:41
11
作者 白如江 冷伏海 廖君华 《情报理论与实践》 CSSCI 北大核心 2017年第5期33-38,共6页
[目的/意义]梳理科学研究前沿的基本概念,归纳目前科学研究前沿探测的主要方法以及这些方法的主要特点,寻找影响科学研究前沿探测的主要因素并揭示未来发展趋势。[方法/过程]利用文献调研方法对相关理论进行梳理分析。[结果/结论]对比... [目的/意义]梳理科学研究前沿的基本概念,归纳目前科学研究前沿探测的主要方法以及这些方法的主要特点,寻找影响科学研究前沿探测的主要因素并揭示未来发展趋势。[方法/过程]利用文献调研方法对相关理论进行梳理分析。[结果/结论]对比分析了目前科学研究前沿探测研究中主要使用的引文分析和主题词分析两种方法;指出了目前存在的3个方面的问题,即:引文分析时滞性问题、缺乏语义信息支持问题以及分析数据源无法有效融合;探讨了科学研究前沿探测未来发展方向。 展开更多
关键词 科学研究前沿 研究方法 发展趋势
下载PDF
一种基于多数据源主题对比的科学研究前沿识别方法 被引量:24
12
作者 白如江 冷伏海 廖君华 《情报理论与实践》 CSSCI 北大核心 2017年第8期43-48,36,共7页
[目的/意义]提升科技文献语义理解,提高科学研究前沿识别的前瞻性和细化识别主题粒度。[方法/过程]利用蕴含更多前瞻价值信息的科技规划、基金项目数据,运用语义挖掘技术实现文本内容的深度语义理解。通过对科技规划文本和基金项目数据... [目的/意义]提升科技文献语义理解,提高科学研究前沿识别的前瞻性和细化识别主题粒度。[方法/过程]利用蕴含更多前瞻价值信息的科技规划、基金项目数据,运用语义挖掘技术实现文本内容的深度语义理解。通过对科技规划文本和基金项目数据文本两种不同数据源中蕴含的科学研究前沿主题相似度对比分析,采用新兴度和热点度两个指标,识别出新兴研究前沿主题和热点研究主题两类科学研究前沿主题,进而揭示出前沿领域竞争态势。[结果/结论]利用文章提出的方法对碳纳米管研究领域研究前沿进行识别,对识别结果分别采用专家咨询和论文数据证据方法进行验证,结果证明方法是有效、可行的。 展开更多
关键词 科学研究前沿 识别方法 主题分析 多数据源
下载PDF
“大数据”时代科学数据整合研究 被引量:73
13
作者 白如江 冷伏海 《情报理论与实践》 CSSCI 北大核心 2014年第1期94-99,共6页
随着信息与网络技术的发展,科学研究过程中产生出了大量的原生数字科学数据。在"大数据"时代,科学数据日趋发展的今天,整合集成科学数据,实现科学数据共享与互操作具有重要的意义。文章首先梳理了与"大数据"有关的... 随着信息与网络技术的发展,科学研究过程中产生出了大量的原生数字科学数据。在"大数据"时代,科学数据日趋发展的今天,整合集成科学数据,实现科学数据共享与互操作具有重要的意义。文章首先梳理了与"大数据"有关的基本概念以及相关研究发展脉络,然后针对"大数据"环境下科学研究的特点,指出了"大数据"时代科学数据整合的挑战。详细论述了目前科学数据整合的主要理论与方法,并选取了3个具有代表性的科学数据整合系统平台进行了介绍。 展开更多
关键词 大数据 科学数据 整合研究
下载PDF
语义增强的科技创新内容表征研究 被引量:6
14
作者 白如江 祝娜 王效岳 《情报理论与实践》 CSSCI 北大核心 2016年第3期73-79,共7页
[目的/意义]随着计算机信息处理技术以及文本数据挖掘技术的发展,研究人员开始利用语义分析技术深入分析科技文献文本数据,识别出科技文献中的科技创新内容,以期为科技创新和科技决策提供支持和帮助。[方法/过程]文章通过分析科技创新... [目的/意义]随着计算机信息处理技术以及文本数据挖掘技术的发展,研究人员开始利用语义分析技术深入分析科技文献文本数据,识别出科技文献中的科技创新内容,以期为科技创新和科技决策提供支持和帮助。[方法/过程]文章通过分析科技创新内容结构分布特征,以句子为最小标引粒度,利用Keygraph算法抽取出科技文献摘要中的关键词进行科技创新内容特征选择,基于SVM的语义角色标注技术完成科技创新内容的语义表征。[结果/结论]实验结果表明,语义增强的科技创新表征方法可以基本实现科技创新内容的语义标引。 展开更多
关键词 语义增强 科技创新 算法 支持向量机
下载PDF
基于支持向量机和核心特征词的科技文献自动标引研究 被引量:5
15
作者 白如江 王晓笛 王效岳 《情报理论与实践》 CSSCI 北大核心 2014年第7期129-134,共6页
科技文献通常包括研究目的、方法、结果和结论等信息,如何将科技文献标引上这些信息,帮助科研人员在数量巨大的文献中快速发现符合研究需要的内容显得尤为重要。文章在研究分析科技文献写作特点基础上,提出了基于词、英文(专有名词、缩... 科技文献通常包括研究目的、方法、结果和结论等信息,如何将科技文献标引上这些信息,帮助科研人员在数量巨大的文献中快速发现符合研究需要的内容显得尤为重要。文章在研究分析科技文献写作特点基础上,提出了基于词、英文(专有名词、缩写词)以及数字的核心特征词提取策略;然后将科技文献标引问题转化为句子分类问题,结合提出的核心特征词,采用支持向量机分类器对科技文献进行句子级别的语义标引。通过对1168篇糖尿病医学类论文实验,证明本文提出的方法能够有效地学习和标引科技文献中的句子,进而有效地对科技文献关键信息点进行自动标引。 展开更多
关键词 自动标引 支持向量机 特征提取 科技文献
下载PDF
科学事件知识图谱构建研究 被引量:9
16
作者 白如江 周彦廷 +1 位作者 王效岳 王志民 《情报理论与实践》 CSSCI 北大核心 2020年第9期107-114,124,共9页
[目的/意义]在新的信息背景下,以文献为单元的知识组织方式已经无法满足用户的需求,对科学文献的语义化与结构化的知识组织研究成为目前图情领域研究的热点之一。[方法/过程]文章通过提出科学事件的概念,在现有科研元数据以及知识元框... [目的/意义]在新的信息背景下,以文献为单元的知识组织方式已经无法满足用户的需求,对科学文献的语义化与结构化的知识组织研究成为目前图情领域研究的热点之一。[方法/过程]文章通过提出科学事件的概念,在现有科研元数据以及知识元框架的理论基础上,构建了科学事件元数据模型,将科学元事件划分为科学事件主语、科学事件谓语、科学事件宾语三个部分。利用LTP语言云根据本文所构建的科学事件元数据模型,对图情领域的科学文献进行科学事件的语义化与结构化知识组织,将所得数据存入图数据库Neo4j中并构建了以图情领域为例的科学事件知识图谱。[结果/结论]实验结果证实了文章所提方法可行有效。 展开更多
关键词 知识元 元数据 知识元描述模型 科学文献 知识图谱
下载PDF
智能化企业竞争情报系统研究 被引量:3
17
作者 白如江 王尊新 鲍翠梅 《情报杂志》 CSSCI 北大核心 2004年第8期84-85,共2页
在分析了传统企业竞争情报系统的基础上,构筑了智能化企业竞争情报系统,并详细阐述了其系统结构。
关键词 企业管理 竞争情报系统 智能化系统 数学模型
下载PDF
基于混合内容线索特征的语义组块标注研究 被引量:3
18
作者 白如江 冷伏海 廖君华 《情报学报》 CSSCI CSCD 北大核心 2017年第4期382-391,共10页
大数据时代背景下,实现科技文献深层语义理解逐渐成为情报学研究的热点话题,本文利用词频统计和共词分析方法分析了科技文献内容浅层语法特征、上下文特征和核心线索词特征,构建了混合内容线索特征集合,采用条件随机场模型,对NSF碳纳米... 大数据时代背景下,实现科技文献深层语义理解逐渐成为情报学研究的热点话题,本文利用词频统计和共词分析方法分析了科技文献内容浅层语法特征、上下文特征和核心线索词特征,构建了混合内容线索特征集合,采用条件随机场模型,对NSF碳纳米管研究领域项目数据进行了语义组块标注实验。实验结果表明,在B-SUB、I-SUB、B-ACT、I-ACT、B-GOL、I-GOL、B-IMP7种标签标注中,增加混合内容线索特征后的精度值分别达到84.43%、89.09%、84.38%、89.87%、51.33%、50.37%、37.83%,与没有增加的标注结果相比精度值有了明显提升。特别是B-SUB、I-SUB、B-ACT、I-ACT四种标签,在增加了内容线索特征后精度值提升了10%以上。 展开更多
关键词 内容线索特征 条件随机场 语义组块标注
下载PDF
基于大规模搜索日志的中文长句查询分析研究 被引量:2
19
作者 白如江 杨振瑜 王效岳 《情报学报》 CSSCI 北大核心 2013年第10期1090-1098,共9页
本文利用大规模搜索日志对用户中文长句查询的情况进行了统计研究。通过分析搜索日志中的中文长句查询确定了经常发生的查询类型特点,并对用户搜索行为与查询长度、查询类型和查询频率的关系进行了研究。进一步了解了session中用户查... 本文利用大规模搜索日志对用户中文长句查询的情况进行了统计研究。通过分析搜索日志中的中文长句查询确定了经常发生的查询类型特点,并对用户搜索行为与查询长度、查询类型和查询频率的关系进行了研究。进一步了解了session中用户查询词修改情况,总结了用户查询修改方法和长度修改方面的特征和规律。最后,将不同长度的查询放到了三个商业搜索引擎中分别进行检索,计算其重叠率。通过以上的分析研究发现虽然目前大部分查询都是短查询,但短查询并不能满足用户所有的检索需求,特别是在搜索引擎向语义检索不断发展的今天,长句检索的分析和利用能够从更深层次上了解用户的查询用语特点和搜索点击行为,这对于查询技术的改进和语义空间的构建都具有积极的作用。 展开更多
关键词 查询长度 查询类型 SESSION 重叠率
下载PDF
基于粗糙集理论和BP神经网络的文本自动分类方法研究 被引量:3
20
作者 白如江 王效岳 《山东大学学报(理学版)》 CAS CSCD 北大核心 2006年第3期79-84,共6页
结合粗糙集的属性约简和神经网络的分类机理,提出了一种混合算法.首先应用粗糙集理论的属性约简作为预处理器,把冗余的属性从决策表中删去,然后运用神经网络进行分类.这样可以大大降低向量维数,克服粗糙集对于决策表噪声比较敏感的缺点... 结合粗糙集的属性约简和神经网络的分类机理,提出了一种混合算法.首先应用粗糙集理论的属性约简作为预处理器,把冗余的属性从决策表中删去,然后运用神经网络进行分类.这样可以大大降低向量维数,克服粗糙集对于决策表噪声比较敏感的缺点.试验结果表明,与朴素贝叶斯、SVM、kNN传统分类方法相比,该方法在保持分类精度的基础上,分类速度有明显的提高,体现出较好的稳定性和容错性,尤其适用于特征向量多且难以分类的文本. 展开更多
关键词 文本分类 粗糙集 神经网络 属性约简 VSM
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部