期刊文献+
共找到113篇文章
< 1 2 6 >
每页显示 20 50 100
Immune Algorithm For Document Query Optimization
1
作者 WangZiqiang FengBoqin 《工程科学(英文版)》 2005年第1期89-93,共5页
To efficiently retrieve relevant document from the rapid proliferation of large information collections, a novel immune algorithm for document query optimization is proposed. The essential ideal of the immune algorith... To efficiently retrieve relevant document from the rapid proliferation of large information collections, a novel immune algorithm for document query optimization is proposed. The essential ideal of the immune algorithm is that the crossover and mutation of operator are constructed according to its own characteristics of information retrieval. Immune operator is adopted to avoid degeneracy. Relevant documents retrieved are merged to a single document list according to rank formula. Experimental results show that the novel immune algorithm can lead to substantial improvements of relevant document retrieval effectiveness. 展开更多
关键词 免疫算法 信息检索 文件查询优化 失量空间模型
下载PDF
富文本协同编辑中基于树型结构地址空间转换的一致性维护
2
作者 刘亚 韩建功 +1 位作者 高丽萍 曲博 《小型微型计算机系统》 CSCD 北大核心 2024年第2期367-373,共7页
协同编辑通过多用户远程实时编辑,最大程度的支持团队之间的协作和交流.撤销操作作为协同编辑的一个重要特性,通过错误恢复简化协作编辑过程中产生的错误或者意外操作的处理过程.富文本编辑采用树型结构来进行文档管理,从而产生了较线... 协同编辑通过多用户远程实时编辑,最大程度的支持团队之间的协作和交流.撤销操作作为协同编辑的一个重要特性,通过错误恢复简化协作编辑过程中产生的错误或者意外操作的处理过程.富文本编辑采用树型结构来进行文档管理,从而产生了较线性文档更为复杂的并发操作环境和冲突消解场景.为了解决富文本文档中的并发操作环境与撤销操作冲突问题,本文提出了一种新颖的基于树型结构的地址空间转换方法,采用基于位置的节点寻址方案和节点属性值计数器策略,能更方便地支持撤销操作与更改操作.此外,本文还给出了树型结构地址空间的结果一致性的正确性证明及详细的案例分析,并开发了Web平台下实时协同富文本编辑原型系统AST-RichText,进一步验证了该方法的可行性. 展开更多
关键词 计算机支持的协同工作 实时协同编辑 地址空间转换 一致性模型 UNDO 树型文档
下载PDF
基于文献计量的图书馆空间服务研究成果分析
3
作者 杨宁 《江苏科技信息》 2024年第18期70-75,共6页
空间是图书馆的重要资源,空间服务发展至今仍是图书馆转型发展、提升服务效能的关注焦点。文章以CNKI期刊数据库为基础,将数据来源限定在高影响力期刊库中有关图书馆空间服务的文献中,以文献计量的研究方法对文献形式和内容特征进行分... 空间是图书馆的重要资源,空间服务发展至今仍是图书馆转型发展、提升服务效能的关注焦点。文章以CNKI期刊数据库为基础,将数据来源限定在高影响力期刊库中有关图书馆空间服务的文献中,以文献计量的研究方法对文献形式和内容特征进行分析。图书馆空间服务研究方向正不断深化,智慧空间和虚拟空间成为关注焦点,技术在深度融入空间服务,高校图书馆始终发挥着引领作用;未来应着力提升公共图书馆支撑力,充分挖掘空间资源,提升图书馆服务效能。 展开更多
关键词 图书馆空间 空间服务 文献计量
下载PDF
面向畸变扭曲文档的两种图像矫正网络
4
作者 冯瑾 池越 +1 位作者 周亚同 何静飞 《数据采集与处理》 CSCD 北大核心 2024年第1期167-180,共14页
由于文档纸张的几何形变、拍摄场景的干扰及拍摄角度不理想导致的透视失真,移动设备获取的文档图像的光学字符识别(Optical character recognition,OCR)性能受到很大挑战。针对折叠和扭曲的畸变文档图像预处理问题,设计了两种基于自编... 由于文档纸张的几何形变、拍摄场景的干扰及拍摄角度不理想导致的透视失真,移动设备获取的文档图像的光学字符识别(Optical character recognition,OCR)性能受到很大挑战。针对折叠和扭曲的畸变文档图像预处理问题,设计了两种基于自编码器的网络结构,以实现自适应性图像矫正并提高文字识别正确率。首先提出空洞残差块和非对称卷积残差块两种残差块,然后将残差块与自编码器相结合,设计了一种非对称空洞自编码器网络;同时利用空间金字塔池化代替全连接层,并用非对称卷积残差块实现特征提取,设计了另一种空间金字塔自编码器网络。实验结果表明,与畸变图像相比,经非对称空洞自编码器网络矫正后的图像在OCR正确率、OCR召回率和文本相似度上分别提高了26.3%、20.4%和12.3%,而经空间金字塔自编码器网络矫正后的图像在正确率、召回率和文本相似度上分别提高了27.7%、22.0%和15.5%。与RectiNet等其他图像矫正网络相比,这两种网络可以自适应矫正多种类型的畸变文档图像,且矫正后的图像在文字识别上表现更为优异。本文提出的两种矫正网络能有效提高图像文字识别正确率、召回率和文本相似度,同时在鲁棒性、泛化性等方面与现有矫正网络相比具有明显的优势。 展开更多
关键词 图像矫正 畸变文档图像 机器学习 自编码器 卷积残差块 空间金字塔池化
下载PDF
根据用户隐式反馈建立和更新用户兴趣模型 被引量:29
5
作者 孙铁利 杨凤芹 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2003年第3期99-104,共6页
 提出一种通过获取用户的隐式反馈信息建立和更新用户兴趣模型的方法.这种方法不需要用户显式地提供兴趣信息,只要通过观察用户在浏览Web页面时所采取的动作来获取隐式的反馈信息,并利用这些信息建立与更新用户兴趣模型,从而减轻用户...  提出一种通过获取用户的隐式反馈信息建立和更新用户兴趣模型的方法.这种方法不需要用户显式地提供兴趣信息,只要通过观察用户在浏览Web页面时所采取的动作来获取隐式的反馈信息,并利用这些信息建立与更新用户兴趣模型,从而减轻用户的负担. 展开更多
关键词 用户兴趣模型 隐式反馈 文档空间 tf*idf
下载PDF
中文文本分类中基于词性的特征提取方法研究 被引量:26
6
作者 胡燕 吴虎子 钟珞 《武汉理工大学学报》 CAS CSCD 北大核心 2007年第4期132-135,共4页
在介绍常用的文本分类中特征词提取方法的基础上,提出了一种全新的,适用于中文文本分类的特征提取方法———基于词性的特征提取方法,实验结果显示,这种基于词性的特征提取方法在提高特征提取效率和降低特征向量维数方面都有显著改善。
关键词 中文文本分类 向量空间模型 特征提取
下载PDF
中文文献的层次分类方法 被引量:22
7
作者 战学刚 林鸿飞 姚天顺 《中文信息学报》 CSCD 北大核心 1999年第6期20-25,共6页
现有的分类系统通常忽略类别体系的层次结构,在对文献进行分类时,往往很难区分类别相近的文献属于哪一类。本文基于向量空间模型,提出根据类别体系的层次结构,自顶向下,逐层分类的方法。其目的是提高分类精度;并根据概念词典,将... 现有的分类系统通常忽略类别体系的层次结构,在对文献进行分类时,往往很难区分类别相近的文献属于哪一类。本文基于向量空间模型,提出根据类别体系的层次结构,自顶向下,逐层分类的方法。其目的是提高分类精度;并根据概念词典,将同义词或下位概念映射到单一的概念词上,由这些概念词构成一个规模很小的特征集,以缩小特征向量空间的维数,从而减少分类系统的计算量。此外,通过对类别层次体系的分析,压缩特征向量。 展开更多
关键词 文献分类 向量空间模型 层次分类 中文文献
下载PDF
规则切割碎纸片的复原 被引量:4
8
作者 潘斌 郭小明 +3 位作者 陈明明 于晶贤 赵晓颖 陈为 《辽宁石油化工大学学报》 CAS 2014年第5期70-73,78,共5页
破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。针对规则碎纸片的复原问题,首先自动提取碎片的行间距特征,采用Mean-shift算法对所有碎片进行聚类分析,然后根据碎片边界的灰度特征,建立碎片之间... 破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。针对规则碎纸片的复原问题,首先自动提取碎片的行间距特征,采用Mean-shift算法对所有碎片进行聚类分析,然后根据碎片边界的灰度特征,建立碎片之间的相似性矩阵,最后采用遗传算法将碎片进行拼接。 展开更多
关键词 碎片修复 行间距 聚类分析 遗传算法 规则碎纸
下载PDF
一种基于空间映射及尺度变换的聚类框架 被引量:2
9
作者 曾依灵 许洪波 +2 位作者 吴高巍 程学旗 白硕 《中文信息学报》 CSCD 北大核心 2010年第3期81-88,共8页
传统聚类算法通常建立在显式的模型之上,很少考虑泛化模型以适应不同的数据,由此导致了模型不匹配问题。针对此问题,该文提出了一种基于空间映射(Mapping)及尺度变换(Rescaling)的聚类框架(简称M-R框架)。具体而言,M-R框架首先将语料映... 传统聚类算法通常建立在显式的模型之上,很少考虑泛化模型以适应不同的数据,由此导致了模型不匹配问题。针对此问题,该文提出了一种基于空间映射(Mapping)及尺度变换(Rescaling)的聚类框架(简称M-R框架)。具体而言,M-R框架首先将语料映射到一组具有良好区分度的方向所构建的坐标系中,以统计各个簇的分布特性,然后根据这些分布特性对各个坐标轴进行尺度变换,以归一化语料中各个类簇的分布。如上两步操作伴随算法迭代执行,直至算法收敛。该文将M-R框架应用到K-means算法及谱聚类算法上以验证其性能,在国际标准评测语料上的实验表明,应用了M-R框架的K-means及谱聚类在所有语料集上获得了全面的性能提升。 展开更多
关键词 计算机应用 中文信息处理 文本聚类 空间映射 尺度变换 模型不匹配
下载PDF
网络行为研究现状:一个文献综述 被引量:47
10
作者 黄少华 武玉鹏 《兰州大学学报(社会科学版)》 CSSCI 北大核心 2007年第2期32-40,共9页
国内外学界对网络行为的研究,涉及社会学、传播学、心理学、人类学、民族学、政治学、经济学、管理学、文化研究等诸多学科。本文通过文献综述,简要梳理和介绍了国内外学界在网络空间作为社会行为场域、网络行为特征与行为类型、网络行... 国内外学界对网络行为的研究,涉及社会学、传播学、心理学、人类学、民族学、政治学、经济学、管理学、文化研究等诸多学科。本文通过文献综述,简要梳理和介绍了国内外学界在网络空间作为社会行为场域、网络行为特征与行为类型、网络行为影响因素、网络行为后果等网络行为研究基本议题上的研究现状和主要成果。 展开更多
关键词 网络空间 网络行为 文献
下载PDF
基于词频统计的个性化信息过滤技术 被引量:12
11
作者 张国印 陈先 皮鹏 《哈尔滨工程大学学报》 EI CAS CSCD 2003年第1期63-67,共5页
对Internet信息进行过滤,筛选出与用户兴趣最相符的文档,是智能搜索引擎要解决的一个重要问题.本文在介绍搜索引擎基本原理的基础上,提出了一种文档学习和用户个性词典构建的实现方法,其中包括内码转换、分词、摘词处理、用户个性词典... 对Internet信息进行过滤,筛选出与用户兴趣最相符的文档,是智能搜索引擎要解决的一个重要问题.本文在介绍搜索引擎基本原理的基础上,提出了一种文档学习和用户个性词典构建的实现方法,其中包括内码转换、分词、摘词处理、用户个性词典的构建及词条权值调整等环节.然后提出了一种基于词频统计的个性化文档过滤算法,该算法对传统的向量空间模型法做了改进,使之能够更好地计算文档与用户个性词典之间的相关度,根据用户的兴趣爱好对文档进行相关度的过滤、排序,并给出了实验数据.实验结果表明该方法较好地解决了智能搜索引擎中Internet信息过滤、排序的问题. 展开更多
关键词 搜索引擎 文档过滤 向量空间模型法 词频统计 个性词典
下载PDF
基于BP神经网络的文档聚类研究 被引量:7
12
作者 田萱 刘希玉 孟强 《计算机科学》 CSCD 北大核心 2002年第8期93-95,共3页
1,引言 近年来,随着互联网的迅速发展,基于Web的数据挖掘技术受到越来越多的关注,经常用在文本挖掘和信息检索等多个领域的聚类(Clustering)技术也成为人们研究的热点.对一组实际或抽象的元素进行处理,把相似的元素归为同类的过程称之... 1,引言 近年来,随着互联网的迅速发展,基于Web的数据挖掘技术受到越来越多的关注,经常用在文本挖掘和信息检索等多个领域的聚类(Clustering)技术也成为人们研究的热点.对一组实际或抽象的元素进行处理,把相似的元素归为同类的过程称之为聚类[1].对文本信息,如科技文献、Web文档等的聚类,称之为文档聚类(Document Clustering).最初,文档聚类常用于提高信息检索系统的查准率和查全率(recall),或用来寻找与一篇文档最为相似的文档[2].现在,人们利用文档聚类来获得一组满足用户要求的文档集合并按用户需求对其进行排序.另外在Internet上,文本聚类也可用来自动产生文档的层次聚类,从而实现对Web文档的分类. 展开更多
关键词 Internet BP神经网络 文档聚类 数据挖掘 信息检索系统 查准率 查全率
下载PDF
一种基于关键特征的搜索引擎结果聚类算法 被引量:4
13
作者 张辉 谢科 +1 位作者 庞斌 吴辉 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2007年第6期739-742,共4页
为了解决用户在搜索引擎结果列表中寻找所需信息困难的问题,帮助用户快速有效地定位有价值的Web文档,与向量空间模型方法不同,采用基于关键特征的聚类算法(KFC).首先从搜索引擎返回结果的关键词里选择重要的词作为关键特征,然后通过分... 为了解决用户在搜索引擎结果列表中寻找所需信息困难的问题,帮助用户快速有效地定位有价值的Web文档,与向量空间模型方法不同,采用基于关键特征的聚类算法(KFC).首先从搜索引擎返回结果的关键词里选择重要的词作为关键特征,然后通过分析特征间的关系对特征聚类,最后基于特征聚类结果实现文档的聚类.通过对实验结果的测试表明了算法的有效性. 展开更多
关键词 搜索引擎 算法 特征提取 文档聚类 向量空间模型VSM KFC算法
下载PDF
文本水印附加空格编码方法的实现及其性能 被引量:16
14
作者 傅瑜 王保保 《长安大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第3期85-87,共3页
介绍了文本文件数字水印的白空格编码方法 ,着重讨论了使用标准空格进行水印编码即附加空格编码的实现方法。为了提高算法性能 ,在程序实现中提出了一些适当的处理方法并加以实现。对程序的性能进行了分析 ,其结果令人满意。
关键词 文本文件 数字水印 白空格编码 标准空格
下载PDF
VSM模型在文档结构识别中的应用 被引量:10
15
作者 宋昊苏 李宁 张伟 《北京信息科技大学学报(自然科学版)》 2011年第6期66-69,75,共5页
借鉴向量空间模型(VSM),将文档的单元结构映射到特征向量,并对其进行归一化和加权处理,再计算标准文档结构分类特征向量和待查文档单元结构特征向量的相似度,实现对文档结构的识别。测试结果表明,该方法实现了文档格式的向量表示,易于计... 借鉴向量空间模型(VSM),将文档的单元结构映射到特征向量,并对其进行归一化和加权处理,再计算标准文档结构分类特征向量和待查文档单元结构特征向量的相似度,实现对文档结构的识别。测试结果表明,该方法实现了文档格式的向量表示,易于计算,具有较好的扩展性,可在此基础上实现其他特定结构文档格式的自动检查或文档理解。 展开更多
关键词 文档结构识别 向量空间模型 文档格式校验 文档理解
下载PDF
2015年高校图书馆发展概况 被引量:22
16
作者 王波 吴汉华 +3 位作者 姚晓霞 朱本军 宋姬芳 朱强 《高校图书馆工作》 CSSCI 2017年第1期4-16,共13页
2015年,高校图书馆总文献资源购置费继续增加,但纸质资源购置费持续减少,电子资源购置费却继续增长。高校图书馆馆舍面积也在持续扩大,硕士研究生馆员的比例持续升高,数字化设施建设也迈上新台阶,但馆际间数字化建设水平差距较大。高校... 2015年,高校图书馆总文献资源购置费继续增加,但纸质资源购置费持续减少,电子资源购置费却继续增长。高校图书馆馆舍面积也在持续扩大,硕士研究生馆员的比例持续升高,数字化设施建设也迈上新台阶,但馆际间数字化建设水平差距较大。高校图书馆的文献传递量在继续增长。高校图工委组织编写了高校图书馆蓝皮书,并开展了系列活动。中国图书馆学会高等学校图书馆分会密切配合高等学校图工委的工作,先后组织召开了第九次全国会员代表大会,举办了高校图书馆发展论坛,新任馆长培训班等活动。CALIS联机编目稳步向前,外文期刊网全文服务升级,数据采集工作良好。CASHL的资源建设保持平稳,文献服务覆盖范围进一步扩大,运营服务体系更为完善。 展开更多
关键词 高校图书馆 事实数据库 文献资源购置费 馆舍空间 CALIS CASHL
下载PDF
文本分类系统关键技术 被引量:7
17
作者 谢科 张辉 +1 位作者 陈鹏 庞斌 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第2期123-126,共4页
从自然语言的角度考虑词性选择,同时从统计学角度考虑删除文档频率过低的特征词,从而避免产生维数灾难,通过考查类别本身特征和类别之间的关系来提取类别特征向量,采用传统夹角余弦公式考查文本与类别的相似度,实现一种过程简单,易于理... 从自然语言的角度考虑词性选择,同时从统计学角度考虑删除文档频率过低的特征词,从而避免产生维数灾难,通过考查类别本身特征和类别之间的关系来提取类别特征向量,采用传统夹角余弦公式考查文本与类别的相似度,实现一种过程简单,易于理解且分类效果不错的文本分类系统。 展开更多
关键词 文本分类 夹角余弦 向量空间模型 特征
下载PDF
层次结构文档下支持权限管理的实时协同技术研究 被引量:1
18
作者 高丽萍 陈庆奎 +1 位作者 卢暾 高丽丽 《计算机应用研究》 CSCD 北大核心 2012年第5期1690-1694,共5页
针对传统实时协同系统中各站点之间无约束操作的缺点,提出采用权限分工的方式来支持不同团队之间的文档管理。给出了支持权限管理的层次结构文档的形式化定义,描述了用户角色设置过程,定义了权限及权限操作格式,讨论了站点ID的设置及初... 针对传统实时协同系统中各站点之间无约束操作的缺点,提出采用权限分工的方式来支持不同团队之间的文档管理。给出了支持权限管理的层次结构文档的形式化定义,描述了用户角色设置过程,定义了权限及权限操作格式,讨论了站点ID的设置及初始化过程,并提出采用改进的地址空间转换算法来保证权限操作在各分布式站点的正确执行。分析了改进算法的效率提升,并通过其在Co-AutoCAD中的应用证实了策略的有效性。 展开更多
关键词 协同设计 权限管理 实时协同 层次结构文档 地址空间转换
下载PDF
基于Spring MVC的网络存储系统 被引量:6
19
作者 丁振凡 《计算机系统应用》 2013年第2期178-181,共4页
给用户提供网络存储是许多应用所需要的功能.讨论了利用Spring MVC实现该功能的解决办法.可以让用户在网络空间下自由建立子目录、上传文件,实现目录和文档的在线管理.有效解决了目录名和文件名的汉字编码转换问题,以及当前目录路径标... 给用户提供网络存储是许多应用所需要的功能.讨论了利用Spring MVC实现该功能的解决办法.可以让用户在网络空间下自由建立子目录、上传文件,实现目录和文档的在线管理.有效解决了目录名和文件名的汉字编码转换问题,以及当前目录路径标识中斜杠符导致的URI匹配问题,该应用已用于网络教学系统中学生个人空间和小组空间的信息保存,为小组协作学习提供了基础. 展开更多
关键词 SPRING MVC 文件上传 文件下载 用户网络文档空间 REST
下载PDF
基于VSM的文本相似度计算的研究 被引量:101
20
作者 郭庆琳 李艳梅 唐琦 《计算机应用研究》 CSCD 北大核心 2008年第11期3256-3258,共3页
文本相似度的计算作为其他文本信息处理的基础和关键,其计算准确率和效率直接影响其他文本信息处理的结果。提出改进的DF算法和TD-IDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,并通过适当增加关键词... 文本相似度的计算作为其他文本信息处理的基础和关键,其计算准确率和效率直接影响其他文本信息处理的结果。提出改进的DF算法和TD-IDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,并通过适当增加关键词的方法,弥补了其对个别有用信息错误过滤的不足;另一方面,利用特征项在特征选择阶段的权重对TD-IDF方法进行加权处理,在不增加开销的情况下扩大了文档集的规模,还提高了相似度计算的精确度。 展开更多
关键词 文本相似度 特征选择 词频—逆文档频率法 向量空间模型
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部