期刊文献+
共找到121篇文章
< 1 2 7 >
每页显示 20 50 100
Document classification approach by rough-set-based corner classification neural network 被引量:1
1
作者 张卫丰 徐宝文 +1 位作者 崔自峰 徐峻岭 《Journal of Southeast University(English Edition)》 EI CAS 2006年第3期439-444,共6页
A rough set based corner classification neural network, the Rough-CC4, is presented to solve document classification problems such as document representation of different document sizes, document feature selection and... A rough set based corner classification neural network, the Rough-CC4, is presented to solve document classification problems such as document representation of different document sizes, document feature selection and document feature encoding. In the Rough-CC4, the documents are described by the equivalent classes of the approximate words. By this method, the dimensions representing the documents can be reduced, which can solve the precision problems caused by the different document sizes and also blur the differences caused by the approximate words. In the Rough-CC4, a binary encoding method is introduced, through which the importance of documents relative to each equivalent class is encoded. By this encoding method, the precision of the Rough-CC4 is improved greatly and the space complexity of the Rough-CC4 is reduced. The Rough-CC4 can be used in automatic classification of documents. 展开更多
关键词 document classification neural network rough set meta search engine
下载PDF
电子档案单套制管理的现实困境与纾解路径——基于江西遂大高速公路试点项目的个案分析
2
作者 黄喜荣 张正辉 +1 位作者 曾武 周林兴 《档案管理》 北大核心 2024年第4期85-88,共4页
数字转型时代,推进高速公路建设项目电子档案单套制管理是高速公路信息化、数字化的必然发展态势,有助于提升高速公路档案管理工作水平与能力。文章以江西省遂川至大余高速公路电子文件归档与电子档案管理试点项目为例,从制度、意识、... 数字转型时代,推进高速公路建设项目电子档案单套制管理是高速公路信息化、数字化的必然发展态势,有助于提升高速公路档案管理工作水平与能力。文章以江西省遂川至大余高速公路电子文件归档与电子档案管理试点项目为例,从制度、意识、技术、人才等维度剖析高速公路建设项目电子档案单套制管理的现存问题,在此基础上提出高速公路建设项目电子档案单套制管理的纾解路径,即筑牢电子档案单套制管理“生态圈”、凝聚电子档案单套制管理“引领力”、构筑电子档案单套制管理“元宇宙”、打造电子档案单套制管理“共同体”。 展开更多
关键词 高速公路 建设项目 电子档案 电子文件 单套制管理 元宇宙 共同体 生态圈
下载PDF
油田站场设计阶段数字化交付技术应用
3
作者 李舰 《油气田地面工程》 2024年第1期61-66,共6页
设计阶段数字化交付是全生命周期数字化交付的基础,通过对油田站场设计阶段数字化交付实施方法和配套管理措施的研究,初步确定了具有大庆油田特色的设计阶段交付标准和流程。数字化交付的前提条件是全专业三维协同设计,包括工艺、电力... 设计阶段数字化交付是全生命周期数字化交付的基础,通过对油田站场设计阶段数字化交付实施方法和配套管理措施的研究,初步确定了具有大庆油田特色的设计阶段交付标准和流程。数字化交付的前提条件是全专业三维协同设计,包括工艺、电力、自控专业的系统设计协同和配管、电力、通信、自控等专业的布置设计协同。实施设计阶段数字化交付包含设计交付前平台基础定制、文档交付、工程对象解析、二三维核验和关联关系定制五个步骤。依托油田数字化交付典型站场,对全专业协同设计、设计阶段数字化交付的技术路线、实施步骤、相关配套管理办法进行了介绍,提出了设计阶段交付工作的思路和方法及采购、施工阶段以及生产运维阶段的设想和建议,展望了数字化交付技术发展的前景。 展开更多
关键词 设计阶段 协同设计 数字化交付 文档交付 工程对象解析 关联关系定制
下载PDF
基于机器视觉的文件扫描机器人缺失数据填补
4
作者 李智诚 张云翔 《自动化技术与应用》 2024年第5期106-109,共4页
由于扫描环境噪声过高,导致机器人扫描文件图像内部分信息无法识别读取,为此,提出一种基于机器视觉的文件扫描机器人缺失数据填补方法。采集机器人的历史扫描缺失数据,划分不完备数据集及容差属性数据集,利用对数非自然函数识别数据集... 由于扫描环境噪声过高,导致机器人扫描文件图像内部分信息无法识别读取,为此,提出一种基于机器视觉的文件扫描机器人缺失数据填补方法。采集机器人的历史扫描缺失数据,划分不完备数据集及容差属性数据集,利用对数非自然函数识别数据集内的缺失数据,自适应函数值越大的数据,估计缺失的概率越高。采用机器视觉技术结合扫描机器人激光映射特点,根据扫描点的时间序列关系,提取扫描区域内的中心值。根据中心值判定邻近范围内的数据是否存在噪声影响,采用收敛模型实现填补。仿真实验证明,所提方法填补效果极佳、缺失数据识别率较高。 展开更多
关键词 缺失数据识别 数据填补算法 数据估计模型 不完备数据集数 文件扫描机器人
下载PDF
DESIGN OF A NEW INTERPOLATED CONTROLLER FOR STA-BILIZATION OF A SET OF INTERPOLATED PLANTS
5
作者 袁向阳 施颂椒 《Journal of Shanghai Jiaotong university(Science)》 EI 2000年第2期62-64,69,共4页
Stabilization of a plant with variable operating conditions was considered. The plant is assumed to lie in a set of interpolated models composed of all interpolations generated between certain sets of proper stable co... Stabilization of a plant with variable operating conditions was considered. The plant is assumed to lie in a set of interpolated models composed of all interpolations generated between certain sets of proper stable coprime factorizations of transfer functions of two representative models that are defined at two representative operating points. An interpolated controller that is linear interpolation of coprime factorizations of two stabilizing controllers for the two representative models is designed to stabilize this set of interpolated models. Design of such an interpolated controller was converted to a feasibility problem constrained by several LMIs and a BMI, and a two step iteration algorithm was employed to solve it. 展开更多
关键词 a set of interpolated models stabilization linear matrix INEQUALITY (LMI) document code:A
下载PDF
基于“幸存者偏差”评估模型的调查研究方法——以“企业电子文件归档和电子档案管理试点”数据分析为例 被引量:5
6
作者 郭芳 刘永 吴雁平 《档案管理》 北大核心 2023年第4期49-55,共7页
分享成功试点项目经验或项目成功部分的经验,应该且必要,但仅分享这些,存在“幸存者偏差”的可能。在分享成功经验的同时,对试点过程产生的数据进行挖掘,尝试采用试点项目通过率、试点区域覆盖面、试点单位类型覆盖面、试点系统完成度... 分享成功试点项目经验或项目成功部分的经验,应该且必要,但仅分享这些,存在“幸存者偏差”的可能。在分享成功经验的同时,对试点过程产生的数据进行挖掘,尝试采用试点项目通过率、试点区域覆盖面、试点单位类型覆盖面、试点系统完成度、试点项目完成度、试点单位变更率、试点项目如期完成率等指标,进行统计归纳分析,探寻具有普遍意义的规律,形成可复制、易使用的“幸存者偏差”评估模型,既有助于后来者,在电子文件归档和电子档案管理工作试点、推广、应用、实施时,充分利用先行者的经验,少走弯路,避免“幸存者偏差”造成的影响,防止踩坑;也可为《“十四五”全国档案事业发展规划》中期评估和总结评估,提供一个工具。 展开更多
关键词 企业 电子文件归档 电子档案管理 单套制 项目管理 动态防护 信息滤选
下载PDF
基于BERT的长文本分类方法 被引量:7
7
作者 刘博 蒲亦非 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第2期75-82,共8页
由于预训练模型输入分词数量限制,基于BERT的长文本分类任务效果与长文本分割后的文本段集合的处理及特征融合密切相关,现有的长文本分类研究在融合文本段特征时更关注文本段之间原始的顺序关系,而本文提出了一种基于BERT和集合神经网... 由于预训练模型输入分词数量限制,基于BERT的长文本分类任务效果与长文本分割后的文本段集合的处理及特征融合密切相关,现有的长文本分类研究在融合文本段特征时更关注文本段之间原始的顺序关系,而本文提出了一种基于BERT和集合神经网络的长文本分类模型.该方法以BERT为基础,可处理从同一文本样本分割得到的任意数量文本段,经过BERT后得到文本段特征,再将所有文本段特征输入到具有置换不变性的集合神经网络层中,提取出集合级别特征来优化长文本的特征表达.通过在三个数据上的实验分析,论文在平均分词长度较长的数据集上取得了90.82%的准确率,高出目前最优方法4.37%. 展开更多
关键词 文本分类 BERT 集合神经网络 长文本
下载PDF
电子档案“单套制”管理认知与实施现状基本情况调查 被引量:1
8
作者 司啸宏 梁惠卿 《档案管理》 北大核心 2023年第2期109-111,共3页
本文从认知、判断、实施、区域、职业、岗位、主体七个方面设问,通过微信平台进行问卷调查。调查发现粉众阅多答者寡,走过路过理会少。知晓虽多理解异,区域分布不均匀。判断乐观有保留,表态骑中两头低。机关单位教师多,档案人员是主体... 本文从认知、判断、实施、区域、职业、岗位、主体七个方面设问,通过微信平台进行问卷调查。调查发现粉众阅多答者寡,走过路过理会少。知晓虽多理解异,区域分布不均匀。判断乐观有保留,表态骑中两头低。机关单位教师多,档案人员是主体。高学历的中年人,女性超半。为全面开展电子档案“单套制”管理,提供了一些来自基层一线,有着一定特点的数据信息。 展开更多
关键词 电子文件 电子档案 “单套制” 归档管理 档案管理 调查分析
下载PDF
基于频繁词集聚类的海量短文分类方法 被引量:6
9
作者 王永恒 贾焰 杨树强 《计算机工程与设计》 CSCD 北大核心 2007年第8期1744-1746,1780,共4页
信息技术的飞速发展造成了大量的文本数据累积,其中很大一部分是短文本数据。文本分类技术对于从这些海量短文中自动获取知识具有重要意义。但是对于关键词出现次数少的短文,现有的一般文本挖掘算法很难得到可接受的准确度。一些基于语... 信息技术的飞速发展造成了大量的文本数据累积,其中很大一部分是短文本数据。文本分类技术对于从这些海量短文中自动获取知识具有重要意义。但是对于关键词出现次数少的短文,现有的一般文本挖掘算法很难得到可接受的准确度。一些基于语义的分类方法获得了较好的准确度但又由于其低效性而无法适用于海量数据。针对这个问题提出了一个新颖的基于频繁词集聚类的短文分类算法。该算法使用频繁词集聚类来压缩数据,并使用语义信息进行分类。实验表明该算法在对海量短文进行分类时,其准确度和性能超过其它的算法。 展开更多
关键词 文本挖掘 分类 海量 短文 频繁词集
下载PDF
一种基于容错粗糙集的Web搜索结果聚类方法 被引量:5
10
作者 易高翔 胡和平 《计算机研究与发展》 EI CSCD 北大核心 2006年第2期275-280,共6页
一些Web聚类方法把类严格作为互斥的关系,聚类效果不理想·一种基于容错粗糙集的k均值的聚类解决了这一问题·首先运用向量模型表示Web文档信息,采用常规方法得到文本特征词集,然后利用某些特征词协同出现的价值,构造特征词容... 一些Web聚类方法把类严格作为互斥的关系,聚类效果不理想·一种基于容错粗糙集的k均值的聚类解决了这一问题·首先运用向量模型表示Web文档信息,采用常规方法得到文本特征词集,然后利用某些特征词协同出现的价值,构造特征词容错关系,扩充特征词的描述能力,最后用特征词容错类描述文档之间的相似关系,实现了Web搜索结果聚类,并提出了简单直观的衡量聚类精度的T模型·实验结果表明,利用容错关系聚类的类标记描述性强、容易理解、明显优于普通k均值算法· 展开更多
关键词 WEB文档 聚类 粗糙集 容错粗糙集
下载PDF
企业搜索引擎个性化表示与结果排序算法研究 被引量:7
11
作者 李贵林 杨禹琪 +1 位作者 高星 廖明宏 《计算机研究与发展》 EI CSCD 北大核心 2014年第1期206-214,共9页
针对企业搜索引擎提出一种基于本地文档库的个性化表示与结果排序算法,以帮助用户找到真正感兴趣的结果.首先,采用聚类分析对用户浏览的历史文档聚类;其次,采用模糊推理技术对所形成的分类进行分析,发现用户对各分类的喜好程度;再次,按... 针对企业搜索引擎提出一种基于本地文档库的个性化表示与结果排序算法,以帮助用户找到真正感兴趣的结果.首先,采用聚类分析对用户浏览的历史文档聚类;其次,采用模糊推理技术对所形成的分类进行分析,发现用户对各分类的喜好程度;再次,按用户对各分类喜好程度的不同,为各分类分配抽样文档数;最后,采用多种抽样技术,从各分类中抽取典型文档.来自不同分类的典型文档构成了表示用户个性的本地文档库.结果排序算法通过计算通用企业搜索引擎的搜索结果与本地文档库中各文档的相似性,对结果集重新排序,从而体现出用户个性.实验结果表明,与传统的基于关键词的个性化表示与结果排序算法相比,基于本地文档集的个性化表示与结果排序算法可以给出更能反映用户个性的查询结果,且可以对用户偏好的变化作出更迅速的反映。 展开更多
关键词 本地文档集 个性化 结果排序 模糊推理 抽样 企业搜索引擎
下载PDF
基于频繁词集和k-Means的Web文本聚类混合算法 被引量:6
12
作者 王乐 田李 +1 位作者 贾焰 韩伟红 《计算机工程与科学》 CSCD 2008年第8期92-96,119,共6页
当前,Web文本聚类主要存在三个挑战:数据规模海量性、高维空间处理复杂性和聚类结果的可理解性。针对上述挑战,本文提出了一个基于top-k频繁词集和k-means的混合聚类算法topHDC。该算法在生成初始聚簇时避免了高维空间向量处理,k个频繁... 当前,Web文本聚类主要存在三个挑战:数据规模海量性、高维空间处理复杂性和聚类结果的可理解性。针对上述挑战,本文提出了一个基于top-k频繁词集和k-means的混合聚类算法topHDC。该算法在生成初始聚簇时避免了高维空间向量处理,k个频繁词集对聚类结果提供了可理解的解释。topHDC避免了已有算法中聚类结果受文档长度干扰的问题。在两个公共数据集上的实验证明,topHDC算法在聚类质量和运行效率上明显优于另外两个具有代表性的聚类算法。 展开更多
关键词 文本挖掘 聚类 频繁词集 K-MEANS
下载PDF
纯XML数据库的原理分析及其应用 被引量:7
13
作者 王文义 李阳阳 《计算机工程与应用》 CSCD 北大核心 2004年第10期184-186,共3页
该文针对一种新兴的纯XML数据库的原理进行了探讨并提供了应用实例。文章首先简要介绍了XML语言的背景及其关键术语;重点阐述了纯XML数据库的含义、纯XML数据库的主要特性以及它与其它传统数据库在实用层面上的优缺点比较;作为应用,文... 该文针对一种新兴的纯XML数据库的原理进行了探讨并提供了应用实例。文章首先简要介绍了XML语言的背景及其关键术语;重点阐述了纯XML数据库的含义、纯XML数据库的主要特性以及它与其它传统数据库在实用层面上的优缺点比较;作为应用,文章最后提供了一个用纯XML数据库对数据的建模实例。 展开更多
关键词 XML SGML 纯XML数据库 文档集 查询语言
下载PDF
基于Rough集潜在语义索引的Web文档分类 被引量:7
14
作者 何明 冯博琴 傅向华 《计算机工程》 CAS CSCD 北大核心 2004年第13期3-5,共3页
Rough集(粗糙集)理论是一种处理不确定或模糊知识的数学工具。提出了一种基于Rough集理论的潜在语义索引的Web文档分类 方法。首先应用向量空间模型表示Web文档信息,然后通过矩阵的奇异值分解来进行信息过滤和潜在语义索引;运用属性约... Rough集(粗糙集)理论是一种处理不确定或模糊知识的数学工具。提出了一种基于Rough集理论的潜在语义索引的Web文档分类 方法。首先应用向量空间模型表示Web文档信息,然后通过矩阵的奇异值分解来进行信息过滤和潜在语义索引;运用属性约简算法生成分类 规则,最后利用多知识库进行文档分类。通过试验比较,该方法具有较好的分类效果。 展开更多
关键词 粗糙集 潜在语义索引 WEB文档分类 信息过滤 信息检索
下载PDF
基于广义粗糙近似的信息检索方法研究 被引量:2
15
作者 王珏 刘三阳 张杰 《系统工程与电子技术》 EI CSCD 北大核心 2004年第12期1887-1891,共5页
基于广义粗糙集———条件概率粗糙集,给出一种新的信息检索模型。分别研究了对于精确的特征词条空间和精确的文档及查询、精确的特征词条空间和模糊的文档及查询、模糊的特征词条空间和模糊的文档及查询这3种情况下的信息检索方法。用... 基于广义粗糙集———条件概率粗糙集,给出一种新的信息检索模型。分别研究了对于精确的特征词条空间和精确的文档及查询、精确的特征词条空间和模糊的文档及查询、模糊的特征词条空间和模糊的文档及查询这3种情况下的信息检索方法。用户可以根据相关反馈信息来调节特征词条间的支持度,获得满意的检索结果,从而满足自己的信息需求。仿真实例表明该信息检索模型的有效性和实用性。 展开更多
关键词 文档 特征词条 信息检索 条件概率关系 模糊条件概率关系
下载PDF
基于优化的文档频和粗糙集的特征选择方法 被引量:5
16
作者 朱颢东 钟勇 《湖南师范大学自然科学学报》 CAS 北大核心 2009年第3期27-31,共5页
特征选择是文本分类的一个核心研究课题.首先给出了一个基于最小词频的文档频方法,然后把粗糙集引入进来并提出了一个属性约简算法,最后把该属性约简算法同基于最小词频的文档频方法结合起来,提出了一个综合的特征选择方法.该综合方法... 特征选择是文本分类的一个核心研究课题.首先给出了一个基于最小词频的文档频方法,然后把粗糙集引入进来并提出了一个属性约简算法,最后把该属性约简算法同基于最小词频的文档频方法结合起来,提出了一个综合的特征选择方法.该综合方法首先使用基于最小词频的文档频方法进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集. 展开更多
关键词 文本分类 词频 文档频 属性约简 粗糙集
下载PDF
日文文献数据回溯建库工作的思路 被引量:10
17
作者 张建民 《图书馆论坛》 CSSCI 北大核心 2002年第3期42-43,共2页
我国公共图书馆在对日文文献数据编制建库的工作中往往套用CNMARC ,但在实际工作中却存在不少差异。因此 ,编制一份适用于日文机读目录格式的使用说明书 ,使日文文献数据编制建库工作达致规范 ,是提高各馆工作质量、提高工作效率的有效... 我国公共图书馆在对日文文献数据编制建库的工作中往往套用CNMARC ,但在实际工作中却存在不少差异。因此 ,编制一份适用于日文机读目录格式的使用说明书 ,使日文文献数据编制建库工作达致规范 ,是提高各馆工作质量、提高工作效率的有效途径。 展开更多
关键词 公共图书馆 日文机读目录格式 日文文献 回溯建库
下载PDF
结合ODF和辨识集的特征选择 被引量:1
18
作者 朱颢东 周姝 钟勇 《重庆邮电大学学报(自然科学版)》 北大核心 2010年第1期94-98,107,共6页
在中文文本分类中,由于中文词条总数较高,限制了中文文本分类算法的选择空间。特征选择是文本分类的一个核心研究课题。提出了一个优化的文档频(optimal document frequency,ODF),再结合粗糙集提出了一个新的基于辨识集的属性约简算法,... 在中文文本分类中,由于中文词条总数较高,限制了中文文本分类算法的选择空间。特征选择是文本分类的一个核心研究课题。提出了一个优化的文档频(optimal document frequency,ODF),再结合粗糙集提出了一个新的基于辨识集的属性约简算法,最后把该属性约简算法同优化的ODF结合起来,提出了一个综合的特征选择方法。该综合选择方法首先使用优化的ODF进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后再利用所提出的属性约简算法消除冗余,从而获得较具代表性的特征子集。实验结果表明该方法有较好的准确率和召回率。 展开更多
关键词 特征选择 文档频 粗糙集 辨识集 属性约简
下载PDF
基于文档实例映射的知识地图集成方法 被引量:1
19
作者 敬石开 刘继红 +1 位作者 鬲玲 李颖新 《计算机集成制造系统》 EI CSCD 北大核心 2015年第7期1702-1710,共9页
为了实现集成化知识地图间点对点的集成,提出基于文档实例映射的知识地图集成方法,在将产品研发知识地图分为概念地图、流程地图、专家地图的基础上,引入基于集成化研发知识地图的知识组织架构。采用文档实例映射方法计算节点间文档实... 为了实现集成化知识地图间点对点的集成,提出基于文档实例映射的知识地图集成方法,在将产品研发知识地图分为概念地图、流程地图、专家地图的基础上,引入基于集成化研发知识地图的知识组织架构。采用文档实例映射方法计算节点间文档实例集的相似度,并结合约束条件将相关节点连接,实现各知识节点上三类知识资源的整合。通过实例验证了该方法的可行性。 展开更多
关键词 产品研发 集成化研发知识地图 文档实例映射 文档实例集相似度
下载PDF
结合新型文档频和二进制可辨矩阵的特征选择 被引量:3
20
作者 马春华 朱颢东 钟勇 《计算机应用》 CSCD 北大核心 2009年第8期2268-2271,共4页
特征选择是文本分类的一个核心研究课题。分析了几种经典特征选择方法并总结了它们的不足,提出了一个新型文档频,引入粗糙集理论,并给出了一个基于二进制可辨矩阵的属性约简算法,最后把该属性约简算法同新型文档频结合起来,提供了一个... 特征选择是文本分类的一个核心研究课题。分析了几种经典特征选择方法并总结了它们的不足,提出了一个新型文档频,引入粗糙集理论,并给出了一个基于二进制可辨矩阵的属性约简算法,最后把该属性约简算法同新型文档频结合起来,提供了一个综合的特征选择方法。该方法首先利用新型文档频进行特征初选以过滤掉一些词条,然后利用所提属性约简算法消除冗余。通过对人民网的8类新闻组,每类300篇文档的分类实验,结果表明此种特征选择方法在分类准确率和召回率上优于互信息、CHI和信息增益方法。 展开更多
关键词 特征选择 文本分类 文档频 二进制可辨矩阵 粗糙集 属性约简
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部