期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
可跟踪段落状态的结构化文档协作管理的研究
1
作者 丁旭渊 吕书龙 《福建电脑》 2023年第1期66-69,共4页
针对流式文档在多人协作过程中存在的协同控制与部分文档更新处理管理难的问题,探索新的控制方案十分必要。本文提出了一种以段落为控制节点的分解文档管理方案,对流式文档的控制顺序、段落管理、文本、表格、图像管理提出了具体的管理... 针对流式文档在多人协作过程中存在的协同控制与部分文档更新处理管理难的问题,探索新的控制方案十分必要。本文提出了一种以段落为控制节点的分解文档管理方案,对流式文档的控制顺序、段落管理、文本、表格、图像管理提出了具体的管理结构。应用方案的结果表明,采用该方案可以解决多人文档协同工作场景下的制作管理同步的问题。 展开更多
关键词 核查比对 文档处理器 字符串查找 短文本分类 文本分割
下载PDF
监控文本文件内容变化的文本比较算法 被引量:12
2
作者 王艳清 王云维 《计算机应用》 CSCD 北大核心 2010年第A01期133-134,142,共3页
为了判断文本文件的内容是否发生变化,确定变化的内容,并尽量降低系统开销,提出了一种基于位置的文本文件比较算法。算法利用位置优先原则,简化了比较过程。实验结果表明该算法可以应用于文件监控,而且易于理解。
关键词 文件监控 信息安全 文本比较算法 文本文件 篡改
下载PDF
基于主题模型的文本分类算法性能比较 被引量:2
3
作者 王万起 田中雨 董兰军 《高校图书馆工作》 2022年第2期41-46,共6页
文章利用LDA模型进行文本降维和特征提取,并将传统分类算法置于集成学习框架下进行训练,以探讨是否能提高单一分类算法的分类准确度,并获得较优的分类效果,使LDA模型能够发挥更高的性能和效果,从而为文本分类精度的提高服务。同时,以Web... 文章利用LDA模型进行文本降维和特征提取,并将传统分类算法置于集成学习框架下进行训练,以探讨是否能提高单一分类算法的分类准确度,并获得较优的分类效果,使LDA模型能够发挥更高的性能和效果,从而为文本分类精度的提高服务。同时,以Web of Science为数据来源,依据其学科类别划分标准,建立涵盖6个主题的实验文本集,利用Weka作为实验工具,以平均F值作为评价指标,对比分析了朴素贝叶斯、逻辑回归、支持向量机、K近邻算法4种传统分类算法以及AdaBoost、Bagging、Random Subspace 3种集成学习算法的分类效果。从总体上看,通过“同质集成”集成后的文本分类准确率高于单个分类器的分类准确率;利用LDA模型进行文本降维和特征提取,将朴素贝叶斯作为基分类器,并利用Bagging进行集成训练,分类效果最优,实现了“全局最优”。 展开更多
关键词 文本分类 集成学习 算法比较 F值 主题模型
下载PDF
基于SVM-KNN的文本分类算法及其分析 被引量:3
4
作者 匡春临 夏清强 《计算机时代》 2010年第8期29-31,34,共4页
通过实验对SVM、KNN文本分类算法进行了深入探讨。基于KNN和SVM算法,提出了一种SVM-KNN算法。该算法结合KNN和SVM两种分类器,并通过分类预测概率的反馈和修正来提高分类器性能。在CWT100G中文网页分类测试系统中,对SVM-KNN算法的实际效... 通过实验对SVM、KNN文本分类算法进行了深入探讨。基于KNN和SVM算法,提出了一种SVM-KNN算法。该算法结合KNN和SVM两种分类器,并通过分类预测概率的反馈和修正来提高分类器性能。在CWT100G中文网页分类测试系统中,对SVM-KNN算法的实际效果进行了测试和算法性能验证。 展开更多
关键词 文本分类 SVM KNN SVM—KNN 算法比较
下载PDF
双文本查错定步长回溯比较算法的研究
5
作者 张勇 杨明 +1 位作者 王开铸 韩睿 《情报学报》 CSSCI 北大核心 1997年第4期253-258,共6页
本文采用二模冗余技术,对系统产生的双文本进行冗余比较实现查错,提出了定步长回溯比较算法,给出算法描述。
关键词 双文本查错 分组比较 二模冗余 校对
下载PDF
网站变更监测预警系统的设计与实现 被引量:1
6
作者 何诗佳 刘晓强 +2 位作者 李柏岩 蔡立志 胡芸 《南京师范大学学报(工程技术版)》 CAS 2021年第1期30-35,共6页
网站易成为黑客入侵篡改的对象,网站的实时变更监测对于网站安全尤为重要.针对目前大规模进行网站实时变更监测的难点,设计并实现了一种基于非关系型数据库和消息机制的网站变更监测方案.系统采用爬虫技术进行网站页面实时爬取,通过分... 网站易成为黑客入侵篡改的对象,网站的实时变更监测对于网站安全尤为重要.针对目前大规模进行网站实时变更监测的难点,设计并实现了一种基于非关系型数据库和消息机制的网站变更监测方案.系统采用爬虫技术进行网站页面实时爬取,通过分布式数据存储和消息机制实现对多网站的实时分析,采用了MD5值与文本对比相结合的算法进行网站内容变更监测,并对监测结果进行可视化.此外,当网站出现异常变更时,支持实时处理告警及紧急切断服务,减少由于网站内容被篡改所带来的不良影响. 展开更多
关键词 网站内容篡改 网站变更监测 MD5 文本对比算法 分布式存储 消息机制
下载PDF
Web文本挖掘及其分类技术研究
7
作者 李川 《数字技术与应用》 2010年第7期74-75,共2页
本文以Web挖掘为基础。首先,从定义、功能、过程3方面介绍了Web内容挖掘中的文本挖掘;其次,重点探讨了Web文本挖掘的两种重要功能——分类及其它们常用的算法,并分别对算法做了比较;最后,得出结论并进行了展望。
关键词 WEB文本挖掘 分类算法 比较
下载PDF
基于SimHash算法的Android恶意程序检测 被引量:1
8
作者 李红灵 詹翊 《计算机技术与发展》 2017年第10期121-125,共5页
针对当前Android应用程序良莠不齐,存在大量的恶意程序对个人隐私和信息安全构成严重威胁的现状,在分析基于MD5的传统特征代码检测技术的基础上,提出了利用SimHash算法,经过APK文件特征文本提取,特征文本数字指纹生成,数字指纹比对及比... 针对当前Android应用程序良莠不齐,存在大量的恶意程序对个人隐私和信息安全构成严重威胁的现状,在分析基于MD5的传统特征代码检测技术的基础上,提出了利用SimHash算法,经过APK文件特征文本提取,特征文本数字指纹生成,数字指纹比对及比对结果分析三个步骤,进行Android恶意程序检测的新方法。为实现APK文件特征文本化,引入恶意软件分析程序androlyze.py,同时,考虑到Android特征的有效性,经研究需要选取Android程序的权限及调用映射、广播接收器、服务等核心信息组合成对应APK文件的复合特征文本,将复合特征文本转换为字符串后利用程序进行海明距离计算,由海明距离判断待测试APK文件的安全性。通过实验进行实例分析,并将得到的检测效果与360杀毒软件做比较,发现基于SimHash算法的恶意程序检测方法,检测率高于360。 展开更多
关键词 simHash算法 Android恶意程序检测 复合特征文本 相似性比较
下载PDF
基于LCS算法的EDL可视化比对工具研究
9
作者 郑晓发 李垚瑞 《现代电影技术》 2020年第6期11-15,共5页
本文设计并开发了针对EDL文件特点的按行比对工具,以LCS最大公共子串比对算法执行EDL文件比对功能;同时使用Qt Creator进行比对结果可视化开发的设计方案,实现了EDL文件读取、异动比对、比对结果可视化及文本输出功能,为后期环节剪辑、... 本文设计并开发了针对EDL文件特点的按行比对工具,以LCS最大公共子串比对算法执行EDL文件比对功能;同时使用Qt Creator进行比对结果可视化开发的设计方案,实现了EDL文件读取、异动比对、比对结果可视化及文本输出功能,为后期环节剪辑、特效、调色各部门间变动素材整理提供了一种解决方案,可提高数字电影后期制作流程中各部门协同工作的效率. 展开更多
关键词 EDL 文本比对 LCS算法 结果可视化 素材筛选
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部