期刊文献+
共找到63篇文章
< 1 2 4 >
每页显示 20 50 100
Enhancing PDF Malware Detection through Logistic Model Trees
1
作者 Muhammad Binsawad 《Computers, Materials & Continua》 SCIE EI 2024年第3期3645-3663,共19页
Malware is an ever-present and dynamic threat to networks and computer systems in cybersecurity,and because of its complexity and evasiveness,it is challenging to identify using traditional signature-based detection a... Malware is an ever-present and dynamic threat to networks and computer systems in cybersecurity,and because of its complexity and evasiveness,it is challenging to identify using traditional signature-based detection approaches.The study article discusses the growing danger to cybersecurity that malware hidden in PDF files poses,highlighting the shortcomings of conventional detection techniques and the difficulties presented by adversarial methodologies.The article presents a new method that improves PDF virus detection by using document analysis and a Logistic Model Tree.Using a dataset from the Canadian Institute for Cybersecurity,a comparative analysis is carried out with well-known machine learning models,such as Credal Decision Tree,Naïve Bayes,Average One Dependency Estimator,Locally Weighted Learning,and Stochastic Gradient Descent.Beyond traditional structural and JavaScript-centric PDF analysis,the research makes a substantial contribution to the area by boosting precision and resilience in malware detection.The use of Logistic Model Tree,a thorough feature selection approach,and increased focus on PDF file attributes all contribute to the efficiency of PDF virus detection.The paper emphasizes Logistic Model Tree’s critical role in tackling increasing cybersecurity threats and proposes a viable answer to practical issues in the sector.The results reveal that the Logistic Model Tree is superior,with improved accuracy of 97.46%when compared to benchmark models,demonstrating its usefulness in addressing the ever-changing threat landscape. 展开更多
关键词 Malware detection pdf files logistic model tree feature selection CYBERSECURITY
下载PDF
藏文PDF文档转换为Word文档方法
2
作者 赞拉公 贡保加 +1 位作者 完玛道吉 安见才让 《长江信息通信》 2023年第11期117-120,共4页
各类办公软件中PDF、Word格式的文档在文字处理和保存等方面的使用率极高,而在藏文PDF文档转换成Word文档中存在乱码和漏读的问题。因此,文章针对此类问题作了相关研究并提出了基于藏文乱码字典的PDF文档转换方法,有效地提高了文本文件... 各类办公软件中PDF、Word格式的文档在文字处理和保存等方面的使用率极高,而在藏文PDF文档转换成Word文档中存在乱码和漏读的问题。因此,文章针对此类问题作了相关研究并提出了基于藏文乱码字典的PDF文档转换方法,有效地提高了文本文件转换的正确率。 展开更多
关键词 藏文pdf 藏文乱码 WORD文档 纠错
下载PDF
PDF文件中关键信息的提取与组织方法研究 被引量:12
3
作者 陈云榕 刘立柱 丁志鸿 《计算机工程与设计》 CSCD 北大核心 2007年第7期1688-1690,共3页
在PDF的各种应用中,对于文档的理解与处理是非常重要的。首先要从文档中提取相关的关键词和短语,以便于在文档内部或外部建立超链接,方便建立电子文档。因此提出了一种新的方法,将关键信息(关键性的单词、词组或区域)从PDF文件中提取出... 在PDF的各种应用中,对于文档的理解与处理是非常重要的。首先要从文档中提取相关的关键词和短语,以便于在文档内部或外部建立超链接,方便建立电子文档。因此提出了一种新的方法,将关键信息(关键性的单词、词组或区域)从PDF文件中提取出来,经过组织后,保存在称为KIU的文件中,这样可以在实际上不接触PDF文件的情况下,自动生成超链接。分区域的方法有利于提取过程,找到文本的位置和范围后,可以借助于光学字符识别(OCR)软件来提取文本中的关键性词语或词组。 展开更多
关键词 pdf文件 关键信息 文本提取 标准通用置标语言 超链接
下载PDF
PDF文件信息的抽取与分析 被引量:21
4
作者 李珍 田学东 《计算机应用》 CSCD 北大核心 2003年第12期145-147,共3页
PDF文件网络信息抽取的重要资源。通过对PDF文件结构的分析,针对最流行的线性PDF文件,在论述如何从源代码中取出正文内容字符串流并进行解码的基础上,对从解码后的字符串流中提取出文本及其相关的字体、字号和换行等文本信息进行了详细... PDF文件网络信息抽取的重要资源。通过对PDF文件结构的分析,针对最流行的线性PDF文件,在论述如何从源代码中取出正文内容字符串流并进行解码的基础上,对从解码后的字符串流中提取出文本及其相关的字体、字号和换行等文本信息进行了详细的讨论。这将有助于根据需要进一步抽取PDF文件信息。 展开更多
关键词 信息抽取 pdf文件 文本信息分析
下载PDF
方正书版大样转双层PDF文件的实现方法 被引量:7
5
作者 艾红 徐泽智 章丽萍 《武汉理工大学学报(信息与管理工程版)》 CAS 2011年第2期214-216,235,共4页
概述了方正书版大样转PDF文件方法的优缺点。根据科技期刊开放存取以及复制、检索的需要,提出一种用ps22pdf、Foxit PDF Editor等软件实现方正大样转双层PDF文件的新方法,所生成的PDF文件具有精确重现原文、能复制原文本和全文检索等功... 概述了方正书版大样转PDF文件方法的优缺点。根据科技期刊开放存取以及复制、检索的需要,提出一种用ps22pdf、Foxit PDF Editor等软件实现方正大样转双层PDF文件的新方法,所生成的PDF文件具有精确重现原文、能复制原文本和全文检索等功能,为科技期刊的开放存取提供了一种新的实现手段。 展开更多
关键词 方正书版大样 双层pdf文件 文本型pdf 图像型pdf
下载PDF
方正书版文件转换成PDF文件的若干方法比较 被引量:9
6
作者 王影 周菁菁 《出版科学》 CSSCI 北大核心 2012年第5期46-49,共4页
介绍多种方正书版文件转换PDF的方法,从转换条件和适用范围、转换效率、转换后文件尺寸、文件质量等方面对其中四种方法进行对比分析。结果表明:书版2008直接输出法、书版大样—标准PS-PDF法的转换效率高、转换质量好,可实现期刊社与作... 介绍多种方正书版文件转换PDF的方法,从转换条件和适用范围、转换效率、转换后文件尺寸、文件质量等方面对其中四种方法进行对比分析。结果表明:书版2008直接输出法、书版大样—标准PS-PDF法的转换效率高、转换质量好,可实现期刊社与作者的无障碍沟通及数字出版和网络出版的要求。研究结果为期刊社在众多转换方法中选择适合自身需求、软件资源和经济实力的方案提供参考,有助于推动期刊社的数字化和网络化进程。 展开更多
关键词 pdf文件 方正书版 转换 科技期刊
下载PDF
中文PDF文档数字水印算法 被引量:8
7
作者 张秋余 余冬梅 管伟 《计算机工程与设计》 CSCD 北大核心 2007年第24期5983-5984,5987,共3页
针对文本文档的真实性、完整性和版权保护问题,通过分析PDF文档和Postscript页面描述文件工作机制原理,提出一种专门针对中文PDF文档的数字水印算法。将根据原始文档字符特征码而生成的水印信息嵌入到文档字符间距中,从而实现了对文档... 针对文本文档的真实性、完整性和版权保护问题,通过分析PDF文档和Postscript页面描述文件工作机制原理,提出一种专门针对中文PDF文档的数字水印算法。将根据原始文档字符特征码而生成的水印信息嵌入到文档字符间距中,从而实现了对文档内容的保护。实验结果表明,利用该算法使得中文PDF文档具有了良好的防篡改性。 展开更多
关键词 数字水印 文本认证 pdf文档 PS文件 哈德码变换
下载PDF
PDF阅读器的设计与实现 被引量:10
8
作者 李强 刘时进 《计算机工程与设计》 CSCD 北大核心 2010年第7期1635-1638,共4页
为有效提取PDF(portable document format)文件中的文字、图片、图形信息,提出了包含文件预处理、显示预处理、功能扩展、显示4个单元的PDF阅读器的实现模型。基于PDF文件结构特点,提出了忽略次要信息定位关键位置的解析思路。在此基础... 为有效提取PDF(portable document format)文件中的文字、图片、图形信息,提出了包含文件预处理、显示预处理、功能扩展、显示4个单元的PDF阅读器的实现模型。基于PDF文件结构特点,提出了忽略次要信息定位关键位置的解析思路。在此基础上,针对FlateDecode、DCTDecode和CCITTFaxDecode这3种过滤器处理的数据流,给出了详细的解决方案,然后对PDF页面内容进行两次解析,设计相应的文字图形等数据结构保存结果,最后对数据利用和功能扩展进行了讨论。通过实验结果表明,该模型能较好地实现PDF信息提取和显示,有利于PDF在中文信息处理领域中的进一步开发利用。 展开更多
关键词 可移植文档格式 阅读器 文件解析 图像提取 信息处理
下载PDF
PDF在编辑工作中的应用 被引量:31
9
作者 张红林 胡昌平 《编辑学报》 CSSCI 北大核心 2001年第5期284-286,共3页
PDF是近年流行于互联网上的文件交换格式 ,它能保持原文件的排版格式和创建风格 ,能高保真压缩 ,可不依赖原创应用程序和操作平台显示和打印。PDF适宜传送编辑校样和广告图文 。
关键词 pdf 审稿 校对 文件传输 应用 编辑工作 学术期刊
下载PDF
一种将数字地图转换成PDF文件的方法 被引量:4
10
作者 邓术军 刘真 王晓理 《测绘科学技术学报》 北大核心 2001年第2期150-153,共4页
介绍了一种将数字地图转化成PDF文件的方法 ,该方法以PostScript语言描述的地图符号库为基础 ,将数字地图用PostScript语言的操作符进行描述 ,生成PS文件 ,再用AcrobatDistiller将其转换成PDF文件。
关键词 pdf文件 POSTSCRIPT语言 PostScript符号库 网络出版
下载PDF
利用方正小样与PDF文件的无缝对接实现远程校对 被引量:11
11
作者 李德华 《编辑学报》 CSSCI 北大核心 2008年第6期545-546,共2页
利用方正书版软件处理方正小样文件,利用方正PSPPRO输出软件的虚拟打印机功能将方正大样文件转换成PDF文件,以及Adobe Acrobat软件对PDF格式文件合并创建和注释等功能,以实现方正小样文件与PDF文件的无缝对接,并实现作者的远程校对,从... 利用方正书版软件处理方正小样文件,利用方正PSPPRO输出软件的虚拟打印机功能将方正大样文件转换成PDF文件,以及Adobe Acrobat软件对PDF格式文件合并创建和注释等功能,以实现方正小样文件与PDF文件的无缝对接,并实现作者的远程校对,从而提高作者校对的质量和效率。 展开更多
关键词 方正小样文件 pdf文件 无缝对接 远程校对
下载PDF
一种基于复合特征的恶意PDF检测方法 被引量:2
12
作者 李国 黄永健 +2 位作者 王静 徐俊洁 王鹏 《现代电子技术》 北大核心 2020年第2期45-48,52,共5页
为了提高特征有效性和扩大检测范围,提出在提取PDF文件的恶意结构特征的基础上再提取JavaScript的恶意特征;为了减少检测时间,提出在特征提取前,增加基于信息熵差异的预检测过程。先利用恶意PDF和良性PDF的信息熵差异筛选出可疑PDF文件... 为了提高特征有效性和扩大检测范围,提出在提取PDF文件的恶意结构特征的基础上再提取JavaScript的恶意特征;为了减少检测时间,提出在特征提取前,增加基于信息熵差异的预检测过程。先利用恶意PDF和良性PDF的信息熵差异筛选出可疑PDF文件和良性PDF文件;然后在检测过程中,提取可疑PDF文件的结构和JavaScript特征;再利用C5.0决策树算法进行分类;最后,通过实验检测,验证了提出的方法对恶意PDF文件检测有效。实验结果表明,与PJScan,PDFMS等模型做对比,该方法检测率比PJScan高27.79%,时间消耗低390 s,误检率比PDFMS低0.7%,时间消耗低473 s,综合性能更优。 展开更多
关键词 恶意pdf文档 文档检测 文件筛选 文件特征提取 信息熵预检 实验验证
下载PDF
一种快速将方正大样转为PDF格式校样的方法 被引量:2
13
作者 付中林 龚晓宁 陈小平 《武汉工程大学学报》 CAS 2007年第5期55-56,共2页
针对当前一些将方正大样文件转为PDF校样文件的方法的不足,介绍了一种采用书生公文阅读器1.3和Adobe Acorbat Reader将方正大样文件转为PDF文件,进而用Adobe Acorbat Reader软件的有关工具将该PDF文件制作成PDF校样文件的方法,该方法价... 针对当前一些将方正大样文件转为PDF校样文件的方法的不足,介绍了一种采用书生公文阅读器1.3和Adobe Acorbat Reader将方正大样文件转为PDF文件,进而用Adobe Acorbat Reader软件的有关工具将该PDF文件制作成PDF校样文件的方法,该方法价廉,且通用性强。 展开更多
关键词 书生公文阅读器1.3 方正大样文件 pdf校样
下载PDF
PDF文件文本内容提取研究 被引量:16
14
作者 张秀秀 张立峰 《科技情报开发与经济》 2008年第36期118-120,共3页
介绍了PDF的文件结构,在此基础上,给出了PDF文件的解析流程,以及从解析后的内容流中提取文本内容的方法。
关键词 pdf 文件解析 文本提取
下载PDF
将方正书版10.0小样文件转换为文本型PDF文件的简易方法 被引量:5
15
作者 李宗红 《渭南师范学院学报》 2010年第5期58-60,共3页
介绍两种将方正书版10.0小样文件转换为文本型PDF文件的具体方法,并对操作实践中遇到的问题以及解决方法予以阐述.通过比较,建议使用方正书版10.0排版的编辑部利用c2pfree 1.6软件,将CEB文件直接转换为文本型PDF文件,该文本型PDF文件尺... 介绍两种将方正书版10.0小样文件转换为文本型PDF文件的具体方法,并对操作实践中遇到的问题以及解决方法予以阐述.通过比较,建议使用方正书版10.0排版的编辑部利用c2pfree 1.6软件,将CEB文件直接转换为文本型PDF文件,该文本型PDF文件尺寸很小,利于网络传送. 展开更多
关键词 方正书版10.0 BookView c2pfree1.6 pdf文件
下载PDF
一种方正PS文件转换为数字化PDF文档的方法 被引量:7
16
作者 朱雪莲 李志伟 《泉州师范学院学报》 2012年第4期13-16,共4页
利用方正书版排版系统和开源应用程序PDF Creator,通过适当的设置,将含有文字、数学公式、表格和各种复杂图片等方正大样PS文件转换成高清晰的PDF文档.该方法具有操作简便、生成的文件小、清晰度高的特点.由于该方法所生成的PDF文件是... 利用方正书版排版系统和开源应用程序PDF Creator,通过适当的设置,将含有文字、数学公式、表格和各种复杂图片等方正大样PS文件转换成高清晰的PDF文档.该方法具有操作简便、生成的文件小、清晰度高的特点.由于该方法所生成的PDF文件是数字化的,因此可以直接在文档上进行复制、编校、修改、审读、打印等编辑工作,适用在线编校、审读和期刊的数字化上网. 展开更多
关键词 pdf格式 PS文件 数字化 方正排版 格式转换
下载PDF
方正书版系统PDF文档转化结果的利弊分析 被引量:2
17
作者 李哲峰 《宝鸡文理学院学报(自然科学版)》 CAS 2014年第1期66-72,共7页
目的研究方正书版系统排版结果转化为PDF文档对编辑出版工作带来的利与弊,充分认识其内在不足,以便合理使用。方法以不同的方正书版系统排版结果转化为PDF文档的方法和途径为例,对其转化结果的利与弊进行总结分析。结果通过不同途径使... 目的研究方正书版系统排版结果转化为PDF文档对编辑出版工作带来的利与弊,充分认识其内在不足,以便合理使用。方法以不同的方正书版系统排版结果转化为PDF文档的方法和途径为例,对其转化结果的利与弊进行总结分析。结果通过不同途径使方正书版系统的排版结果转化为PDF文档,因为转化途径各异,转化结果存在很大差别,但也有一些共性,对于数字化编辑与出版有利也有弊,扬长避短,加以合理利用,会对编辑出版工作带来便捷,但是其功能缺陷的致命弱点却不可忽视。结论充分认识不同途径得到的转化结果自身存在的利与弊,根据其目的与使用场合的不同,扬长避短,选择性区别使用至关重要。 展开更多
关键词 方正书版 pdf文档转化 pdf文档功能
下载PDF
关于利用PDF文档开发网络学习资源的探讨 被引量:2
18
作者 刘帅 柯秀文 《商丘职业技术学院学报》 2008年第5期48-49,共2页
在信息化教育阶段,网络学习资源具有激发学习者的学习兴趣,引发学习者高层次的思考,实现个性化学习的功能.PDF文档作为常见的电子文档格式之一,有着许多其他电子文档格式无法相比的优点.
关键词 pdf文档 WEB数据库 网络学习资源
下载PDF
把PDF文档应用于电子排版领域 被引量:4
19
作者 于晓燕 《自动化技术与应用》 2005年第3期54-55,共2页
本文描述了怎样把PDF文档应用于电子排版系统中 ,然后讨论了把电子排版系统中的文字、图象转化为PDF文档的几种方法 ,同时介绍了其中常用软件的制作方法。
关键词 pdf文档 电子排版系统
下载PDF
面向隐私保护的相似PDF文件外包自动合并方法
20
作者 周勇 翁锟源 +2 位作者 程航 严娜招 黄芹健 《福州大学学报(自然科学版)》 CAS 北大核心 2021年第6期732-738,共7页
传统相似PDF合并方法不仅费时、费力,而且准确性易受限于主观判断,且在线合并方式存在用户PDF文件明文内容泄露风险,易导致数据安全和用户个人隐私问题.为了解决以上问题,提出一种面向隐私保护的相似PDF文件外包自动合并方法.该方法根据... 传统相似PDF合并方法不仅费时、费力,而且准确性易受限于主观判断,且在线合并方式存在用户PDF文件明文内容泄露风险,易导致数据安全和用户个人隐私问题.为了解决以上问题,提出一种面向隐私保护的相似PDF文件外包自动合并方法.该方法根据PDF文件的结构特点并利用相似哈希函数提取文件特征信息,然后通过计算汉明距离来快速判断PDF文件间的相似度,继而引入秘密分享技术实现相似PDF文件的安全外包自动合并.实验结果表明,所提出的方法能够实现相似PDF文件合并,并确保外包待合并数据的安全性. 展开更多
关键词 隐私保护 秘密分享 pdf文件 相似哈希
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部