期刊文献+
共找到172篇文章
< 1 2 9 >
每页显示 20 50 100
A Complexity Analysis and Entropy for Different Data Compression Algorithms on Text Files
1
作者 Mohammad Hjouj Btoush Ziad E. Dawahdeh 《Journal of Computer and Communications》 2018年第1期301-315,共15页
In this paper, we analyze the complexity and entropy of different methods of data compression algorithms: LZW, Huffman, Fixed-length code (FLC), and Huffman after using Fixed-length code (HFLC). We test those algorith... In this paper, we analyze the complexity and entropy of different methods of data compression algorithms: LZW, Huffman, Fixed-length code (FLC), and Huffman after using Fixed-length code (HFLC). We test those algorithms on different files of different sizes and then conclude that: LZW is the best one in all compression scales that we tested especially on the large files, then Huffman, HFLC, and FLC, respectively. Data compression still is an important topic for research these days, and has many applications and uses needed. Therefore, we suggest continuing searching in this field and trying to combine two techniques in order to reach a best one, or use another source mapping (Hamming) like embedding a linear array into a Hypercube with other good techniques like Huffman and trying to reach good results. 展开更多
关键词 text fileS Data Compression HUFFMAN Coding LZW Hamming ENTROPY COMPLEXITY
下载PDF
基于改进KNN算法的档案信息文本自动分类方法研究
2
作者 潘国炀 《信息与电脑》 2024年第4期71-73,共3页
常规的档案信息文本自动分类方法主要使用Bloom二维分类矩阵标注分类特征,导致分类评价指标偏低。对此,提出基于改进K最近邻(K-Nearest Neighbor,KNN)算法的档案信息文本自动分类方法,即提取档案信息文本自动分类特征,再利用改进KNN算... 常规的档案信息文本自动分类方法主要使用Bloom二维分类矩阵标注分类特征,导致分类评价指标偏低。对此,提出基于改进K最近邻(K-Nearest Neighbor,KNN)算法的档案信息文本自动分类方法,即提取档案信息文本自动分类特征,再利用改进KNN算法优化信息文本自动分类流程,实现档案信息文本自动分类。实验结果表明,基于改进KNN算法的档案信息文本自动分类方法的加权精确率(weighted-P)、加权召回率(weighted-R)、加权F值(weighted-F)均较高,证明该方法的分类效果较好,有一定的应用价值。 展开更多
关键词 档案信息 文本 自动分类
下载PDF
面向法院电子卷宗的文本分类方法研究
3
作者 王霄 万玉晴 《计算机应用与软件》 北大核心 2024年第6期101-107,133,共8页
针对法院电子卷宗文本分类的主要问题,给出相应解决方案。提出卷宗文件的多维度语义表示方法,得到更准确全面的文本特征信息;使用基于高斯核的KELM(Kernel Extreme Learning Machine)学习文本分类器,获取全局最优解的同时大幅提高训练效... 针对法院电子卷宗文本分类的主要问题,给出相应解决方案。提出卷宗文件的多维度语义表示方法,得到更准确全面的文本特征信息;使用基于高斯核的KELM(Kernel Extreme Learning Machine)学习文本分类器,获取全局最优解的同时大幅提高训练效率;使用基于RLS(Recursive Least Squares)的序列优化模型KOS-ELM,通过新样本对模型参数迭代更新,使分类模型具备在线自学习的能力,减少了对初始样本的依赖。对比实验证明,基于高斯核的KELM分类模型在正确率上比BP网络模型和LSSVM分别提高了2.66百分点和4.43百分点,但训练时间只有两者的1/6和1/10;采用多维度语义表示方法为模型提供输入,在正确率上比文本向量和词向量表示方法分别提高了8.84百分点和2.33百分点;采用基于RLS的序列优化模型KOS-ELM对弱分类器进行迭代优化,以4种不同步长迭代20次后,分类正确率均得到显著提升。 展开更多
关键词 法院电子卷宗 文本分类 语义表示 核极限学习机 递归最小二乘
下载PDF
使用FileMaker构建个性化文物管理数据库的实践
4
作者 戎子卿 《文物保护与考古科学》 北大核心 2015年第1期89-95,共7页
"三普"软件作为文物数据的采集软件,其数据全面、完整,但在基层文物单位日常工作中,其操作性不佳、使用不便。为了更好地整合、利用这些多元的信息,研究使用FileMaker数据库构建个性化的文物普查数据利用环境,增强系统的操作... "三普"软件作为文物数据的采集软件,其数据全面、完整,但在基层文物单位日常工作中,其操作性不佳、使用不便。为了更好地整合、利用这些多元的信息,研究使用FileMaker数据库构建个性化的文物普查数据利用环境,增强系统的操作性和便捷性,实现普查数据在移动终端上的共享,提升文物信息资源的发掘利用水平,让文物工作者可以轻松自制文物数据管理系统。结果表明,量身定制一套符合自身实际工作需求的文物管理系统,是让少量科研经费发挥较大效用的一个切实有效的方法。 展开更多
关键词 文物管理数据库 fileMAKER 全文检索 性能价格比
下载PDF
基于Alluxio的新闻文本存储优化方法
5
作者 桂静 王永滨 《中国传媒大学学报(自然科学版)》 2023年第6期12-18,共7页
新闻数据的指数级增长对新闻的高效存储和管理提出了重大挑战。为解决存储与计算分离模式下新闻文本的存储与读访问瓶颈问题,提出了一种基于数据编排平台Alluxio的新闻文本存储优化方法。首先,利用Alluxio对不同存储系统中的新闻文本进... 新闻数据的指数级增长对新闻的高效存储和管理提出了重大挑战。为解决存储与计算分离模式下新闻文本的存储与读访问瓶颈问题,提出了一种基于数据编排平台Alluxio的新闻文本存储优化方法。首先,利用Alluxio对不同存储系统中的新闻文本进行缓存并提供统一命名空间,加速了计算应用的数据访问。其次,为了解决新闻文本存储在远程场景下所面临的读访问性能瓶颈问题,对新闻文本进行了基于目录聚合的合并,并利用最小完美哈希算法对新闻文本元数据构建索引,实现了新闻文本的快速检索。 展开更多
关键词 分布式系统 新闻数据 小文件存储 缓存 Alluxio
下载PDF
基于文本特征识别的医院电子档案自动分类系统设计 被引量:1
6
作者 王杰 《信息与电脑》 2023年第7期195-197,共3页
针对传统系统在医院电子档案自动分类中存在错分率高、分类效率低的问题,设计基于文本特征识别的医院电子档案自动分类系统。首先,建立电子档案文本信息处理模块、文本特征识别模块、自动分类模块3个功能模块;其次,对档案文本信息聚类,... 针对传统系统在医院电子档案自动分类中存在错分率高、分类效率低的问题,设计基于文本特征识别的医院电子档案自动分类系统。首先,建立电子档案文本信息处理模块、文本特征识别模块、自动分类模块3个功能模块;其次,对档案文本信息聚类,提取电子档案文本特征,根据特征进行档案自动化分类;最后,进行实验对比分析。实验结果表明,该系统的错分率在1%以内,分类效率在95%以上,具有一定的应用价值。 展开更多
关键词 文本特征识别 电子档案 自动分类 错分率 分类效率
下载PDF
基于文本特征识别的医院电子档案自动分类系统设计
7
作者 刘伟 《信息与电脑》 2023年第23期171-173,共3页
随着医疗信息化的快速发展,医院电子档案的数量迅速增长,急需有效的管理与分类系统来提高工作效率和数据质量。传统的手动分类方法不仅耗时且易出错,严重影响了医院信息系统的运行效率和服务质量。因此,设计一个基于文本特征识别的自动... 随着医疗信息化的快速发展,医院电子档案的数量迅速增长,急需有效的管理与分类系统来提高工作效率和数据质量。传统的手动分类方法不仅耗时且易出错,严重影响了医院信息系统的运行效率和服务质量。因此,设计一个基于文本特征识别的自动分类系统显得尤为重要。文章旨在设计并实现一个高效的医院电子档案自动分类系统,通过利用先进的文本处理技术和算法,实现高效准确的档案管理。 展开更多
关键词 文本特征识别 医院电子档案 自动分类系统
下载PDF
基于BERT-CRF模型的火灾事故案例实体识别研究
8
作者 关斯琪 董婷婷 +1 位作者 万子敬 何元生 《消防科学与技术》 CAS 北大核心 2023年第11期1529-1534,共6页
为实现火灾事故调查档案的关键信息抽取,提出一种基于BERT-CRF模型的文本命名实体识别方法。通过对161篇事故报告进行实体标注及数据增强,构建了火灾事故文本语料集;基于BERT预训练模型,对语料集中的句子序列进行双向特征提取,深度挖掘... 为实现火灾事故调查档案的关键信息抽取,提出一种基于BERT-CRF模型的文本命名实体识别方法。通过对161篇事故报告进行实体标注及数据增强,构建了火灾事故文本语料集;基于BERT预训练模型,对语料集中的句子序列进行双向特征提取,深度挖掘事故文本上下文的语义信息;结合CRF模型,充分考虑标签转移规则,对关键实体进行预测。试验表明:本文方法在火灾事故案例实体识别任务中的精确率、召回率以及F1值分别为76.36%、86.19%、80.97%,优于BERT和BERT-BiLSTM-CRF模型,且训练时长较BERT-BiLSTMCRF模型缩短61 s。本文方法可为火灾调查知识库、案卷编制等下游系统提供准确的实体构建服务。 展开更多
关键词 命名实体识别 BERT-CRF 火灾事故 消防信息 火灾事故调查档案 语料集 火灾事故文本
下载PDF
以图文电子档案模式为基础设计医疗器械管理系统的应用
9
作者 郭伟国 杨雯婷 朱日辉 《中外医药研究》 2023年第9期142-144,共3页
目的:设计以图文电子档案模式为基础的医疗器械管理系统,并分析其应用效果。方法:以广东省台山市妇幼保健院305件设备作为研究对象,其中低价器械169件,高价器械24件,医疗试剂112件。比较管理前(2020年4月—2021年4月建立医疗器械管理系... 目的:设计以图文电子档案模式为基础的医疗器械管理系统,并分析其应用效果。方法:以广东省台山市妇幼保健院305件设备作为研究对象,其中低价器械169件,高价器械24件,医疗试剂112件。比较管理前(2020年4月—2021年4月建立医疗器械管理系统前)、管理后(2021年5月—2022年5月建立医疗器械管理系统后)情况。记录管理前后低价器械、高价器械以及医疗试剂花费情况,统计两组器械每月维修费用。结果:管理后低价器械、高价器械以及医疗试剂花费均低于管理前,差异有统计学意义(P<0.05);管理后每月维修费用均低于管理前,差异有统计学意义(P<0.05)。结论:以图文电子档案模式为基础设计的医疗器械管理系统可对医疗器械进行精细化管理,能够保证医疗器械的安全运用,一定程度减少医疗器械的不合理使用,进一步降低器械的维修费用。 展开更多
关键词 医疗器械 图文电子档案 管理系统
下载PDF
Josephus问题的算法设计与应用研究 被引量:9
10
作者 陈海山 钱锋 +1 位作者 田英 雷鸣 《计算机工程与应用》 CSCD 北大核心 2007年第1期61-64,共4页
Josephus问题是组合数学的发展源头之一。关于Josephus问题的描述形式甚多。文章通过实验和分析,总结了一个通用性的描述形式,并给出了基于循环链表的算法设计。算法的数据源从文本文件中获取,增强了算法的实用性;根据数据元素值的递增... Josephus问题是组合数学的发展源头之一。关于Josephus问题的描述形式甚多。文章通过实验和分析,总结了一个通用性的描述形式,并给出了基于循环链表的算法设计。算法的数据源从文本文件中获取,增强了算法的实用性;根据数据元素值的递增顺序建立循环链表,能够有效地分类数据,使Josephus数据序列均匀分布且不重复。文章还给出了Josephus问题的若干个应用实例,包括将Josephus问题应用于通用试题库的组卷算法和找出一组数据中某个指定范围的数据序列等。 展开更多
关键词 Josephus问题 算法设计 动态循环链表 文本文件
下载PDF
数据通信中文本文件无损压缩算法的实现 被引量:6
11
作者 袁占亭 张秋余 +1 位作者 冯涛 田思 《计算机工程与应用》 CSCD 北大核心 2001年第9期44-46,共3页
针对目前人们对数据通信的需求日益增加,由于种种原因,数据通信的速率还不够高,数据通信的低速率已经成为数据通信系统的瓶颈。在“短波单边带微机信息传输系统”中,作者利用基于字典的LZW无损压缩算法(对象是文本文件),实现... 针对目前人们对数据通信的需求日益增加,由于种种原因,数据通信的速率还不够高,数据通信的低速率已经成为数据通信系统的瓶颈。在“短波单边带微机信息传输系统”中,作者利用基于字典的LZW无损压缩算法(对象是文本文件),实现了用软件的方法将通信速率提高了大于300%的实际效果。编程语言采用VC++,并制作成.DLL文件。 展开更多
关键词 数据通信 LZW 无损压缩 文本文件 字典 算法
下载PDF
监控文本文件内容变化的文本比较算法 被引量:12
12
作者 王艳清 王云维 《计算机应用》 CSCD 北大核心 2010年第A01期133-134,142,共3页
为了判断文本文件的内容是否发生变化,确定变化的内容,并尽量降低系统开销,提出了一种基于位置的文本文件比较算法。算法利用位置优先原则,简化了比较过程。实验结果表明该算法可以应用于文件监控,而且易于理解。
关键词 文件监控 信息安全 文本比较算法 文本文件 篡改
下载PDF
基于中文词编码的压缩算法ZHCP的实现 被引量:4
13
作者 朱巧明 赵英英 钱培德 《小型微型计算机系统》 CSCD 北大核心 2003年第2期306-308,共3页
本文提出并实现了一个基于词编码的 ZHCP中文文本压缩算法 ;通过大量的对相同文本分别使用传统编码算法与 ZHCP算法压缩后得到的结果数据对比 ,表明基于词编码的
关键词 中文词编码 压缩算法 ZHCP 中文文本压缩 汉字信息处理 信息熵
下载PDF
变电站综合自动化监控系统数据展现软件的研制 被引量:4
14
作者 罗安 方璐 +1 位作者 徐先勇 孙贤大 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2007年第11期42-46,共5页
根据广东某冶炼厂变电站的电网结构特点及实际需求设计了基于分层分布式结构的变电站综合自动化监控系统.结合系统硬件设计特点和要求,针对该监控系统数据展现软件数据量大、刷新快、频繁读取的特点,提出采用文本文件存储方式和建立四... 根据广东某冶炼厂变电站的电网结构特点及实际需求设计了基于分层分布式结构的变电站综合自动化监控系统.结合系统硬件设计特点和要求,针对该监控系统数据展现软件数据量大、刷新快、频繁读取的特点,提出采用文本文件存储方式和建立四维数组来解析数据,同时利用ActiveX数据对象技术和UDP网络通信协议分别实现系统数据访问与传输.该系统已经成功投运,实际运行结果表明该系统设计方案可行,工作稳定可靠,效果良好. 展开更多
关键词 文本文件存储 数据解析与展现 ACTIVEX数据对象 UDP通信协议
下载PDF
J2ME平台下文本阅读器的实现 被引量:10
15
作者 瞿英 王玉恒 李冬梅 《微计算机信息》 北大核心 2005年第10X期151-153,共3页
本文利用J2ME技术开发了一个文本阅读器,实现了手机对文本文件的显示,给出了该程序的实现代码,并对其关键技术进行了详细阐述。
关键词 J2ME 文本阅读器 JAVA 手机
下载PDF
一种全文检索系统的设计与实现 被引量:13
16
作者 涂新辉 何婷婷 罗景 《计算机工程》 EI CAS CSCD 北大核心 2005年第17期55-57,共3页
在对全文检索有关技术进行分析和研究的基础之上,提出并实现了一个实用的全文检索系统UFRS,它能够处理中英文文档并可以扩展到其它语言,支持多种不同的索引存储方案以及分布式检索。依次讨论了该系统中的存储层、词法语法分析层、系统... 在对全文检索有关技术进行分析和研究的基础之上,提出并实现了一个实用的全文检索系统UFRS,它能够处理中英文文档并可以扩展到其它语言,支持多种不同的索引存储方案以及分布式检索。依次讨论了该系统中的存储层、词法语法分析层、系统核心接口层。最后给出了该系统的一种分布式部署方案。 展开更多
关键词 全文检索 全文索引 倒排文件 分布式
下载PDF
基于J-Link的Pro/E开发及在夹具设计中的应用 被引量:7
17
作者 何培英 李月琴 《煤矿机械》 北大核心 2006年第9期97-99,共3页
简要说明基于J-Link的Pro/E开发必须进行的3项工作,详细阐述了实现Pro/E与J-Link应用程序、无缝链接的程序开发结构,并通过开发的夹具设计实例说明了J-Link应用程序的应用。
关键词 J-Link应用程序 注册文件 文本文件 夹具设计
下载PDF
基于PE文件无容量限制的信息隐藏技术研究 被引量:8
18
作者 李钱 方勇 +1 位作者 谭登龙 张长山 《计算机应用研究》 CSCD 北大核心 2011年第7期2758-2760,共3页
分析了现有的基于PE文件信息隐藏技术及其不足,提出一种以扩充.text节达到无容量限制的信息隐藏方案。通过对嵌入的信息进行加密、完整性校验、代码伪装、混合原代码等预处理,再根据预处理后的信息大小扩充.text节,并调整随后的各个节... 分析了现有的基于PE文件信息隐藏技术及其不足,提出一种以扩充.text节达到无容量限制的信息隐藏方案。通过对嵌入的信息进行加密、完整性校验、代码伪装、混合原代码等预处理,再根据预处理后的信息大小扩充.text节,并调整随后的各个节以及输入表的位置,以及PE头的各个相应标志的值,保证嵌入信息后的PE文件仍然能正常执行。实验表明,该方案不仅能达到无容量限制的信息隐藏,而且具有一定的隐蔽性和鲁棒性。 展开更多
关键词 信息隐藏 PE文件 text 密码学 无容量限制
下载PDF
一种实现数据库数据到XML文档的转换方法 被引量:3
19
作者 赵晓 陈桦 侯勃峰 《西安工业大学学报》 CAS 2007年第4期397-400,共4页
为了对网络上的数据实现有效的管理和交换,出现了以关系数据库作为存储载体,以XML为数据交换载体的管理模式.针对如何将关系数据库数据转换为XML文档的问题,利用JDOM技术实现数据库数据到XML文档数据转换的方案,并通过实例验证了这一方... 为了对网络上的数据实现有效的管理和交换,出现了以关系数据库作为存储载体,以XML为数据交换载体的管理模式.针对如何将关系数据库数据转换为XML文档的问题,利用JDOM技术实现数据库数据到XML文档数据转换的方案,并通过实例验证了这一方案的可行性. 展开更多
关键词 JDOM技术 数据库 XML文档 数据转换
下载PDF
基于邻接矩阵的全文索引模型(英文) 被引量:10
20
作者 周水庚 胡运发 关佶红 《软件学报》 EI CSCD 北大核心 2002年第10期1933-1942,共10页
文本信息的急剧增加和越来越多的用户通过在线方式获取文本信息,使得查询效率成为信息检索系统一个突出瓶颈.提出两种新型全文索引模型,用于改善信息检索系统的查询效率.通过使用有向图表示文本串,引出关于文本串的邻接矩阵;采用两种不... 文本信息的急剧增加和越来越多的用户通过在线方式获取文本信息,使得查询效率成为信息检索系统一个突出瓶颈.提出两种新型全文索引模型,用于改善信息检索系统的查询效率.通过使用有向图表示文本串,引出关于文本串的邻接矩阵;采用两种不同的方式实现文本串邻接矩阵,导出了两种基于邻接矩阵的新型全文索引模型,即基于邻接矩阵的倒排文件和基于邻接矩阵的PAT数组.给出了基于新模型的文本查询算法;分析了新模型的存储空间和查询时间的开销,并分别与两种传统索引模型进行了比较.对实际文本库进行了测试以证实新模型的效能.新模型能够以相对于原文较小的空间代价获得较大幅度的查询效率的提高,因此适合于在大规模文本检索系统中应用. 展开更多
关键词 邻接矩阵 全文索引模型 倒排文 PAT数组 信息检索系统
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部