期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
段落检索技术的综述
1
作者 黄水清 黄文昕 金洁琴 《情报探索》 2007年第3期51-52,共2页
介绍了国外对段落检索中段落切分方法、段落检索算法及段落检索方法3项关键技术的研究现状,以及目前的一些应用和未来的研究方向。
关键词 段落检索 段落切分 检索算法 检索方法
下载PDF
地质灾害信息存储技术及检索方法 被引量:2
2
作者 姚梦辉 刘军旗 +2 位作者 封瑞雪 陈根深 赵剑雄 《计算机系统应用》 2018年第6期209-213,共5页
地质灾害调查、勘查及防治等工作过程中,获取了大量的多源异构数据,其中的文本数据多以文件名检索或大字段形式整体存储,这种传统的存储方式不能满足文本信息中有用信息的快速检索与提取,是当前地质灾害数据存储和检索所面临的一个重要... 地质灾害调查、勘查及防治等工作过程中,获取了大量的多源异构数据,其中的文本数据多以文件名检索或大字段形式整体存储,这种传统的存储方式不能满足文本信息中有用信息的快速检索与提取,是当前地质灾害数据存储和检索所面临的一个重要问题.本文基于非结构化数据库技术、中文分词技术、关键词提取技术,实现了地质灾害文本数据中任意有用信息的快速检索及与统计,可以为灾害数据的深层挖掘与融合提供有力支持. 展开更多
关键词 地质灾害 非结构化数据库 中文分词 段落切分 信息检索
下载PDF
一种面向PDF文档的文本复制优化方法研究 被引量:1
3
作者 贺伟雄 柏林元 郭文娟 《软件》 2022年第7期63-67,共5页
针对当前主流PDF阅读器复制文字尤其是中英文混合排版文字时存在的全角字符、错误标点符号、多余换行符和空格等问题,提出了一种面向PDF文档的文本复制优化方法,通过剪贴板监听自动感知复制内容变化,基于正则表达式分析复制文本内容特... 针对当前主流PDF阅读器复制文字尤其是中英文混合排版文字时存在的全角字符、错误标点符号、多余换行符和空格等问题,提出了一种面向PDF文档的文本复制优化方法,通过剪贴板监听自动感知复制内容变化,基于正则表达式分析复制文本内容特点并采用不同优化策略修正文本格式错误,并提出了3种不同的段落切分策略正确识别文本中的段落,实现了用户“无感知”情况下的复制文本自动优化。在报纸、社科、理工和国防类期刊等4类PDF数据集的实验表明,与直接复制相比,提出的方法能够消除95%以上的格式错误,极大地减轻了人工负担,提高了处理效率。 展开更多
关键词 PDF文档 文本复制 文本优化 段落切分
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部