期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于改进CDC的实验原始记录匹配算法
1
作者
蔡伊娜
陈新
+5 位作者
覃志武
王歆
包先雨
彭锦学
林泳奇
李俊霖
《深圳大学学报(理工版)》
CAS
CSCD
北大核心
2022年第5期509-514,共6页
针对当前实验室检测报告的生成过程存在时间长和易出现偶然性差错等问题,提出基于栅栏因子的通用实验原始记录文件自动抓取技术.先通过计算文件整体hash值准确过滤当日已读取文件,再使用改进的内容可变长度分块(content-defined chunkin...
针对当前实验室检测报告的生成过程存在时间长和易出现偶然性差错等问题,提出基于栅栏因子的通用实验原始记录文件自动抓取技术.先通过计算文件整体hash值准确过滤当日已读取文件,再使用改进的内容可变长度分块(content-defined chunking,CDC)算法进行文本分块.该CDC算法改进之处主要体现在:设定滑动窗口下一单位为行与行间距之和的高度以及滑动窗口内字节大小的范围.待文本分块结束后,使用基于数据块索引的字符串匹配算法完成匹配.该字符串匹配算法结合数据块索引表构建模式串与数据块的映射关系,之后由模式串Pn通过数据块索引表快速匹配到相应数据块.使用海关实验室的实验原始记录文件进行测试,实验证明,该算法的内存占用量少且分块吞吐量更大.
展开更多
关键词
计算机应用
数据块
模式串
字符串匹配
实验原始记录
内容可变长度分块算法
实验室检测报告
下载PDF
职称材料
题名
基于改进CDC的实验原始记录匹配算法
1
作者
蔡伊娜
陈新
覃志武
王歆
包先雨
彭锦学
林泳奇
李俊霖
机构
深圳市检验检疫科学研究院
深圳海关食品检验检疫技术中心
深圳海关信息中心
出处
《深圳大学学报(理工版)》
CAS
CSCD
北大核心
2022年第5期509-514,共6页
基金
国家重点研发计划资助项目(2019YFC1605504,2018YFC1603601)。
文摘
针对当前实验室检测报告的生成过程存在时间长和易出现偶然性差错等问题,提出基于栅栏因子的通用实验原始记录文件自动抓取技术.先通过计算文件整体hash值准确过滤当日已读取文件,再使用改进的内容可变长度分块(content-defined chunking,CDC)算法进行文本分块.该CDC算法改进之处主要体现在:设定滑动窗口下一单位为行与行间距之和的高度以及滑动窗口内字节大小的范围.待文本分块结束后,使用基于数据块索引的字符串匹配算法完成匹配.该字符串匹配算法结合数据块索引表构建模式串与数据块的映射关系,之后由模式串Pn通过数据块索引表快速匹配到相应数据块.使用海关实验室的实验原始记录文件进行测试,实验证明,该算法的内存占用量少且分块吞吐量更大.
关键词
计算机应用
数据块
模式串
字符串匹配
实验原始记录
内容可变长度分块算法
实验室检测报告
Keywords
computer application
data block
pattern string
string matching
original experimental record
content-defined chunking algorithm
generation of test reports
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于改进CDC的实验原始记录匹配算法
蔡伊娜
陈新
覃志武
王歆
包先雨
彭锦学
林泳奇
李俊霖
《深圳大学学报(理工版)》
CAS
CSCD
北大核心
2022
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部