期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
一种改进的相似重复记录检测算法 被引量:7
1
作者 郭文龙 《计算机应用与软件》 CSCD 北大核心 2014年第1期293-295,共3页
数据仓库中相似重复记录的清洗对于提高数据质量有着重要意义,传统的判重算法有SNM算法、MPN算法及KNN算法等。针对MPN算法判重精度和时间效率不高等缺陷,提出一种改进的MPN算法。根据记录属性的重要性分别设定属性权值,将属性切分为原... 数据仓库中相似重复记录的清洗对于提高数据质量有着重要意义,传统的判重算法有SNM算法、MPN算法及KNN算法等。针对MPN算法判重精度和时间效率不高等缺陷,提出一种改进的MPN算法。根据记录属性的重要性分别设定属性权值,将属性切分为原子,进一步计算原子的权值,通过判定属性相似度进而判定记录相似度,提高查准率和查全率。采用均分大数据集为若干数据子集,并行采用MPN算法进行判重,提高判重时间效率。理论和实验分析表明该方法提高了相似重复记录检测的准确率和时间效率。 展开更多
关键词 相似重复记录属性检测 MPN算法
下载PDF
基于高阶统计量的地震子波提取方法评价 被引量:8
2
作者 陈健 戴永寿 +2 位作者 张亚南 魏玉琴 丁进杰 《石油地球物理勘探》 EI CSCD 北大核心 2013年第3期497-503,506+332,共7页
基于高阶统计量的子波提取方法可提取一个非最小相位的地震子波,但需要对地震资料和地下反射系数序列分布进行一定假设,且子波提取方法是一个开环过程,在实际应用中还存在提取子波的稳定性、唯一性、精度、抗噪能力、收敛性及带限数据... 基于高阶统计量的子波提取方法可提取一个非最小相位的地震子波,但需要对地震资料和地下反射系数序列分布进行一定假设,且子波提取方法是一个开环过程,在实际应用中还存在提取子波的稳定性、唯一性、精度、抗噪能力、收敛性及带限数据长度适应性等问题,因此该法的有效性及提取子波的准确性仍有待验证。本文对主要的几种子波提取方法进行了综述,其中包括:基于测井资料进行井旁子波提取评价、利用地震反演进行子波提取评价、基于合成地震记录与实际地震记录比较的子波提取评价、基于子波本身属性的子波提取评价。文中对各方法的优势和不足进行了全面分析,认为基于地震记录属性参数和子波属性的动态评价方法能够更有效地评价子波提取方法的有效性和提取子波的精度,通过分析提取子波的属性参数和相应的地震记录的属性参数之间的关系及其对基于高阶统计量的子波提取方法的影响程度,可为子波提取方法的修正和完善提供借鉴。 展开更多
关键词 高阶统计量 地震子波提取 评价 地震反演 地震记录属性 子波属性
下载PDF
立足长远 服务当前——机关档案实行双套制管理好处多 被引量:7
3
作者 勾永雯 《四川档案》 北大核心 1999年第5期31-31,共1页
关键词 双套制 机关档案室 档案管理 档案工作 立卷归档 意外损坏 文档一体化 查阅者 记录属性 重份文件
下载PDF
反向梯度深度学习下重复网络数据标注仿真
4
作者 庞家乐 张彦 《计算机仿真》 北大核心 2022年第10期467-470,485,共5页
不及时标注合处理网络数据中的重复数据,会影响用户使用与操作体验。现有的重复数据标注方法无法排列比较数据记录间的属性,导致重复数据标注不准确。为此提出新的重复数据标注方法。通过综合加权法计算数据库中所有数据的属性权重值,... 不及时标注合处理网络数据中的重复数据,会影响用户使用与操作体验。现有的重复数据标注方法无法排列比较数据记录间的属性,导致重复数据标注不准确。为此提出新的重复数据标注方法。通过综合加权法计算数据库中所有数据的属性权重值,重新定义每个数据字符串间距离,得到数据间相似度值,并设定标记值。引入反向梯度学习算法,排列比较数据记录间的属性。给定每个数据唯一ID编号,构建专属的属性值记录表,通过与选定的数值比较,确定数据间是否存在重复情况。若存在重复数据,利用三区分快速算法直接标注对应的数据。对比实验结果表明所提方法耗时最短,实现重复数据高精准度的检测与标注。 展开更多
关键词 反向梯度深度学习 重复数据标注 相似度值 属性记录 三区分快速算法
下载PDF
一种基于事实知识的实体相关度计算方法
5
作者 孙叔琦 孙珂 +3 位作者 赵世奇 李生 王海峰 杨沐昀 《中文信息学报》 CSCD 北大核心 2016年第3期178-186,共9页
在近来出现的面向实体的搜索服务中,准确地预测实体间的相关程度是至关重要的。该文提出了一种基于实体的事实知识,即利用"实体—属性—属性值"(SPO)记录进行实体相关度计算的方法。该文通过基于属性和属性值的两步概率估计,... 在近来出现的面向实体的搜索服务中,准确地预测实体间的相关程度是至关重要的。该文提出了一种基于实体的事实知识,即利用"实体—属性—属性值"(SPO)记录进行实体相关度计算的方法。该文通过基于属性和属性值的两步概率估计,将实体表示为一个属性值词的概率分布列,并通过比对两个实体共享的属性值词汇得出二者的相关度。实验表明,在用于面向实体搜索的相关实体排序问题上,该文方法达到了80.9%的平均top-5准确率,优于词袋方法和基于查询日志共现的方法。此外,该文通过定量分析,考察了不同领域的用户需求特性对实体相关度计算结果的影响。 展开更多
关键词 实体相关度 实体—属性属性值(SPO)记录 用户需求 面向实体的搜索
下载PDF
西文连续出版物RDA数据编目实践探索 被引量:2
6
作者 夏晓林 陈学清 《图书馆学研究》 CSSCI 北大核心 2019年第3期60-67,共8页
在新旧编目规则交替之际,为了进一步推广RDA在我国图书馆领域的应用,文章运用理论联系实践的方法,在分析RDA对AACR2主要变化的基础上,依据最新的编目规则RDA,采用几经修改的MARC21格式,从记录属性和描述关系两大方面对特殊类型资源西文... 在新旧编目规则交替之际,为了进一步推广RDA在我国图书馆领域的应用,文章运用理论联系实践的方法,在分析RDA对AACR2主要变化的基础上,依据最新的编目规则RDA,采用几经修改的MARC21格式,从记录属性和描述关系两大方面对特殊类型资源西文连续出版物进行书目数据编目,并由此总结出:RDA规则优越于AACR2,按其理念编目的数据更为细致、全面、立体化,为实现关联数据、资源共享提供先决条件,但是RDA的实际使用效果(实现用户任务)如何,还有待于新型书目框架和图书馆系统的改造。 展开更多
关键词 RDA AACR2 西文连续出版物 编目 记录属性 描述关系
原文传递
Development of genic SSR markers from transcriptome sequencing of pear buds 被引量:10
7
作者 Xiao-yan YUE Guo-qin LIU +2 位作者 Yu ZONG Yuan-wen TENG Dan-ying CAI 《Journal of Zhejiang University-Science B(Biomedicine & Biotechnology)》 SCIE CAS CSCD 2014年第4期303-312,共10页
A total of 8375 genic simple sequence repeat(SSR) loci were discovered from a unigene set assembled from 116282 transcriptomic unigenes in this study.Dinucleotide repeat motifs were the most common with a frequency ... A total of 8375 genic simple sequence repeat(SSR) loci were discovered from a unigene set assembled from 116282 transcriptomic unigenes in this study.Dinucleotide repeat motifs were the most common with a frequency of 65.11%,followed by trinucleotide(32.81%).A total of 4100 primer pairs were designed from the SSR loci.Of these,343 primer pairs(repeat length≥15 bp) were synthesized with an M13 tail and tested for stable amplification and polymorphism in four Pyrus accessions.After the preliminary test,104 polymorphic genic SSR markers were developed; dinucleotide and trinucleotide repeats represented 97.11%(101) of these.Twenty-eight polymorphic genic SSR markers were selected randomly to further validate genetic diversity among 28 Pyrus accessions.These markers displayed a high level of polymorphism.The number of alleles at these SSR loci ranged from 2 to 17,with a mean of 9.43 alleles per locus,and the polymorphism information content(PIC) values ranged from 0.26 to 0.91.The UPGMA(unweighted pair-group method with arithmetic average) cluster analysis grouped the 28 Pyrus accessions into two groups: Oriental pears and Occidental pears,which are congruent to the traditional taxonomy,demonstrating their effectiveness in analyzing Pyrus phylogenetic relationships,enriching rare Pyrus EST-SSR resources,and confirming the potential value of a pear transcriptome database for the development of new SSR markers. 展开更多
关键词 Genic marker Simple sequence repeat TRANSCRIPTOME Genetic diversity PYRUS
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部