期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于前缀剪枝的大规模向量空间相似检索框架
1
作者 刘健博 邓凌风 +1 位作者 李文海 田野 《软件导刊》 2024年第6期92-97,共6页
针对大规模文本集合下基于权重的相似性查询问题,提出一种支持前缀剪枝的高效检索框架。首先给出向量空间模型下相似性及其带权前缀定义,理论证明了带权前缀剪枝的正确性;其次,面向大规模文本查询,提出一种新的倒排索引结构,利用索引叶... 针对大规模文本集合下基于权重的相似性查询问题,提出一种支持前缀剪枝的高效检索框架。首先给出向量空间模型下相似性及其带权前缀定义,理论证明了带权前缀剪枝的正确性;其次,面向大规模文本查询,提出一种新的倒排索引结构,利用索引叶节点维护记录的前缀权重,并基于该索引构建高效的相似检索算法;最后,在TF/IDF权重策略下证明该方法能够有效支持大规模带权相似检索。结果表明,其查询效率较Lucene的归并验证策略提升了5倍以上。 展开更多
关键词 前缀剪枝 tf/IDF 向量空间 倒排索引 信息检索 数据库
下载PDF
高可靠性移动通信网络数据库跨域安全检索研究
2
作者 阚钿玉 《微型电脑应用》 2024年第8期46-50,共5页
高可靠性移动通信网络数据库在跨域检索过程中容易被攻击者修改数据,导致数据检索精度与效率下降,因而研究高可靠性移动通信网络数据库跨域安全检索方法。通过主密钥对和用户私钥、公钥确定密文索引,结合密文获取安全查询索引,提取安全... 高可靠性移动通信网络数据库在跨域检索过程中容易被攻击者修改数据,导致数据检索精度与效率下降,因而研究高可靠性移动通信网络数据库跨域安全检索方法。通过主密钥对和用户私钥、公钥确定密文索引,结合密文获取安全查询索引,提取安全查询索引关键词。通过改进TF-IDF权值方法确定索引关键词相关度分数,结合相关度分数对检索结果进行排名和过滤,将检索结果返回给数据使用者,完成跨域安全检索。实验结果表明,这种方法的检索结果的查全率、查准率、效率均较高,检索效果好。 展开更多
关键词 移动通信网络 数据库 安全查询索引 改进tf-IDF权值方法 相关度分数
下载PDF
基于TF-IDF的食品风险分析模型的构建与应用 被引量:4
3
作者 姚振民 邢家溧 +5 位作者 承海 郑睿行 毛玲燕 徐晓蓉 张书芬 沈坚 《中国食品学报》 EI CAS CSCD 北大核心 2022年第12期324-331,共8页
食品检测数据作为食品风险分析的重要工具,针对同类食品所做检测项目不同而导致最终的数据矩阵部分缺失,且已有的食品检测数据大部分为未检出等问题,通过引入词频-逆文档频率(term frequency-inverse document frequency,TF-IDF)的权重... 食品检测数据作为食品风险分析的重要工具,针对同类食品所做检测项目不同而导致最终的数据矩阵部分缺失,且已有的食品检测数据大部分为未检出等问题,通过引入词频-逆文档频率(term frequency-inverse document frequency,TF-IDF)的权重确定办法,构建一种新型的食品风险分析模型。本文以2019-2020年为时间段,收集某市食用农产品的蔬菜样本抽检信息作为分析数据,通过模型计算得到蔬菜中各样品的风险指数。结果显示:2019-2020年间检测的蔬菜产品中,风险指数高的为韭菜和芹菜,超标指数为毒死蜱,在监管中需加强关注,而其余蔬菜大多呈现低风险情况。本分析模型相较于其它传统分析方法,能给出具体的风险指数,在评价上具有直观性,且当数据样本越大,评价效果越好。同时,本模型基于信息理论来设置权重,消除了主观因素在评价中的影响,在应对多样化食品数据时更具有实用性。模型的建立在大数据的时代背景下,对于深入研究食品安全风险及其评价方法新路径提供一个新思路。 展开更多
关键词 蔬菜产品 风险评价 tf-IDF 指数
下载PDF
不同动物来源转移因子(TF)对肉仔鸡T细胞免疫功能及免疫器官指数影响的比较研究 被引量:4
4
作者 何孟莲 赵满达 李芳 《中国兽医杂志》 CAS 北大核心 2016年第11期32-35,共4页
本研究用不同动物来源转移因子(TF)进行AA+肉仔鸡T细胞免疫功能及免疫器官指数影响的比较研究。采用T细胞体外转化增殖和T细胞体内转化增殖实验,来探讨不同动物来源TF免疫活性和对T细胞的体内和体外转化增殖效果的一致性;给1 d肉仔鸡饮... 本研究用不同动物来源转移因子(TF)进行AA+肉仔鸡T细胞免疫功能及免疫器官指数影响的比较研究。采用T细胞体外转化增殖和T细胞体内转化增殖实验,来探讨不同动物来源TF免疫活性和对T细胞的体内和体外转化增殖效果的一致性;给1 d肉仔鸡饮水投服不同动物来源TF,7 d、14 d、21 d采样检测。实验数据分析证明,各实验组TF均对肉仔鸡T细胞体外和体内转化增殖具有促进作用,其中乌骨鸡来源TF作用最强;TF对肉仔鸡免疫器官指数影响实验,实验数据分析证明,TF对肉仔鸡免疫器官具有促生长作用,并表明实验组中乌骨鸡TF对免疫器官促生长作用最强。 展开更多
关键词 tf 肉仔鸡 T细胞免疫活性 免疫器官指数
下载PDF
改进z指数的高被引学科研究热点识别方法探讨 被引量:11
5
作者 李长玲 牌艳欣 +1 位作者 相富钟 杜德慧 《情报理论与实践》 CSSCI 北大核心 2020年第6期69-75,96,共8页
[目的/意义]z指数是近几年新提出的基于被引频次的评价指标,尝试用以识别高被引学科研究热点。[方法/过程]对不同时间发表的学术论文的被引频次分配不同权值,基于时间因子将z指数改进为z_y(tf)指数,降低被引频次时间滞后及累积效应的局... [目的/意义]z指数是近几年新提出的基于被引频次的评价指标,尝试用以识别高被引学科研究热点。[方法/过程]对不同时间发表的学术论文的被引频次分配不同权值,基于时间因子将z指数改进为z_y(tf)指数,降低被引频次时间滞后及累积效应的局限,提高学科研究热点的识别效果;利用z_y(tf)指数年度增长速度R值,识别不同年度的新兴研究热点;根据z_y(tf)与z指数排名变化差值D[z-z_y(tf)]大小,划分不同发展趋势的研究热点类型。[结果/结论]选择CSSCI数据库情报学领域9种优秀期刊2014—2018年的论文为样本,识别国内情报学当前的研究热点,分析不同年度新兴研究热点的变化,并划分"上升型""稳定型""下降型"3种不同发展趋势的研究热点类型。 展开更多
关键词 时间因子 Z指数 z_y(tf)指数 高被引 研究热点
下载PDF
概率调整法在气候模式模拟降水量订正中的应用 被引量:6
6
作者 周林 潘婕 +1 位作者 张镭 许吟隆 《应用气象学报》 CSCD 北大核心 2014年第3期302-311,共10页
应用概率调整法订正区域气候模式系统PRECIS在SRES A1B情景下模拟的各季节全国日降水量。以第95百分位降水量为阈值,利用Γ分布分段拟合1962年12月-1972年11月的模拟值,构建传递函数,得到1991年12月-2001年11月的订正值。结果表明:全国... 应用概率调整法订正区域气候模式系统PRECIS在SRES A1B情景下模拟的各季节全国日降水量。以第95百分位降水量为阈值,利用Γ分布分段拟合1962年12月-1972年11月的模拟值,构建传递函数,得到1991年12月-2001年11月的订正值。结果表明:全国平均日降水量空间分布的模拟改善明显,偏差百分率高于100%的格点比例从23.5%降低到1.0%;对各地区平均降水月循环的模拟结果改善,冷季降水较暖季更接近观测,提高拟合优度是改进订正方法的关键;多数地区连续干日数、连续5 d最大降水量及极端降水贡献率的空间强度、概率分布与空间相关性的订正效果显著。总体来说,该方法对模拟中国区域降水的平均态与极端降水均有明显改善,有助于气候评估工作的展开。 展开更多
关键词 订正 分段拟合 传递函数 极端降水指标
下载PDF
黄芩总黄酮对高血脂大鼠的降血脂作用研究 被引量:29
7
作者 雷燕妮 《动物医学进展》 CSCD 北大核心 2014年第7期64-68,共5页
旨在研究不同剂量的黄芩总黄酮对实验性高血脂动物模型脂质水平的影响。以建立的高血脂动物模型为基础,观察黄芩总黄酮对大鼠血液和肝脏中脂质及脂蛋白的含量、粪便中胆汁酸含量的影响。结果表明,与高脂模型组相比,黄芩总黄酮能显著降... 旨在研究不同剂量的黄芩总黄酮对实验性高血脂动物模型脂质水平的影响。以建立的高血脂动物模型为基础,观察黄芩总黄酮对大鼠血液和肝脏中脂质及脂蛋白的含量、粪便中胆汁酸含量的影响。结果表明,与高脂模型组相比,黄芩总黄酮能显著降低高血脂大鼠血清中总胆固醇、甘油三酯、脂蛋白、载脂蛋白B及低密度脂蛋白胆固醇的含量(P<0.05),显著升高高密度脂蛋白胆固醇及载脂蛋白A的浓度(P<0.05)。可见黄芩总黄酮能明显降低肝脏中TC和TG的浓度,并且能够促进粪便中胆汁酸的排泄。因此,黄芩总黄酮具有较好的降血脂作用。 展开更多
关键词 黄芩总黄酮 高血脂 血脂指标 肝脏指标 胆汁酸 降血脂
下载PDF
不同入口流量波形对颈动脉分叉壁面切应力的影响 被引量:2
8
作者 刘宾 刘心悦 丁祖荣 《医用生物力学》 EI CAS CSCD 2009年第2期94-97,共4页
目的研究不同颈总动脉生理流量波波形对颈动脉分叉壁面切应力的影响。方法建立颈动脉分叉TF-AHCB数值模型。用Womersley方法求解Bloch和Holdsworth两种经典的血液流量波形的速度分布,并作为入口条件用CFD软件计算分叉管内流场和壁面切... 目的研究不同颈总动脉生理流量波波形对颈动脉分叉壁面切应力的影响。方法建立颈动脉分叉TF-AHCB数值模型。用Womersley方法求解Bloch和Holdsworth两种经典的血液流量波形的速度分布,并作为入口条件用CFD软件计算分叉管内流场和壁面切应力分布。结果两种波形在颈动脉分叉根部外侧壁形成的低切应力区相仿,但具有较低重搏波波谷的Holdsworth波形使局部振荡剪切因子明显增大。Holdsworth波形产生的振荡剪切因子是Bloch波形产生的1.75倍,局部最高值可达0.49。结论在对动脉分叉管血流动力学数值或实验模拟中,正确设定入口流量波形和速度剖面条件是重要的。 展开更多
关键词 tf—AHCB模型 Womersley解 数值模拟 壁面切应力 振荡剪切因子
下载PDF
基于海量卫星测控数据存储与查询方法 被引量:3
9
作者 杨悦 《科学技术与工程》 北大核心 2013年第25期7352-7356,共5页
针对卫星海量测控数据以时间区间检索、结果按时间排序的需求,提出了基于数据库时间分区表与索引组织表(IOT)的存储和查询方法。时间分区表采用将数据存放到多个物理表空间,在数据查询时不需每次扫描整张表,检索时间明显缩短,且查询响... 针对卫星海量测控数据以时间区间检索、结果按时间排序的需求,提出了基于数据库时间分区表与索引组织表(IOT)的存储和查询方法。时间分区表采用将数据存放到多个物理表空间,在数据查询时不需每次扫描整张表,检索时间明显缩短,且查询响应时间不会随着数据量的增长而增加。索引组织表是将数据直接存放在索引中,降低了存储空间的占用,以损失较小的写入效率为代价。通过对某卫星实验和分析,证明了方法的有效性和正确性,提高了数据存储和查询的效率。 展开更多
关键词 卫星 测控数据 存储 查询 时间分区表 索引组织表
下载PDF
文献搜索引擎中特征项及权重的应用 被引量:2
10
作者 李光敏 《计算机系统应用》 2014年第5期188-191,共4页
针对目前用户在使用搜索引擎过程中,检索结果冗余、效率低下等问题,本文在对文献垂直搜索系统中Lucene.Net的索引算法研究基础上,结合用户实际专业检索需求,改变其算法中的激励因子,实验结果证明该方法确能提高搜索结果的相关度.
关键词 垂直搜索 LUCENE Net引擎 索引排序 tf*IDF
下载PDF
小鼠白细胞粘附抑制试验测定抗乙肝转移因子特异免疫活性 被引量:3
11
作者 姚光宁 张红宇 +3 位作者 景芳 吴智深 杨美峰 郑颖 《中国生化药物杂志》 CAS CSCD 2000年第1期22-25,共4页
目的 :研究抗乙肝转移因子特异免疫活性测定方法。方法 :采用小鼠脾淋巴细胞经抗乙肝转移因子体外致敏 ,再与HBsAg接触而产生白细胞粘附抑制反应。结果 :抗乙肝转移因子与普通转移因子相比 ,使未粘附白细胞显著增多 (P <0 .0 1) ,未... 目的 :研究抗乙肝转移因子特异免疫活性测定方法。方法 :采用小鼠脾淋巴细胞经抗乙肝转移因子体外致敏 ,再与HBsAg接触而产生白细胞粘附抑制反应。结果 :抗乙肝转移因子与普通转移因子相比 ,使未粘附白细胞显著增多 (P <0 .0 1) ,未粘附抑制指数达 82 %。结论 :此法可作为一种检测抗乙肝转移因子特异免疫活性的实用方法。 展开更多
关键词 抗乙肝转移因子 特异免疫活性 白细胞粘附
下载PDF
基于HowNet查询扩展方法的探究 被引量:1
12
作者 张振梅 刘明 +1 位作者 毕利 高玉琢 《计算机应用与软件》 北大核心 2018年第3期27-31,共5页
考虑到查询扩展方法在信息检索中很少考虑词语的顺序、分布和词条概念关系等因素,难以在信息检索中对文本相似性做出全方位的度量。针对这种情况,基于词语概念本体How Net对词序、词距、扩展词权重特征进行概念相关性度量,并将词语相关... 考虑到查询扩展方法在信息检索中很少考虑词语的顺序、分布和词条概念关系等因素,难以在信息检索中对文本相似性做出全方位的度量。针对这种情况,基于词语概念本体How Net对词序、词距、扩展词权重特征进行概念相关性度量,并将词语相关性度量作为特征词权重因子引入文本检索过程中,实现了一种改进的特征量化方法。Top-N检索结果的实验表明,采用的方法使得系统整体性能获得有效提升。 展开更多
关键词 查询扩展 tf-IDF 索引构建 HOWNET 信息检索
下载PDF
基于词向量与多特征融合的农业文本自动标引研究
13
作者 香慧敏 白涛 +1 位作者 李东亚 马楠 《新疆农业大学学报》 CAS 2022年第6期486-492,共7页
针对TF-IDF算法未考虑到文本关键词分布以及受不均衡数据集影响的问题,提出了一种多特征融合的术语频率-逆文档逆词频率(TF-IDIWF)自动标引算法,并与TF-IDF、TF-IWF、TextRank、LSI及LDA基线算法进行对比验证。利用python爬虫技术获取2... 针对TF-IDF算法未考虑到文本关键词分布以及受不均衡数据集影响的问题,提出了一种多特征融合的术语频率-逆文档逆词频率(TF-IDIWF)自动标引算法,并与TF-IDF、TF-IWF、TextRank、LSI及LDA基线算法进行对比验证。利用python爬虫技术获取20万条农业文本语料以csv文件格式存储,用于训练农业词向量模型,随机抽取政策法规类、新闻资讯类、市场类、科技类文章各1000篇并进行多人独立标注,标注词个数为5~13个,将标注结果整合归纳后生成AGRI2020农业文本均衡数据集。为验证TF-IDIWF算法能否降低不均衡数据集带来的影响,从AGRI2020中随机抽取新闻资讯类1000篇,其余3个类别各100篇构建出农业文本不均衡数据集。首先利用TF-IDF融合词向量技术对分词后的词语进行过滤、筛选以及近义词归并,再引入词位置、词性及词跨度特征权重融合逆文档频率及逆词频率对农业文本进行关键词自动标引。结果表明,在不均衡数据集上的F1值为57.08%,相较于TF-IDF、TF-IWF算法分别提高了9.12%、1.24%;在均衡数据集上的平均F1值为60.80%,相较于TF-IDF、TextRank、LSI及LDA算法分别提高了10.48%、10.04%、18.83%、14.89%。多特征融合的TF-IDIWF自动标引算法能有效提高农业文本标引准确性。 展开更多
关键词 词向量 多特征融合 tf-IDIWF 自动标引 农业文本
下载PDF
青刺果德温特专利的专业性主题聚类
14
作者 陈一 《计算机时代》 2022年第7期33-35,共3页
专利文本会涉及不同学科领域的专业词汇。本文以青刺果德温特专利数据为例,研究专利的专业性主题聚类。运用Word2vec对青刺果德温特专利文本训练词向量,再用N-Gram改进TF-IDF优化加权,然后用LDA做主题聚类。结果显示,青刺果专利的研究... 专利文本会涉及不同学科领域的专业词汇。本文以青刺果德温特专利数据为例,研究专利的专业性主题聚类。运用Word2vec对青刺果德温特专利文本训练词向量,再用N-Gram改进TF-IDF优化加权,然后用LDA做主题聚类。结果显示,青刺果专利的研究热点主要集中在青刺果的功能、应用、提取技术和成分分析方面,种植和包装方面的相关专利需要加强。 展开更多
关键词 专业性主题聚类 青刺果德温特专利 Word2vec N-Gram-tf-IDF LDA
下载PDF
基于BERT和TF-IDF的问答社区问句自动标引研究——以金投网问答社区为例 被引量:11
15
作者 唐晓波 刘江南 《情报科学》 CSSCI 北大核心 2021年第3期3-10,共8页
【目的/意义】问答社区问句的自动标引可以为网站的信息组织和信息服务提供有效帮助。目前关于自动标引的研究大部分集中于抽词标引,并不适用于问答社区问句的自动标引。【方法/过程】本文以金投网问答社区为例,融合了赋词标引和抽词标... 【目的/意义】问答社区问句的自动标引可以为网站的信息组织和信息服务提供有效帮助。目前关于自动标引的研究大部分集中于抽词标引,并不适用于问答社区问句的自动标引。【方法/过程】本文以金投网问答社区为例,融合了赋词标引和抽词标引方法,提出了一种基于预训练语言模型BERT和TF-IDF的问答社区问句自动标引模型。该模型使用基于BERT的多标签分类算法对问句进行赋词标引,将问句划分为短问句和长问句,使用TF-IDF算法对长问句进行抽词标引,补充长问句标引标签。【结果/结论】实验结果表明,本文提出的自动标引模型可以有效对问答社区问句进行自动标引,对提高用户信息检索效果具有重要的意义。【创新/局限】利用问句内外部特征构建了基于BERT和TF-IDF的问答社区问句自动标引模型,并提出了一种基于BERT的多标签分类算法。 展开更多
关键词 自动标引 问答社区 BERT tf-IDF 多标签分类
原文传递
基于用户自然标注的TF-IDF辅助标引算法及实证研究 被引量:13
16
作者 陈白雪 宋培彦 《图书情报工作》 CSSCI 北大核心 2018年第1期132-139,共8页
[目的/意义]从用户角度出发,研究基于用户自然标注的TF-IDF辅助标引算法。[方法/过程]首先以核心期刊论文中作者标注的关键词和分类号为源数据,通过对关键词词频进行统计,使用TF-IDF算法构建用户标注词表、形成标引知识库,然后通... [目的/意义]从用户角度出发,研究基于用户自然标注的TF-IDF辅助标引算法。[方法/过程]首先以核心期刊论文中作者标注的关键词和分类号为源数据,通过对关键词词频进行统计,使用TF-IDF算法构建用户标注词表、形成标引知识库,然后通过IKAnalyzer分词软件对待标引的科技项目数据进行切词和停用词处理,进而使用TF-IDF算法和位置加权算法提取科技项目数据的特征词,最终实现对科技项目数据进行关键词和分类的同步标引.[结果/结论]实验结果表明,机标关键词与人标的相似比在60%以上的科技项目数据占总数的68.1%,机标分类号与人标分类号前三位一致的占总数的83.9%,结果表明基于用户自然标注数据并采用TF-IDF算法在关键词和分类标引方面是可行的。 展开更多
关键词 辅助标引 用户自然标注 tf-IDF算法 信息组织
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部