期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
基于BM25的勘察设计企业科研项目重复性检测方法研究
1
作者 王扬 曹德威 +2 位作者 王剑刚 钱锋 钱常运 《科技管理研究》 CSSCI 2024年第4期167-174,共8页
中国勘察设计企业的科研重复投入情况日益凸显,这是对资金、人力、信誉乃至科研精神的损耗,不利于尖端技术的孵化,因此通过智能化手段自动识别科研课题重复性,最大化复用科研成果势在必行。结合BM25算法的基础理论,融合勘察设计企业的... 中国勘察设计企业的科研重复投入情况日益凸显,这是对资金、人力、信誉乃至科研精神的损耗,不利于尖端技术的孵化,因此通过智能化手段自动识别科研课题重复性,最大化复用科研成果势在必行。结合BM25算法的基础理论,融合勘察设计企业的数据属性,引入领域、专业、负责人等特征值,提出一种聚焦企业内部的科研项目重复性检测方法。该方法涉及4个步骤,包括文本预处理、建立匹配库,根据词频-逆文档频率(TF-IDF)算法、BM25算法分别计算输入课题与匹配库中课题的相似度,最后分析计算结果。相较于TF-IDF算法,BM25算法通过词语饱和度和字段长度规约实现权重控制,针对新能源、工程数字化和信息化领域的研究课题中的计算结果有较高的区分度,有利于挖掘不同领域下高相似性的文本,最大程度避免潜在重复课题的遗漏;同时该算法的计算时间小于0.1 s,可满足商用,在科研课题立项重复性校验、成果重合度判定中发挥支撑作用,计算结果经技术研发人员复验,准确性满足业务管理需要,在勘察设计行业具有推广价值。 展开更多
关键词 科研课题 项目重复性校验 勘察设计企业 bm25 词频-逆文档频率(TF-IDF) 文本相似度
下载PDF
应用BM25行CRRT治疗MODS的方法及护理 被引量:5
2
作者 王淑玲 刘峰 商和丽 《齐鲁护理杂志》 2007年第1期7-8,共2页
目的:探讨BM25系统连续肾替代治疗(CRRT)治疗多脏器功能障碍综合征(MODS)的方法及护理要点。方法:63例MODS患者应用BM25系统,采用前置换、后置换方式行CRRT治疗。结果:63例MODS患者都能持续、稳定的调节水、电解质及酸碱平衡,而清除血... 目的:探讨BM25系统连续肾替代治疗(CRRT)治疗多脏器功能障碍综合征(MODS)的方法及护理要点。方法:63例MODS患者应用BM25系统,采用前置换、后置换方式行CRRT治疗。结果:63例MODS患者都能持续、稳定的调节水、电解质及酸碱平衡,而清除血液中的内毒素。结论:CRRT因其平稳有效地维持机体内环境稳定,能明显延长危重患者的生存时间,有利于脏器功能的恢复。 展开更多
关键词 bm25系统 CRRT MODS 方法 护理
下载PDF
基于BM25F模型的Web文本挖掘个性化推荐研究 被引量:5
3
作者 邵康 张建伟 《情报理论与实践》 CSSCI 北大核心 2013年第11期118-122,共5页
文章提出的基于Web文本挖掘的个性化推荐模型是从Web交易事务中挖掘出与当前用户会话相似度最高的会话集,该模型将BM25F运用到了文本挖掘中。BM25F模型最初用在搜索引擎中,在个性化推荐中用来计算文本文档的相似性是可行的,并且通过实... 文章提出的基于Web文本挖掘的个性化推荐模型是从Web交易事务中挖掘出与当前用户会话相似度最高的会话集,该模型将BM25F运用到了文本挖掘中。BM25F模型最初用在搜索引擎中,在个性化推荐中用来计算文本文档的相似性是可行的,并且通过实验分析,其推荐结果更加优于传统的TF*IDF模型,因为BM25F计算的权重精确度大幅提高,进而提高了推荐的精确度。此外该模型能有效地跟踪用户的当前偏好,对用户随时改变兴趣偏好能及时作出响应。 展开更多
关键词 个性化推荐 bm25F模型 文本挖掘 文本处理
下载PDF
群智感知中基于BM25的多行为地点机会式数据收集协议 被引量:1
4
作者 陈翔 吴敏 +2 位作者 徐佳 戴华 于京杰 《电子测量与仪器学报》 CSCD 北大核心 2016年第1期75-83,共9页
针对已有群智感知服务中的数据收集协议仅考虑单行为地点属性的问题,提出基于BM25的用户多行为地点度量模型,将用户的社会属性度量扩展至多行为地点空间。进一步提出了多行为地点机会式数据收集协议MBPOP,首先初始化多个单行为地点用户... 针对已有群智感知服务中的数据收集协议仅考虑单行为地点属性的问题,提出基于BM25的用户多行为地点度量模型,将用户的社会属性度量扩展至多行为地点空间。进一步提出了多行为地点机会式数据收集协议MBPOP,首先初始化多个单行为地点用户,然后按照单行为地点属性值进行多线路递增转发,寻找单行为地点意图接受者;最后在符合多行为地点属性的用户群中组播数据,从而精准地到达具有多行为地点特征的意图接受群体。与同类协议的比较结果表明,MBPOP具有低代价、高传输率特性。 展开更多
关键词 群智感知 数据收集协议 bm25 多行为属性
下载PDF
基于BM25模型与借阅预测模型的书目检索排序算法研究 被引量:5
5
作者 姚舜 《图书馆杂志》 CSSCI 北大核心 2016年第10期63-68,共6页
针对传统书目检索系统的相关度排序存在的读者体验差的问题,提出基于BM25模型与借阅预测模型的排序算法。该算法综合了BM25模型的相关度算法和借阅预测模型的推荐度算法,使排序结果受到相关度、入藏时间、借阅情况、在馆情况和馆藏地点... 针对传统书目检索系统的相关度排序存在的读者体验差的问题,提出基于BM25模型与借阅预测模型的排序算法。该算法综合了BM25模型的相关度算法和借阅预测模型的推荐度算法,使排序结果受到相关度、入藏时间、借阅情况、在馆情况和馆藏地点权重等因素的影响。测试结果表明,综合排序算法使结果排序更加科学和合理,能够提高读者满意度和图书的借阅率。 展开更多
关键词 bm25 借阅预测 书目检索 排序算法 Xunsearch
下载PDF
基于Lucene的BM25模型的评分机制的研究 被引量:15
6
作者 范晨熙 黄理灿 李雪利 《工业控制计算机》 2013年第3期78-79,共2页
Okapi BM25是一种相关性排序函数,适用于搜索引擎根据与给定搜索查询的相关性对匹配文档进行排序。通过BM25模型与开源搜索框架Lucene的有机结合,实现了BM25模型在Lucene中的检索评分。经实验表明,BM25模型在Lucene中有较好的表现,为进... Okapi BM25是一种相关性排序函数,适用于搜索引擎根据与给定搜索查询的相关性对匹配文档进行排序。通过BM25模型与开源搜索框架Lucene的有机结合,实现了BM25模型在Lucene中的检索评分。经实验表明,BM25模型在Lucene中有较好的表现,为进一步根据实际需求利用BM25模型和Lucene进行全文检索做出了有益的探索。 展开更多
关键词 bm25 LUCENE 全文检索 评分机制 搜索引擎
下载PDF
应用BM25系统行CRRT时管路预冲技巧 被引量:1
7
作者 曲希莲 王希华 +2 位作者 王新娟 高玉玲 黄卫娜 《中国血液净化》 2005年第5期279-280,共2页
关键词 bm25系统 管路预冲 血滤器 静脉管路 连续肾替代治疗
下载PDF
BM25血液净化系统临床应用常见报警原因及处理 被引量:1
8
作者 钟宇芳 王饶萍 +2 位作者 冯婉娜 陈桂芳 许元文 《透析与人工器官》 2002年第3期32-34,共3页
目的 :回顾分析在重症急性肾功能衰竭 (ARF)患者中 ,应用 BM2 5血液净化系统进行连续性肾脏替代疗法 (CRRT)常见的机器报警原因及处理方法。方法 :2 0 0 0年 6月至 11月 ,用BM2 5 CRRT治疗重症 ARF患者 12例 ,回顾性分析 BM2 5血液净化... 目的 :回顾分析在重症急性肾功能衰竭 (ARF)患者中 ,应用 BM2 5血液净化系统进行连续性肾脏替代疗法 (CRRT)常见的机器报警原因及处理方法。方法 :2 0 0 0年 6月至 11月 ,用BM2 5 CRRT治疗重症 ARF患者 12例 ,回顾性分析 BM2 5血液净化系统的特点 ,使用方法及报警原因。结果 :12例患者在使用 BM2 5血液透析机进行 CRRT治疗时出现的故障 ,经过原因分析 ,及时消除报警故障 ,排除故障因素 ,使治疗能顺利进行 ,并且延长透析器及管道的寿命 ,避免增加患者痛苦及经济的负担。结论 :及时、正确处理 BM2 5血液净化系统的报警故障 ,可保证 CRRT顺利进行 。 展开更多
关键词 bm25血液净化系统 临床应用 报警原因 处理 急性肾功能衰竭
下载PDF
BM25血液净化系统临床应用常见报警原因及处理 被引量:1
9
作者 钟宇芳 王饶萍 +2 位作者 冯婉娜 陈桂芳 许元文 《透析与人工器官》 2001年第4期17-17,共1页
关键词 bm25血液净化系统 临床应用 常见报警原因 处理 连续性肾脏替代疗法
下载PDF
基于BM25-IWF特征提取的改进Simhash算法 被引量:1
10
作者 黄迎春 王港 《移动信息》 2021年第5期7-10,共4页
传统的Simhash 网页去重是基于词频文档逆频率(TF-IDF)提取特征词的算法,存在会将部分停用词权重放大、文章长度影响特征词的权重以及同类语料库中特征词的权重被稀释的问题。基于此,文章提出了一种基于惩罚因子词语逆频率(BM25-IWF)的S... 传统的Simhash 网页去重是基于词频文档逆频率(TF-IDF)提取特征词的算法,存在会将部分停用词权重放大、文章长度影响特征词的权重以及同类语料库中特征词的权重被稀释的问题。基于此,文章提出了一种基于惩罚因子词语逆频率(BM25-IWF)的Simhash算法,计算权重时,加入惩罚因子限制词频数值过大,减小文档长度对权重的影响,然后使用词语逆频率来解决同类语料库中特征词的权重被稀释的问题。从哈工大语料库中随机挑选1000篇文档,改进的Simhash算法进行相似度判断的平均精确率达94.82%,平均召回率达90.69%。相较于传统的Simhash算法,改进算法的精确率和召回率更高,更能实现网页的精准去重。 展开更多
关键词 网页去重 Simhash算法 bm25-IWF 特征提取
下载PDF
基于BM25聚类与巴氏系数相似度改进的推荐算法 被引量:6
11
作者 程苗 陈海龙 +1 位作者 孙海娇 闫五岳 《黑龙江大学自然科学学报》 CAS 2020年第5期610-616,共7页
推荐算法的目的是给用户推荐潜在的感兴趣的物品和信息,在传统的算法设计中,由于数据稀疏和冷启动等因素往往给推荐带来较大误差,依靠传统的用户项目数据评分来计算相似度已经难以达到让人满意的推荐效果。本文引入BM25算法对计算用户... 推荐算法的目的是给用户推荐潜在的感兴趣的物品和信息,在传统的算法设计中,由于数据稀疏和冷启动等因素往往给推荐带来较大误差,依靠传统的用户项目数据评分来计算相似度已经难以达到让人满意的推荐效果。本文引入BM25算法对计算用户和词素之间的相关性得分具有较准确效果。在用户项目评分矩阵和项目关键词矩阵的基础上,形成用户关键词矩阵,挖掘出用户对关键词的喜爱,继而完成用户兴趣聚类。引入巴氏系数,可以解决用户在没有共同评分项目情况下用户相似度计算问题。利用巴氏系数改进相似度,在类簇中找到与用户最相似的邻居集,产生有效推荐。对MovieLens数据集进行实验的结果表明,无论在准确率或召回率等实验测评中,该算法相比于传统的基于用户和基于物品等协同算法的实验结果都显著提高。 展开更多
关键词 聚类 bm25 巴氏系数 兴趣矩阵
下载PDF
百特持续床旁血滤机BM25的校正与检查方法 被引量:1
12
作者 李建锋 王伟芳 《医疗卫生装备》 CAS 2005年第1期54-55,57,共3页
关键词 百特持续床旁血滤机 bm25 校正 检查方法
下载PDF
一种新的融合BM25与文本特征的新闻摘要算法 被引量:9
13
作者 李楠 陶宏才 《成都信息工程大学学报》 2018年第2期113-118,共6页
提出一种融合BM25与文本特征的新闻摘要算法。首先使用BM25算法计算TextRank算法中的句子相似度,其次选择词频和句子位置作为文本特征,最后将文本特征的评分与TextRank的评分相加作为文本中句子的评分,对所有的句子按照评分降序排列,选... 提出一种融合BM25与文本特征的新闻摘要算法。首先使用BM25算法计算TextRank算法中的句子相似度,其次选择词频和句子位置作为文本特征,最后将文本特征的评分与TextRank的评分相加作为文本中句子的评分,对所有的句子按照评分降序排列,选择评分最高的几个句子作为摘要。使用ROUGE工具在NLPCC2015数据集上进行测试,结果表明该方法有较好的效果。 展开更多
关键词 bm25 TextRank 词频 图排序 ROUGE
下载PDF
基于BM25-RoBERTa的法律案例检索研究 被引量:1
14
作者 王贺 迟呈英 战学刚 《电脑编程技巧与维护》 2023年第3期74-75,130,共3页
法律案例检索是根据用户给定的查询范围在相应的候选案例中进行检索与查询出具有相似描述的法律案例。由于法律文本区别于普通短文本,采用传统的检索模型无法检索到更精准的法律案例。针对上述问题,提出了基于BM25和RoBERTa的法律案例... 法律案例检索是根据用户给定的查询范围在相应的候选案例中进行检索与查询出具有相似描述的法律案例。由于法律文本区别于普通短文本,采用传统的检索模型无法检索到更精准的法律案例。针对上述问题,提出了基于BM25和RoBERTa的法律案例检索模型BM25-RoBERTa,该模型将传统的检索模型与神经检索相结合以获得更好的排序结果。实验结果表明,文中提出的模型在处理法律案例检索任务时表现良好。 展开更多
关键词 法律案例检索 bm25算法 RoBERTa模型 文本相似性
下载PDF
基于BM25算法的问题报告质量检测方法 被引量:9
15
作者 陈乐乐 黄松 +2 位作者 孙金磊 惠战伟 吴开舜 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第10期829-836,共8页
问题报告作为记录和跟踪缺陷的载体,为解决软件质量问题提供依据。目前软件测试常以多人、并行的方式进行,海量问题报告的去假与去重等整合过程正面临严峻的挑战。因此,该文提出一种基于BM25算法的问题报告自动化检测方法,在对问题报告... 问题报告作为记录和跟踪缺陷的载体,为解决软件质量问题提供依据。目前软件测试常以多人、并行的方式进行,海量问题报告的去假与去重等整合过程正面临严峻的挑战。因此,该文提出一种基于BM25算法的问题报告自动化检测方法,在对问题报告进行预处理后,依据测试需求和测试报告样本建立匹配库,利用BM25算法计算两者的相似度得分,并以此为依据检测问题报告的正确性。在软件测试大赛的数据上进行实验,结果表明该文提出的方法能够正确评判大部分问题报告,有效提高了去假与去重效率。 展开更多
关键词 软件测试 bm25算法 问题报告 自然语言处理
原文传递
文本特征和图结点混合增强的图卷积网络文本分类 被引量:1
16
作者 杨晓奇 刘伍颖 《新疆大学学报(自然科学版)(中英文)》 CAS 2024年第1期69-77,109,共10页
在BertGCN模型的基础上改进其结构,同时结合文本特征和图结点混合增强的方法,使用新的边权重计算算法BM25+构造图的边.使用R8、R52、Ohsumed和MR这4个常用的公开数据集来验证所提方法的有效性.结果表明:与BertGCN模型及其它基线模型相比... 在BertGCN模型的基础上改进其结构,同时结合文本特征和图结点混合增强的方法,使用新的边权重计算算法BM25+构造图的边.使用R8、R52、Ohsumed和MR这4个常用的公开数据集来验证所提方法的有效性.结果表明:与BertGCN模型及其它基线模型相比,该方法在4个文本分类数据集上的准确率评价指标均有不同程度的提升. 展开更多
关键词 bm25+ 文本特征增强 图结点增强 预训练模型 图卷积网络 文本分类
下载PDF
基于Softmax回归分类模型的网页搜索排序算法
17
作者 党米花 《吉林大学学报(信息科学版)》 CAS 2024年第5期985-990,共6页
针对网页搜索结果存在返回的网页与搜索的关键词领域不相关的领域漂移现象,导致用户无法搜索到需求信息的问题,提出基于Softmax回归分类模型的网页搜索排序算法。选择网页搜索文本特征,得到相应的特征项,利用向量表示模型,将选择的网页... 针对网页搜索结果存在返回的网页与搜索的关键词领域不相关的领域漂移现象,导致用户无法搜索到需求信息的问题,提出基于Softmax回归分类模型的网页搜索排序算法。选择网页搜索文本特征,得到相应的特征项,利用向量表示模型,将选择的网页搜索文本特征项转换为格式化数据,对网页搜索文本数据进行均衡处理,获取网页搜索文本数据集。采用Softmax回归分类模型,分类处理网页搜索文本数据集,预测网页搜索文本类别,通过Okapi BM25算法,对网页搜索文本进行排序操作,实现网页搜索排序。实验结果表明,所提算法具有较好的网页搜索排序,提升了网页搜索排序精度,避免网页搜索排序过程中的领域漂移现象。 展开更多
关键词 Softmax回归分类模型 网页搜索排序 文本预处理 TF-IDF算法 Okapi bm25算法
下载PDF
藏药二十五味珊瑚丸对帕金森病模型大鼠运动能力及氧化应激水平的影响
18
作者 崔海燕 李红艳 +2 位作者 孙亚楠 李捷 赵鑫杰 《河南中医》 2024年第10期1569-1573,共5页
目的:探讨藏药二十五味珊瑚丸对帕金森病(parkinson disease,PD)模型大鼠运动能力及氧化应激水平的影响。方法:将24只SD大鼠随机分为藏药二十五味珊瑚丸组(180 mg·kg^(-1))、模型组及正常组,每组各8只。除正常组外,其余大鼠采用纹... 目的:探讨藏药二十五味珊瑚丸对帕金森病(parkinson disease,PD)模型大鼠运动能力及氧化应激水平的影响。方法:将24只SD大鼠随机分为藏药二十五味珊瑚丸组(180 mg·kg^(-1))、模型组及正常组,每组各8只。除正常组外,其余大鼠采用纹状体单点注射6-羟基多巴胺(6-hydrodopamine,6-OHDA)法制备PD模型。造模成功后,各组大鼠每天灌胃给药1次,连续4周,模型组和正常组大鼠给予等体积生理盐水。给药第1天、第7天、第14天、第21天、第28天分别称量动物体质量;给药4周后,采用旋转实验及旷场实验观察大鼠行为学变化;ELISA法测定大鼠纹状体丙二醛(malondialdehyde,MDA)、谷胱甘肽(glutathione,GSH)及超氧化物歧化酶(superoxide dismutase,SOD)水平。结果:各组大鼠体质量比较,差异无统计学意义(P>0.05);与正常组比较,模型组大鼠旋转频率显著升高(P<0.001);旷场实验平均速度显著降低(P<0.05),运动距离显著缩短(P<0.01),静止时间显著延长(P<0.05);纹状体内MDA水平显著升高(P<0.05),SOD及GSH水平显著降低(P<0.05)。与模型组比较,二十五味珊瑚丸组大鼠旋转频率显著降低(P<0.05);旷场实验平均速度显著升高(P<0.05),运动距离显著延长(P<0.05),静止时间显著缩短(P<0.05);纹状体MDA水平显著降低(P<0.05),GSH及SOD水平显著升高(P<0.05)。结论:二十五味珊瑚丸可显著改善PD大鼠运动能力,调节脑中氧化应激反应。 展开更多
关键词 氧化应激 运动能力 二十五味珊瑚丸 帕金森症 藏药 大鼠
下载PDF
一种从医学文本中实现自动关键词抽取和筛选的技术方法 被引量:3
19
作者 殷蜀梅 张智雄 吴振新 《现代图书情报技术》 CSSCI 北大核心 2008年第8期31-36,共6页
鉴于重要关键词对于文本有着重要的强文本表示功能,关键词抽取和筛选在信息检索、信息抽取和知识挖掘等领域中有着重要的作用。在调研当前关键词抽取的方法后,结合医学领域已有的叙词表和工具以及BM25F加权词频公式提出基于医学文本的... 鉴于重要关键词对于文本有着重要的强文本表示功能,关键词抽取和筛选在信息检索、信息抽取和知识挖掘等领域中有着重要的作用。在调研当前关键词抽取的方法后,结合医学领域已有的叙词表和工具以及BM25F加权词频公式提出基于医学文本的重要关键词抽取和筛选的技术方法。该方法主要解决两个关键问题:关键词的识别和抽取、关键词重要性的衡量和筛选。以2001-2007年骨关节炎领域的文献集合为数据来源,对该技术方法进行实践尝试,并验证其实际有效性,为知识挖掘中的重要关键词抽取提供一个行之有效的途径。 展开更多
关键词 关键词抽取 关键词筛选 bm25F MMTx文本挖掘 医学数据挖掘
下载PDF
信息检索中的带权邻近度度量研究 被引量:1
20
作者 薛源海 俞晓明 +2 位作者 刘悦 关峰 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2014年第10期2216-2224,共9页
信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没... 信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没有考虑查询中各个词重要性的差异.在现代信息检索的查询请求中,查询词之间不仅不完全相互独立,而且分别具有不同的重要程度.因此,在计算邻近度信息时对查询词的重要性进行区分,将有助于提高检索效果.带权邻近度BM25模型(WP-BM25)使用待检索数据集的背景信息对查询词的重要性进行区分,并将带权邻近度度量方法整合到BM25模型中.在TREC评测的3个标准数据集FR88-89,WT2G和WT10G上的一系列对比实验表明,该模型具有较好的鲁棒性,且能够使检索效果得到显著提升. 展开更多
关键词 带权邻近度 度量方法 bm25 查询词重要性 信息检索
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部