期刊文献+
共找到1,651篇文章
< 1 2 83 >
每页显示 20 50 100
基于N-gram模型的多层融合气象灾害预警文本检验方法
1
作者 兰海波 宋瑛瑛 +3 位作者 曹之玉 朱小祥 沈晨笛 王然 《武汉理工大学学报(信息与管理工程版)》 CAS 2023年第6期961-966,共6页
气象灾害预警信息是直接对政府部门和公众进行发布的重要内容,是综合防灾减灾的第一道防线。为提升气象预警信息发布的质量,提出了气象预警文本质量检验模型。通过对全国气象历史预警信息内容进行特征分析,设计了适合气象预警信息特征... 气象灾害预警信息是直接对政府部门和公众进行发布的重要内容,是综合防灾减灾的第一道防线。为提升气象预警信息发布的质量,提出了气象预警文本质量检验模型。通过对全国气象历史预警信息内容进行特征分析,设计了适合气象预警信息特征的多模式融合分词方法,进而建立了预警专业语料库;研发了以归一化N-gram检验模型为主,以字序列组合检验模型为辅的多级检验模型。该模型已在国家突发事件预警信息发布系统中应用,辅助提高了人工预警审核效率,获得了较好的应用效果。 展开更多
关键词 气象灾害预警文本 融合分词 多级检验模型 n-gram模型 多模式融合
下载PDF
膀胱癌m6A相关长链非编码RNA预后模型的构建和免疫分析
2
作者 陈华 于海涛 +2 位作者 梅宇华 李利 苟欣 《重庆医科大学学报》 CAS CSCD 北大核心 2024年第6期718-729,共12页
目的:探究膀胱癌中N6-甲基腺苷(N6-methyladenosine,m6A)相关长非编码RNA(long non-coding RNA,lncRNA)及其与患者预后的关系。方法:通过癌症基因组图谱(the cancer genome Atlas,TCGA)数据库获取转录、突变和临床数据,获得m6A相关的lnc... 目的:探究膀胱癌中N6-甲基腺苷(N6-methyladenosine,m6A)相关长非编码RNA(long non-coding RNA,lncRNA)及其与患者预后的关系。方法:通过癌症基因组图谱(the cancer genome Atlas,TCGA)数据库获取转录、突变和临床数据,获得m6A相关的lncRNA表达数据,采用共表达网络分析、Cox回归分析和最小绝对收缩和选择算法(least absolute shrinkage and se-lection operator,LASSO)回归分析鉴定与m6A相关的lncRNA,并构建风险预后模型和对其进行验证。然后,本研究还构建了列线图来预测膀胱癌患者的预后。通过基因本体(gene ontology,GO)、京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)研究生物学功能的差异。使用ESTIMATE算法计算基质、免疫评分。采用单样本基因集富集分析(single sample gene set enrichment analysis,ssGSEA)算法定量分析免疫细胞浸润和免疫功能。采用oncoPredict算法预测潜在治疗药物。结果:本课题组确定了1739个m6A相关lncRNA,其中14个与预后相关。再通过LASSO回归分析筛选了5个m6A相关的lncRNA(GRK5-IT1、AC008883.2、AC145207.5、AC103746.1、AC104564.3)来构建预后预测模型。Kaplan-Meier和受试者工作特征曲线(receiver operating characteristic,ROC)曲线显示,该特征在训练集、验证集和全集中具有良好的预测能力。与其他临床特征相比,m6A相关lncRNA模型具有更高的诊断效率。免疫细胞浸润和ssGSEA分析进一步证实,特征lncRNA与膀胱癌患者的免疫状态显著相关。此外,高风险组对多种药物的治疗反应与低风险组存在显著差异。结论:5个m6A相关的特征ln-cRNA可能有助于评估膀胱癌患者的预后和免疫特征,并指导个性化治疗方案的制定。 展开更多
关键词 膀胱癌 n6-甲基腺苷 长链非编码RnA 癌症基因组图谱 预后模型
下载PDF
带N策略的双阶段休假M/M/1排队系统驱动的流体模型性能分析
3
作者 王勋 徐秀丽 《运筹学学报(中英文)》 CSCD 北大核心 2024年第1期29-39,共11页
基于工厂订单装配系统的运行机制,本文构建并分析了具有N策略和两种混合休假策略的M/M/1排队系统驱动的流体模型。首先对驱动系统进行描述,将马尔可夫过程的无穷小生成元写成块状雅克比矩阵形式。引入库存量建立三维马尔可夫过程,得到... 基于工厂订单装配系统的运行机制,本文构建并分析了具有N策略和两种混合休假策略的M/M/1排队系统驱动的流体模型。首先对驱动系统进行描述,将马尔可夫过程的无穷小生成元写成块状雅克比矩阵形式。引入库存量建立三维马尔可夫过程,得到稳态下流体排队满足的微分方程组,运用矩阵分析方法和Laplace变换(LT)方法得出系统平稳库存量的数学表达式。进而运用Laplace-Stieltjes变换(LST)导出稳态条件下缓冲器的平均库存量。最后,利用数值分析,给出参数变化对系统性能指标的影响。 展开更多
关键词 流体模型 n策略 双阶段休假 库存量
下载PDF
碳中和目标下负排放策略的综合效应——基于N‑DSGE模型的数值模拟分析
4
作者 沈维萍 夏克郁 陈迎 《中国人口·资源与环境》 CSCD 北大核心 2024年第2期13-22,共10页
全球气候变化已达“气候紧急状态”,包括中国在内的诸多国家和地区先后宣布碳中和目标和净零排放承诺。在气候变化减缓和传统的适应措施之外,自然科学领域和气候经济学领域探讨负排放技术经济可行性的研究越来越多,但从可持续发展经济... 全球气候变化已达“气候紧急状态”,包括中国在内的诸多国家和地区先后宣布碳中和目标和净零排放承诺。在气候变化减缓和传统的适应措施之外,自然科学领域和气候经济学领域探讨负排放技术经济可行性的研究越来越多,但从可持续发展经济学视角对负排放技术综合效应的评估还比较少。该研究基于可持续发展经济学的生态价值理论,将气候变化综合评估模型与宏观经济学动态随机一般均衡(DSGE)模型相结合,构建包含自然生态系统部门的N‑DSGE模型,对负排放技术的气候效应、生态效应、经济效应以及福利效应进行综合评估。评估结果表明:①当可用技术条件下传统减排措施达到最大减排潜力后,可以依靠负排放技术实现净零排放乃至净负排放。②低强度、小规模实施负排放技术具有正向的气候、生态和经济效应,然而随着负排放技术实施强度增大,气候效应增强,经济效应削弱,社会综合福利明显降低。③敏感性分析证明了评估结果的稳健性,并进一步表明负排放技术的实施效果会受到传统减排水平和自然碳汇能力的影响。基于评估结果,应谨慎扩大负排放技术实施规模和实施强度,加强科学技术研发,降低技术成本;对不同负排放技术采取差异化发展策略;加强负排放技术实施的治理,尽可能避免和最小化其负面影响,促进气候、生态和经济等可持续发展目标的协同;部署负排放技术不应放松传统减排的努力,应降低碳达峰峰值,同时提升自然生态系统的碳汇能力。 展开更多
关键词 碳中和目标 负排放技术 n‑DSGE模型 生态价值 福利效应
下载PDF
基于SSA_(n)-SSA_(l)-LSTM的短期空调负荷预测模型
5
作者 任中俊 杨心宇 +2 位作者 周国峰 易检长 何影 《暖通空调》 2024年第7期90-97,共8页
本文提出了一种奇异谱分析(SSA_(n))和麻雀搜索算法(SSA_(l))优化的长短期记忆网络(LSTM)的组合空调负荷预测模型。使用皮尔逊相关系数和主成分分析法对输入特征进行挑选和处理,以消除特征之间的冗余性和相关性。针对空调负荷的波动性... 本文提出了一种奇异谱分析(SSA_(n))和麻雀搜索算法(SSA_(l))优化的长短期记忆网络(LSTM)的组合空调负荷预测模型。使用皮尔逊相关系数和主成分分析法对输入特征进行挑选和处理,以消除特征之间的冗余性和相关性。针对空调负荷的波动性和随机性,采用SSA_(n)将空调负荷分解为多个分量。同时针对LSTM超参数设置的问题,采用SSA_(l)对模型进行优化,使用优化后的LSTM对各个分量进行预测,对预测结果进行重构。利用办公建筑和医疗建筑的空调负荷数据对模型进行了验证和分析。研究发现,与其他模型相比,SSA_(n)-SSA_(l)-LSTM模型表现最好,在预测办公建筑空调负荷时决定系数(R^(2))高达0.996 7,平均绝对百分比误差(MAPE)、平均绝对误差(MAE)和均方根误差(RMSE)分别为0.62%、14.42 kW和18.82 kW,在预测医疗建筑空调负荷时R^(2)高达0.992 7,MAPE、MAE和RMSE分别为0.50%、19.40 kW和25.71 kW。 展开更多
关键词 空调负荷 预测模型 奇异谱分析(SSA_(n)) 麻雀搜索算法(SSA_(l)) 长短期记忆网络(LSTM)
下载PDF
三阴性乳腺癌m6A相关lncRNA的免疫预后模型构建
6
作者 鲍淑梅 管浩钦 +2 位作者 苏莹 刘沛 吕小毅 《新疆大学学报(自然科学版)(中英文)》 CAS 2024年第1期78-86,共9页
三阴性乳腺癌(TNBC)是一种特殊的乳腺癌亚型.因其异质性以及缺乏可靠的分子靶点使其无法获得有效靶向治疗,导致TNBC患者的存活率仍然很低.N6-甲基腺苷(m6A)和长链非编码核糖核酸(lncRNA)在TNBC的预后价值和免疫治疗反应中起着至关重要... 三阴性乳腺癌(TNBC)是一种特殊的乳腺癌亚型.因其异质性以及缺乏可靠的分子靶点使其无法获得有效靶向治疗,导致TNBC患者的存活率仍然很低.N6-甲基腺苷(m6A)和长链非编码核糖核酸(lncRNA)在TNBC的预后价值和免疫治疗反应中起着至关重要的作用.因此,辨别TNBC患者中与m6A相关的lncRNA至关重要.通过共表达的方式分析并获得m6A相关的lncRNA,之后进行单变量比例风险(Cox)回归分析、随机生存森林(RSF)、最小绝对收缩和选择算子(LASSO)和多变量Cox回归分析以构建m6A相关lncRNA模型.随后使用卡普兰-梅尔(KM)生存分析、主成分分析(PCA)、功能富集分析和列线图分析风险模型.最后,讨论了针对该模型的潜在免疫治疗特征和药物敏感性预测.包含3个m6A相关lncRNA的风险模型被确定为预后的独立预测因子.通过使用该模型对患者进行重新分组,可以对患者在免疫治疗反应方面进行更有效的区分.使用pRRhetic算法根据每个样本的癌症药物敏感性基因组学(GDSC)数据库中可用的半数最大抑制浓度(IC50)估计治疗反应,确定了针对TNBC亚型分化的候选药物.结果表明,这种基于m6A的lncRNA风险模型有望用于临床预测TNBC患者的预后和免疫治疗反应. 展开更多
关键词 n6-甲基腺苷 lncRnAs 三阴性乳腺癌 预后模型 免疫治疗
下载PDF
一种基于操作码N-gram特征的代码混淆技术识别模型
7
作者 肖玉强 郭云飞 王亚文 《信息工程大学学报》 2023年第1期72-80,共9页
针对代码混淆领域忽略代码混淆技术隐蔽性的安全问题,提出一种基于操作码n-gram特征的代码混淆技术识别模型。通过提取反编译二进制文件程序操作码,生成程序n-gram特征并筛选后输入机器学习分类算法训练,构建识别混淆程序的二分类模型... 针对代码混淆领域忽略代码混淆技术隐蔽性的安全问题,提出一种基于操作码n-gram特征的代码混淆技术识别模型。通过提取反编译二进制文件程序操作码,生成程序n-gram特征并筛选后输入机器学习分类算法训练,构建识别混淆程序的二分类模型与识别混淆技术的多分类模型。基于多来源第三方数据集与两种先进混淆工具验证该识别模型,使用10维特征识别两类混淆工具的混淆程序,平均识别准确率分别为100%、99.6%;使用30维特征识别5层以上混淆组合技术,平均识别准确率为98.8%。实验结果表明提出的代码混淆技术识别模型相较其他识别模型准确率更高,且对不同混淆工具有一定泛化能力,揭示了当前主流代码混淆技术的隐蔽性风险。 展开更多
关键词 混淆识别 n-gram 代码混淆 混淆隐蔽性
下载PDF
基于Gram矩阵的T-CNN时间序列分类方法 被引量:2
8
作者 王俊陆 李素 +2 位作者 纪婉婷 姜天 宋宝燕 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第2期267-276,共10页
时间序列分类是流式数据事件分析和数据挖掘的基础.针对现有方法损失时间属性、分类准确率低、效率低等问题,提出基于Gram矩阵的T-CNN时间序列分类方法.该方法对时间序列进行小波阈值去噪,过滤正态曲线噪声,提出基于Gram矩阵的无损时间... 时间序列分类是流式数据事件分析和数据挖掘的基础.针对现有方法损失时间属性、分类准确率低、效率低等问题,提出基于Gram矩阵的T-CNN时间序列分类方法.该方法对时间序列进行小波阈值去噪,过滤正态曲线噪声,提出基于Gram矩阵的无损时间域图像转换方法,保留事件全部信息.改进时间序列CNN分类方法,在卷积层计算引入Toeplitz卷积核矩阵,实现矩阵乘积替换卷积运算.引入Triplet网络思想,构建T-CNN分类模型,通过计算同类事件与不同类事件间的相似度优化CNN的平方损失函数,提高T-CNN模型梯度下降的收敛速率及分类准确性.实验表明,相比现有方法,T-CNN时间序列分类方法能够提高35%的分类准确率、35%的分类精确率及40%的分类效率. 展开更多
关键词 gram矩阵 T-Cnn模型 TOEPLITZ 损失函数 Triplet网络
下载PDF
基于前后文n-gram模型的古汉语句子切分 被引量:25
9
作者 陈天莹 陈蓉 +2 位作者 潘璐璐 李红军 于中华 《计算机工程》 CAS CSCD 北大核心 2007年第3期192-193,196,共3页
提出了基于前后文n-gram模型的古汉语句子切分算法,该算法能够在数据稀疏的情况下,通过收集上下文信息,对切分位置进行比较准确的预测,从而较好地处理小规模训练语料的情况,降低数据稀疏对切分准确率的影响。采用《论语》对所提出的算... 提出了基于前后文n-gram模型的古汉语句子切分算法,该算法能够在数据稀疏的情况下,通过收集上下文信息,对切分位置进行比较准确的预测,从而较好地处理小规模训练语料的情况,降低数据稀疏对切分准确率的影响。采用《论语》对所提出的算法进行了句子切分实验,达到了81%的召回率和52%的准确率。 展开更多
关键词 n-gram模型 数据稀疏 平滑技术 基于前后文的n-gram模型
下载PDF
N-gram语言模型中的插值平滑技术研究 被引量:13
10
作者 徐望 王炳锡 《信息工程大学学报》 2002年第4期13-15,共3页
本文研究了N元文法(N gram)统计语言模型中的4种插值平滑算法,在中文语言模型中进行了应用,从语言模型复杂度的角度比较了该4种方法解决零概率问题的效率。
关键词 n-gram语言模型 复杂度 插值平滑算法 语音识别 中文语言模型 n元文法统计模型
下载PDF
N-gram统计模型在机器翻译系统中的应用 被引量:5
11
作者 张健 李素建 刘群 《计算机工程与应用》 CSCD 北大核心 2002年第8期73-75,78,共4页
文章提出了N-gram模型在机器翻译系统中的几个应用。模型是在语料库的基础上统计连续几个词的出现概率,以此来筛选翻译过程中的侯选元素,并可以对译文的语序进行纠正。由于此种方法是建立在语料库的基础之上的,从而具有真实可靠和实时... 文章提出了N-gram模型在机器翻译系统中的几个应用。模型是在语料库的基础上统计连续几个词的出现概率,以此来筛选翻译过程中的侯选元素,并可以对译文的语序进行纠正。由于此种方法是建立在语料库的基础之上的,从而具有真实可靠和实时等特点。实验表明,这种方法具有良好的性能,且与被处理的语言无关。 展开更多
关键词 机器翻译系统 n-gram统计模型 语料库 自然语言处理 计算机
下载PDF
一种新的基于N-gram模型的重复软件缺陷报告检测方法 被引量:2
12
作者 李宁 李战怀 张利军 《西北工业大学学报》 EI CAS CSCD 北大核心 2010年第2期298-303,共6页
软件开发维护过程中产生的缺陷报告中常常出现大量的重复缺陷报告。自动准确地检测出重复缺陷报告,将为软件缺陷的分派、修正、再测试等工作节约大量宝贵的开发维护成本。文章基于传统的向量空间模型检测方法,提出一种新的基于N-gram模... 软件开发维护过程中产生的缺陷报告中常常出现大量的重复缺陷报告。自动准确地检测出重复缺陷报告,将为软件缺陷的分派、修正、再测试等工作节约大量宝贵的开发维护成本。文章基于传统的向量空间模型检测方法,提出一种新的基于N-gram模型的重复缺陷报告检测方法,文中第2小节中详细介绍了该方法的细节。通过在小数据集上的实验,明确了在使用该方法检测重复缺陷报告时,参数N取3/4/5,利用全句法仅针对缺陷报告的概要信息进行相似度计算将取得较好的效果。最终使用一个含有4 503条Firefox缺陷报告的数据集对该方法进行了验证。实验证明N-gram模型法与向量空间模型法相比,重复缺陷的查全率(Recall Rate)提高了25%~55%。 展开更多
关键词 自然语言处理系统 重复缺陷报告 n-gram方法 文本相似度
下载PDF
基于N-Gram模型的蒙古语文本语种识别算法的研究 被引量:3
13
作者 马志强 张泽广 +3 位作者 闫瑞 刘利民 冯永祥 苏依拉 《中文信息学报》 CSCD 北大核心 2016年第1期133-139,共7页
互联网上蒙古语文本正在不断地增加,如何让网络中的蒙古语内容为搜索引擎和舆情分析等应用提供服务引起了社会的高度关注。首先要解决如何采集网络中蒙古语文本数据,核心是准确识别网络中蒙古语文本的问题。该文提出了基于N-Gram模型的... 互联网上蒙古语文本正在不断地增加,如何让网络中的蒙古语内容为搜索引擎和舆情分析等应用提供服务引起了社会的高度关注。首先要解决如何采集网络中蒙古语文本数据,核心是准确识别网络中蒙古语文本的问题。该文提出了基于N-Gram模型的平均距离识别算法,建立了一个能够对目标语种识别的实验平台。实验结果表明,识别算法能够很好地从中文、英文、蒙古文以及混合语言文本中识别出蒙古语文本,准确率达到99.5%以上。 展开更多
关键词 语种识别 n-gram模型 平均距离识别算法 蒙古语文本
下载PDF
基于梯度核特征及N-gram模型的商品图像句子标注 被引量:5
14
作者 张红斌 姬东鸿 +1 位作者 尹兰 任亚峰 《计算机科学》 CSCD 北大核心 2016年第5期269-273,287,共6页
提出为商品图像标注句子,以便更准确地刻画图像内容。首先,执行图像特征学习,选出标注性能最优的梯度核特征完成图像分类和图像检索,该特征能客观描绘商品图像中形状和纹理这两类关键视觉特性。然后,基于语义相关度计算结果从训练图像... 提出为商品图像标注句子,以便更准确地刻画图像内容。首先,执行图像特征学习,选出标注性能最优的梯度核特征完成图像分类和图像检索,该特征能客观描绘商品图像中形状和纹理这两类关键视觉特性。然后,基于语义相关度计算结果从训练图像的文本描述中摘取关键单词,并采用N-gram模型把单词组装为蕴涵丰富语义信息且满足句法模式兼容性的修饰性短语,基于句子模板和修饰性短语生成句子。最后,构建Boosting模型,从若干标注结果中选取BLEU-3评分最优的句子标注商品图像。结果表明,Boosting模型的标注性能优于各基线。 展开更多
关键词 梯度核特征 n-gram模型 商品图像 句子标注 语义相关度计算 修饰性短语
下载PDF
维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法 被引量:5
15
作者 如先姑力·阿布都热西提 亚森·艾则孜 郭文强 《计算机应用研究》 CSCD 北大核心 2019年第11期3410-3414,共5页
提出了一种结合n-gram统计模型和类不平衡支持向量机(SVM)分类器的维语文本过滤方法。首先,将网页文本进行预处理操作,通过n-gram统计模型来初步提取词干;然后,对词干进行语义分析,将具有相似含义的词干聚合为一类,以此降低词干维度;最... 提出了一种结合n-gram统计模型和类不平衡支持向量机(SVM)分类器的维语文本过滤方法。首先,将网页文本进行预处理操作,通过n-gram统计模型来初步提取词干;然后,对词干进行语义分析,将具有相似含义的词干聚合为一类,以此降低词干维度;最后,在传统SVM中引入一个控制超平面之间距离的参数,构建一种类不平衡SVM,使其能够很好地分类具有非线性不可分和不平衡性的维吾尔语文本。实验结果表明,该方法能够准确分类出不良文本,且具有较短的分类时间。 展开更多
关键词 维吾尔语网页 不良文本过滤 n-gram词干提取 类不平衡SVM
下载PDF
基于n-gram语言模型和链状朴素贝叶斯分类器的中文文本分类系统 被引量:16
16
作者 毛伟 徐蔚然 郭军 《中文信息学报》 CSCD 北大核心 2006年第3期29-35,共7页
本文提出了一个基于n-gram语言模型进行文本表示,采用链状朴素贝叶斯分类器进行分类的中文文本分类系统。介绍了如何用n-gram语言模型进行文本表示,阐述了链状朴素贝叶斯分类器与n-gram语言模型相结合的优势,分析了n-gram语言模型参数... 本文提出了一个基于n-gram语言模型进行文本表示,采用链状朴素贝叶斯分类器进行分类的中文文本分类系统。介绍了如何用n-gram语言模型进行文本表示,阐述了链状朴素贝叶斯分类器与n-gram语言模型相结合的优势,分析了n-gram语言模型参数的选取,讨论了分类系统的若干重要问题,研究了训练集的规模和质量对分类系统的影响。根据863计划文本分类测评组所提供的测试标准、训练集以及测试集对本文所设计的分类系统进行测试,实验结果表明该分类系统有良好的分类效果。 展开更多
关键词 计算机应用 中文信息处理 中文文本分类 n-gram语言模型 链状朴素贝叶斯分类器
下载PDF
基于Web的无指导译文消歧词模型与N-gram模型及对比研究 被引量:3
17
作者 刘鹏远 赵铁军 《电子与信息学报》 EI CSCD 北大核心 2009年第12期2969-2974,共6页
该文提出了基于Web的无指导译文消歧的词模型及N-gram模型方法,并在尽可能相同的条件下进行了比较。两种方法均利用搜索引擎统计不同搜索片段在Web上的Page Count作为主要消歧信息。词模型定义了汉语词汇与英语词汇之间的双语词汇Web相... 该文提出了基于Web的无指导译文消歧的词模型及N-gram模型方法,并在尽可能相同的条件下进行了比较。两种方法均利用搜索引擎统计不同搜索片段在Web上的Page Count作为主要消歧信息。词模型定义了汉语词汇与英语词汇之间的双语词汇Web相关度,根据汉语上下文词汇与英语译文之间的相关度进行消歧;N-gram模型首先假设不同语义下的多义词N-gram序列行为模式不同,从而可对多义词不同语义类下词汇在实例中的N-gram序列进行统计与分析以进行消歧。两个模型的性能均超过了在国际语义评测SemEval2007的task#5上可比较的最好无指导系统。对这两个模型进行试验对比可发现N-gram模型性能优于词模型,也表明组合两类模型的结果有进一步提升消歧性能的潜力。 展开更多
关键词 计算语言学 无指导译文消歧 模型 n-gram模型 PAGE COUnT 双语词汇Web相关度
下载PDF
基于公共词块及N-gram模型的问句相似度算法 被引量:7
18
作者 黄贤英 谢晋 龙姝言 《重庆理工大学学报(自然科学)》 CAS 2017年第10期175-179,197,共6页
问句相似度算法是问答系统的核心问题,直接影响着问答系统的准确性。针对公共词块算法(CCS)对于中文文本的不适用性,提出一种改进的问句相似度算法(CNS)。该方法结合N-gram模型及公共词块来计算问句向量的相似度,其主要思路是把问句分... 问句相似度算法是问答系统的核心问题,直接影响着问答系统的准确性。针对公共词块算法(CCS)对于中文文本的不适用性,提出一种改进的问句相似度算法(CNS)。该方法结合N-gram模型及公共词块来计算问句向量的相似度,其主要思路是把问句分解成一元模型和二元模型,然后再分析问句之间的公共词块并考虑其顺序结构。实验结果表明:新算法在Top-N条数据集的平均相似度和不同相似度阈值下的准确率均优于常用的问句相似度算法。 展开更多
关键词 问句相似度 n-gram模型 一元模型 公共词块
下载PDF
基于N-gram模型的中文分词算法的研究 被引量:4
19
作者 丁洁 赵景惠 《福建电脑》 2017年第5期110-110,116,共2页
本文对中文分词的定义和正向最大匹配法进行了分析和研究,本系统在传统机械分词的基础上加入了优化技术,基于N-gram模型的中文分词算法的效率和正确率都相对较高,最后对中文分词技术进行了一定的展望和提出了下一步的工作。
关键词 中文分词 正向最大匹配法 基于n—gram模型
下载PDF
GM(1,N)模型的病态性研究及其在生态创新中的应用
20
作者 熊萍萍 李田田 +1 位作者 檀成伟 武彧睿 《运筹与管理》 CSCD 北大核心 2023年第4期134-139,共6页
本文以中国工业企业为研究对象,深入探究适用于多因素、少数据的生态创新相关指标特征的灰色模型预测技术。针对传统灰色预测模型在进行参数估计时可能存在的病态性问题展开研究,通过引入L2正则项的最小二乘法,利用粒子群算法求解最优... 本文以中国工业企业为研究对象,深入探究适用于多因素、少数据的生态创新相关指标特征的灰色模型预测技术。针对传统灰色预测模型在进行参数估计时可能存在的病态性问题展开研究,通过引入L2正则项的最小二乘法,利用粒子群算法求解最优值。将该模型应用于生态创新,与其他模型进行结果对比。结果表明,引入L2正则项的最小二乘法解决了模型的病态性问题,具有良好的预测性能,验证了该模型的有效性。 展开更多
关键词 GM(1 n)模型 病态性 粒子群算法 生态创新
下载PDF
上一页 1 2 83 下一页 到第
使用帮助 返回顶部