期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
导数推广的拉格朗日插值公式及其在密文训练神经网络中的应用 被引量:1
1
作者 杨舒雅 李晓东 张健毅 《北京电子科技学院学报》 2024年第1期50-59,共10页
拉格朗日多项式插值公式被用于经过若干点的未知函数的多项式刻画,也被用于对已有的非多项式函数进行多项式函数逼近,在许多领域有着广泛的应用。本文探索了拉格朗日多项式插值公式在导数情况下的一般性推广。推广的多项式插值公式不仅... 拉格朗日多项式插值公式被用于经过若干点的未知函数的多项式刻画,也被用于对已有的非多项式函数进行多项式函数逼近,在许多领域有着广泛的应用。本文探索了拉格朗日多项式插值公式在导数情况下的一般性推广。推广的多项式插值公式不仅可以在插值点的函数值逼近目标函数,同时也能在插值点的变化趋势上对目标函数进行逼近。在已知插值点上给定某个阶数以内导数的情况下,能够使用推广的拉格朗日多项式插值公式获得对目标函数的深度多项式逼近。实验结果表明,用导数推广拉格朗日多项式代替逻辑回归函数重新构建的密文神经网络的训练准确率更高,均方误差更小。扩展后的拉格朗日多项式插值公式能够适用于更一般的场景。 展开更多
关键词 拉格朗日插值公式导数推广 密文训练神经网络 多项式逼近 激励函数
下载PDF
基于对比学习和注意力机制的文本分类方法
2
作者 钱来 赵卫伟 《计算机工程》 CAS CSCD 北大核心 2024年第7期104-111,共8页
文本分类作为自然语言处理领域的基本任务,在信息检索、机器翻译和情感分析等应用中发挥着重要作用。然而大多数深度模型在预测时未充分考虑训练实例的丰富信息,导致学到的文本特征不够全面。为了充分利用训练实例信息,提出一种基于对... 文本分类作为自然语言处理领域的基本任务,在信息检索、机器翻译和情感分析等应用中发挥着重要作用。然而大多数深度模型在预测时未充分考虑训练实例的丰富信息,导致学到的文本特征不够全面。为了充分利用训练实例信息,提出一种基于对比学习和注意力机制的文本分类方法。首先,设计一种有监督对比学习训练策略,旨在优化模型对文本向量表征的检索,提高模型在推理过程中检索到的训练实例的质量;然后,构建注意力机制,对获取的训练文本特征进行注意力分布学习,聚焦关联性更强的相邻实例信息,获得更多隐含的相似特征;最后,将注意力机制与模型网络相结合,融合相邻的训练实例信息,增强模型提取多样性特征的能力,实现全局特征和局部特征的提取。实验结果表明,所提方法在卷积神经网络(CNN)、双向长短期记忆网络(Bi LSTM)、图卷积网络(GCN)、BERT和Ro BERTa等多个模型上都取得了显著的性能提升。以CNN模型为例,其在THUCNews数据集、今日头条数据集和搜狗数据集上宏F1值分别提高了4.15、6.2和1.92个百分点。因此,该方法也为文本分类任务提供了一种有效的解决方案。 展开更多
关键词 文本分类 深度模型 对比学习 近似最近邻算法 注意力机制
下载PDF
不定长数据中识别模糊文本的数据加载方法
3
作者 苗小爱 《软件导刊》 2023年第5期177-183,共7页
随着人工智能的发展,越来越多的企业开始构建智能应用,OCR即是人工智能落地应用之一,也是当前研究热点。在自然场景下,由于拍摄环境复杂、拍摄设备质量参差不齐,以及拍摄的图片存在文字模糊、文本部分缺失、背景复杂等情况,会造成在不... 随着人工智能的发展,越来越多的企业开始构建智能应用,OCR即是人工智能落地应用之一,也是当前研究热点。在自然场景下,由于拍摄环境复杂、拍摄设备质量参差不齐,以及拍摄的图片存在文字模糊、文本部分缺失、背景复杂等情况,会造成在不定长数据集上训练文本识别模型困难的问题。针对此情况,提出一种新的数据加载方法以加快收敛速度,提高模型识别准确率。该方法主要包括两部分:(1)设计近似背景填充以适当增加负样本比例;(2)设定图像放缩阈值,保证真实数据形状并对数据进行适度放缩以达到自然场景下文本数据样式效果。与常用的经典数据加载方法相比,该数据加载方法具有更快的拟合速度和识别准确率。 展开更多
关键词 文本识别 文字模糊 数据加载 图像放缩阈值 近似背景填充
下载PDF
基于词性标记串统计特性的文本数字水印算法 被引量:11
4
作者 戴祖旭 洪帆 +1 位作者 崔国华 付敏 《通信学报》 EI CSCD 北大核心 2007年第4期108-113,共6页
提出了一个将n元熵方程化为至多(n?1)个一元非线性方程求解的算法,证明了算法的正确性,给出了误差估计。利用词性标记串的统计特性设计了一种基于熵的文本数字水印方案,该方案通过改变词性标记串的概率分布使其熵与嵌入的水印一致。由... 提出了一个将n元熵方程化为至多(n?1)个一元非线性方程求解的算法,证明了算法的正确性,给出了误差估计。利用词性标记串的统计特性设计了一种基于熵的文本数字水印方案,该方案通过改变词性标记串的概率分布使其熵与嵌入的水印一致。由于水印函数是一类实值函数,其值域仅受计算精度限制,可以大幅度提高水印容量。 展开更多
关键词 文本数字水印 熵方程数值解 词性标记
下载PDF
无线传感网络改进APIT定位算法 被引量:3
5
作者 卢迪 刘世琦 《哈尔滨理工大学学报》 CAS 2014年第4期95-99,共5页
未知节点定位是无线传感网络中的研究重点之一,目前最常用算法为基于免测距原理的APIT算法.该算法具有通信开销小、硬件简单易实现等优点,但其基本思想为质心原理定位,故定位精度难以提高,特别是当锚节点稀疏时无法定位.针对APIT定位算... 未知节点定位是无线传感网络中的研究重点之一,目前最常用算法为基于免测距原理的APIT算法.该算法具有通信开销小、硬件简单易实现等优点,但其基本思想为质心原理定位,故定位精度难以提高,特别是当锚节点稀疏时无法定位.针对APIT定位算法无法定位,锚节点三角形不包含待定节点的情况,提出一种改进两点定位法,并与原APIT定位算法相结合,提高了定位精度及未知节点覆盖率. 展开更多
关键词 锚节点 两点定位 approximate point-in-triangulation定位算法 无线传感网络
下载PDF
一种基于粗糙集的改进KNN文本分类算法 被引量:3
6
作者 苟和平 景永霞 +1 位作者 冯百明 李勇 《科学技术与工程》 北大核心 2012年第20期4926-4929,共4页
K最近邻算法(KNN)被认为是向量空间模型下最好的分类算法之一。在准确率和召回率方面比较出众,但随着样本数量的增加其相似度计算开销很大。提出一种改进算法RS-KNN,主要是利用粗糙集的相关理论,计算训练样本集中各样本子类的上近似空... K最近邻算法(KNN)被认为是向量空间模型下最好的分类算法之一。在准确率和召回率方面比较出众,但随着样本数量的增加其相似度计算开销很大。提出一种改进算法RS-KNN,主要是利用粗糙集的相关理论,计算训练样本集中各样本子类的上近似空间和下近似空间,根据待分类文本出现在不同的近似空间。以缩减与待分类样本计算相似度的训练样本个数。实验表明此算法能够有效地降低分类计算开销。 展开更多
关键词 K最近邻 文本分类 粗糙集 近似空间
下载PDF
基于中心点精确响应面法的板壳结构优化 被引量:9
7
作者 隋允康 白海波 《机械设计》 CSCD 北大核心 2005年第11期10-13,共4页
对响应面方法中两个最为关键的概念———近似函数及试验设计做了简单描述,选择线性函数作为约束条件的近似函数形式,并对位移和应力约束作不同处理,位移约束不含常数项,而应力约束含常数项。提出了一种适合建立一阶形式响应面并使结构... 对响应面方法中两个最为关键的概念———近似函数及试验设计做了简单描述,选择线性函数作为约束条件的近似函数形式,并对位移和应力约束作不同处理,位移约束不含常数项,而应力约束含常数项。提出了一种适合建立一阶形式响应面并使结构分析次数最少的试验设计方法———中心扩展法。求解响应面时在最小二乘法的基础之上作了改进,提出中心点精确响应面法,使拟合的响应面中心点处的响应值精确等于有限元分析值。最后通过数值算例说明改进后的响应面法对于板壳结构优化的可行性和优越性。 展开更多
关键词 响应面法 结构优化 近似函数 数值实验 板壳结构
下载PDF
基于RSSI的三角形质心定位算法的优化策略 被引量:7
8
作者 郭瑞 马寅飞 《微电子学与计算机》 CSCD 北大核心 2014年第3期111-114,共4页
为了解决基于RSSI(接收信号强度)的三角形质心定位算法在减小定位误差上效率较低、定位稳定性不高的问题,提出了一种改进的定位算法.仿真结果表明:改进的三角形质心定位算法在减小定位误差上具有更高的效率和性能,同时也保证了定位的稳... 为了解决基于RSSI(接收信号强度)的三角形质心定位算法在减小定位误差上效率较低、定位稳定性不高的问题,提出了一种改进的定位算法.仿真结果表明:改进的三角形质心定位算法在减小定位误差上具有更高的效率和性能,同时也保证了定位的稳定性. 展开更多
关键词 无线传感器网络 RSSI三角形质心定位 近似三角形内点测试法
下载PDF
允许错误的(汉字)字符串快速检索技术 被引量:4
9
作者 邹旭楷 王素琴 《软件学报》 EI CSCD 北大核心 1994年第10期55-59,共5页
在计算机应用的诸多领域中都会遇到字符串相似检索问题.本文提出了一种技术,它通过应用搜索状态向量及字符一模式匹配向量,将字符串匹配比较转化为简单的整数字位运算,有效地解决了字符/汉字串的相似匹配问题.文中也给出了实现算... 在计算机应用的诸多领域中都会遇到字符串相似检索问题.本文提出了一种技术,它通过应用搜索状态向量及字符一模式匹配向量,将字符串匹配比较转化为简单的整数字位运算,有效地解决了字符/汉字串的相似匹配问题.文中也给出了实现算法并分析了算法的复杂性. 展开更多
关键词 字符串检索 相似匹配 算法 计算机应用
下载PDF
变精度粗糙集的加权KNN文本分类算法 被引量:10
10
作者 刘发升 董清龙 李文静 《计算机工程与设计》 北大核心 2019年第5期1339-1342,1364,共5页
针对训练样本较大时KNN算法(K最近邻算法)的分类效率较低和训练样本不均衡时算法的分类性能受到影响这两个问题,提出变精度粗糙集的加权KNN文本分类算法。利用变精度粗糙集上下近似的概念,将各个类别的训练集分为β正区域和β边界域。... 针对训练样本较大时KNN算法(K最近邻算法)的分类效率较低和训练样本不均衡时算法的分类性能受到影响这两个问题,提出变精度粗糙集的加权KNN文本分类算法。利用变精度粗糙集上下近似的概念,将各个类别的训练集分为β正区域和β边界域。分类过程中根据测试样本与样本中心的相似度,得到样本的归属区域。其中属于β正区域的样本可以直接判断其类别,其它区域的样本用基于数量加权的KNN算法判断其类别。实验结果表明,该算法能有效提高分类的性能和效率。 展开更多
关键词 K最近邻 文本分类 变精度粗糙集 上近似 下近似 数量加权
下载PDF
P2P网络中相似文本的聚集存储和模糊查询 被引量:1
11
作者 董建设 袁占亭 张秋余 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2007年第6期1349-1353,共5页
针对目前各种结构化P2P协议在对资源进行查询时依赖于准确的全局唯一标识符(Global Unique Identifier),无法实现相似资源的模糊查找的问题,提出了一种资源发布和查找策略,实现了相似文本的聚集存储和模糊查询。该策略首先根据文本内容... 针对目前各种结构化P2P协议在对资源进行查询时依赖于准确的全局唯一标识符(Global Unique Identifier),无法实现相似资源的模糊查找的问题,提出了一种资源发布和查找策略,实现了相似文本的聚集存储和模糊查询。该策略首先根据文本内容生成具有强鲁棒性的指纹,以该指纹作为文本在P2P网络中发布的基础,实现将相似的文本发布到同一节点或相邻节点,进而实现高效的分布式相似文本查询。该算法构建在分布式哈希表(DHT)路由基础之上,适用于各种以DHT为特征的结构化P2P系统。 展开更多
关键词 计算机系统结构 相似文本查询 聚集存储 P2P网络
下载PDF
基于Simhash的大规模文档去重改进算法研究 被引量:8
12
作者 王诚 王宇成 《计算机技术与发展》 2019年第2期115-119,共5页
针对大规模文档去重算法Simhash存在的缺点和不足,提出一种改进的Simhash算法。首先从多个维度综合计算文档的相似度,包括文档内容、文档关键字、文档的标签、文档的引用文献等方面,定义一个新的公式用于计算文档相似度。其次改进Simhas... 针对大规模文档去重算法Simhash存在的缺点和不足,提出一种改进的Simhash算法。首先从多个维度综合计算文档的相似度,包括文档内容、文档关键字、文档的标签、文档的引用文献等方面,定义一个新的公式用于计算文档相似度。其次改进Simhash算法计算文档特征的方法,通过TF-IDF技术和单词的主题相关性综合计算单词的权重,TF-IDF技术用于计算一个关键词在一个文档集中的一篇文档的重要性,将专业术语词汇的长度统计函数作为判断单词主题相关性的依据。最后在检索步骤中采用哈希到桶的思想,此时出现分布不均匀的情况,为此设定一个阈值,当超过阈值时,对桶内的元素进行二次哈希,可以减少候选对的数量并且使分布更加均匀。实验结果表明,改进后的算法可以明显提高原Simhash算法的效率和准确率。 展开更多
关键词 Web大数据 Simhash 近似文本检测 多维度 二次哈希
下载PDF
近似串匹配算法在自动评分系统中的应用 被引量:10
13
作者 李少芳 车艳 《东莞理工学院学报》 2008年第3期25-28,共4页
无纸化考试是大规模计算机基础课考试的发展趋势,自动评分系统的可靠设计与实现直接影响这类考试的可信度,应引起足够重视.简述计算机自动评分系统研究现状,详细介绍了近似串匹配算法的实现原理,并讨论其在文字录入模块自动评分中的一... 无纸化考试是大规模计算机基础课考试的发展趋势,自动评分系统的可靠设计与实现直接影响这类考试的可信度,应引起足够重视.简述计算机自动评分系统研究现状,详细介绍了近似串匹配算法的实现原理,并讨论其在文字录入模块自动评分中的一些关键应用. 展开更多
关键词 近似串匹配 自动评分 文字录入 算法应用
下载PDF
基于近似网页聚类的Web文本数据挖掘技术 被引量:1
14
作者 杨文忠 章兢 彭曙蓉 《长沙交通学院学报》 2006年第1期72-75,共4页
提出一种针对小文本的基于近似网页聚类算法的Web文本数据挖掘技术,以获得用户感兴趣的近似网页簇系列。试验证明,该算法在保证查全率和查准率的基础上大大提高了搜索效率。由于是针对小文本的数据挖掘,研究的算法时间和空间复杂度都不... 提出一种针对小文本的基于近似网页聚类算法的Web文本数据挖掘技术,以获得用户感兴趣的近似网页簇系列。试验证明,该算法在保证查全率和查准率的基础上大大提高了搜索效率。由于是针对小文本的数据挖掘,研究的算法时间和空间复杂度都不高,因此,有望成为一种实用、有效的信息检索技术。 展开更多
关键词 信息检索 文本数据挖掘 近似网页聚类
下载PDF
一种有效的并行汉字/字符串相似检索技术 被引量:2
15
作者 王素琴 邹旭楷 《软件学报》 EI CSCD 北大核心 1995年第8期463-467,共5页
本文提出了一种有效的并行汉字/字符串相似检索技术.通过引入搜索状态向量及字符一模式匹配向量,该技术将字符串匹配比较转化为简单的整数字位运算,通过对字符串方向相反的搜索有效地实现了多处理机对汉字/字符串的并行相似检索.... 本文提出了一种有效的并行汉字/字符串相似检索技术.通过引入搜索状态向量及字符一模式匹配向量,该技术将字符串匹配比较转化为简单的整数字位运算,通过对字符串方向相反的搜索有效地实现了多处理机对汉字/字符串的并行相似检索.文中也给出了并行实现算法,同时分析了算法的复杂性. 展开更多
关键词 并行算法 字符串检索 汉字检索
下载PDF
改进的近似模式匹配算法
16
作者 张丽霞 宋鸿陟 《计算机工程与设计》 CSCD 北大核心 2011年第5期1820-1823,共4页
为了提高近似模式匹配算法在多次匹配情况下的效率,借鉴了文本快速过滤算法的思想,分析了平均情况下改进的动态规划算法(DP算法),并在此基础上设计实现了一种改进的DP算法,称为IMP-DP。该算法在匹配过程中,将上一次运算的结果存储起来,... 为了提高近似模式匹配算法在多次匹配情况下的效率,借鉴了文本快速过滤算法的思想,分析了平均情况下改进的动态规划算法(DP算法),并在此基础上设计实现了一种改进的DP算法,称为IMP-DP。该算法在匹配过程中,将上一次运算的结果存储起来,与上次相同的匹配可在原有成功匹配结果的基础上进行运算,忽略将不可能产生成功匹配的区域,只关注剩余的区域。由算法时间复杂性和实验对比分析结果表明,该算法在多次匹配情况下,效率远远高于其它算法,从而验证了该算法改进的有效性。 展开更多
关键词 模式匹配 近似模式匹配 动态规划 文本快速过滤 IMP—DP
下载PDF
一种基于SBL和APIT的混合定位算法 被引量:5
17
作者 韩睿松 杨维 《传感技术学报》 CAS CSCD 北大核心 2014年第8期1094-1099,共6页
由于子区域分割粒度的限制,基于阶次序列的定位算法(Sequence-based localization,SBL)存在边缘区域节点定位误差较大和不能保证平均定位误差性能的问题。针对这些问题,提出了一种基于SBL和APIT的混合定位算法,利用APIT信标三角形切割SB... 由于子区域分割粒度的限制,基于阶次序列的定位算法(Sequence-based localization,SBL)存在边缘区域节点定位误差较大和不能保证平均定位误差性能的问题。针对这些问题,提出了一种基于SBL和APIT的混合定位算法,利用APIT信标三角形切割SBL算法子区域,减小子区域面积,实现了分割粒度的细化。通过预先进行系统训练,优化了混合算法的加权系数,进一步提升了算法的定位精度。仿真结果表明,相比于原算法,所提出的混合算法有效地提升了边界区域节点的定位精度,其平均定位误差降低了17.9%,使基于阶次序列的定位算法的定位精度得到了有效改善。 展开更多
关键词 无线传感器网络 定位 阶次序列 近似三角形内点法 wireless sensor network( WSN) sequence-based localization( SBL) approximate point-in-triangulation test( APIT)
下载PDF
空间关键字个性化语义近似查询方法 被引量:2
18
作者 李盼 张霄雁 +2 位作者 孟祥福 赵路路 齐雪月 《智能系统学报》 CSCD 北大核心 2020年第6期1163-1174,共12页
现有的空间关键字查询处理模式大都仅支持位置相近和文本相似匹配,但不能将语义相近但形式上不匹配的对象提供给用户;并且,当前的空间−文本索引结构也不能对空间对象中的数值属性进行处理。针对上述问题,本文提出了一种支持语义近似查... 现有的空间关键字查询处理模式大都仅支持位置相近和文本相似匹配,但不能将语义相近但形式上不匹配的对象提供给用户;并且,当前的空间−文本索引结构也不能对空间对象中的数值属性进行处理。针对上述问题,本文提出了一种支持语义近似查询的空间关键字查询方法。首先,利用词嵌入技术对用户原始查询进行扩展,生成一系列与原始查询关键字语义相关的查询关键字;然后,提出了一种能够同时支持文本和语义匹配,并利用Skyline方法对数值属性进行处理的混合索引结构AIR-Tree;最后,利用AIR-Tree进行查询匹配,返回top-k个与查询条件最为相关的有序空间对象。实验分析和结果表明,与现有同类方法相比,本文方法具有较高的执行效率和较好的用户满意度;基于AIR-Tree索引的查询效率较IRS-Tree索引提高了3.6%,在查询结果准确率上较IR-Tree和IRS-Tree索引分别提高了10.14%和16.15%。 展开更多
关键词 空间关键字查询 词嵌入 语义近似查询 文本 数值属性 索引结构 查询匹配
下载PDF
基于粗糙集特征加权的文本分类 被引量:1
19
作者 徐欣 黄理灿 赵玉虹 《浙江理工大学学报(自然科学版)》 2011年第4期544-548,共5页
文本分类是当今信息检索和数据挖掘等领域的研究热点,而特征加权是文本分类过程中的重要步骤。为了提高分类质量,文章通过深入分析粗糙集理论和逆文本频率加权的思想,提出了一种基于粗糙集的特征加权方法,从近似分类精度和近似分类质量... 文本分类是当今信息检索和数据挖掘等领域的研究热点,而特征加权是文本分类过程中的重要步骤。为了提高分类质量,文章通过深入分析粗糙集理论和逆文本频率加权的思想,提出了一种基于粗糙集的特征加权方法,从近似分类精度和近似分类质量两个方面考虑特征词对分类的全局作用,将文本的类别属性信息引入到权重中。通过文本分类实验证明,该加权方法有助于提高分类系统的分类效果。 展开更多
关键词 粗糙集理论 特征加权 文本分类 近似分类精度 近似分类质量
下载PDF
基于服务相似度的移动用户近似邻居选取方法 被引量:1
20
作者 缪峰 贾华丁 熊于宁 《计算机工程》 CAS CSCD 北大核心 2018年第5期162-167,173,共7页
现有近似邻居集选取方法存在分类较粗、标签缺失等问题,在移动服务方面无法取得较好的效果。为此,提出一种有效的近似邻居集选取方法。通过改进短文本相似度计算方法,基于服务介绍内容,求出移动服务之间的相似度,根据服务相似度,改进用... 现有近似邻居集选取方法存在分类较粗、标签缺失等问题,在移动服务方面无法取得较好的效果。为此,提出一种有效的近似邻居集选取方法。通过改进短文本相似度计算方法,基于服务介绍内容,求出移动服务之间的相似度,根据服务相似度,改进用户相似度计算方法,得到用户之间非对称的有向相似度,给出分步筛选法,解决由于冷启动等原因引起的目标用户近似邻居集数量庞大的问题。实验结果表明,该方法的准确率高于关键词重叠法和余弦法。 展开更多
关键词 移动服务推荐 邻居筛选 短文本相似度 近似邻居 AP聚类
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部