期刊文献+
共找到1,386篇文章
< 1 2 70 >
每页显示 20 50 100
基于金字塔语义token全局信息增强的高分光学遥感影像变化检测
1
作者 彭代锋 翟晨晨 +3 位作者 周顶蔚 张永军 管海燕 臧玉府 《测绘学报》 EI CSCD 北大核心 2024年第6期1195-1211,共17页
针对复杂背景、光谱变化等因素导致高分辨率遥感影像中细小地物检测缺失,几何结构检测不完整等问题,本文联合卷积网络和Transformer网络优势,提出一种基于金字塔语义token全局信息增强的变化检测网络(PST-GIENet)。首先,利用无最大池化... 针对复杂背景、光谱变化等因素导致高分辨率遥感影像中细小地物检测缺失,几何结构检测不完整等问题,本文联合卷积网络和Transformer网络优势,提出一种基于金字塔语义token全局信息增强的变化检测网络(PST-GIENet)。首先,利用无最大池化层的ResNet18网络提取多时相影像深度特征以构建融合特征,并采用联合注意力机制和深监督策略提高融合特征表达能力;然后,通过空间金字塔池化将影像特征表示为多尺度语义token,进而利用Transformer编码器和解码器对融合特征空间进行全局上下文建模;最后,通过逐层上采样解码器生成最终变化图。为验证本文方法有效性,采用LEVIR-CD、CDD和WHU-CD 3个公开变化检测数据集进行对比试验与分析,定量结果表明PST-GIENet在3个数据集中均取得最优精度指标,其F 1值分别达到91.71%、96.16%和94.08%。目视结果表明PST-GIENet可有效抑制复杂背景、光谱变化等因素干扰,显著增强网络对地物边缘结构和多尺度变化的捕捉能力,取得最佳目视效果。 展开更多
关键词 高分辨率遥感影像 变化检测 金字塔语义token 全局依赖性 注意力机制
下载PDF
TokenVis:面向以太坊区块链ERC-20智能合约演变模式的可视分析方法 被引量:1
2
作者 李国政 赵琮 +2 位作者 刘驰 陈思明 王国仁 《电子学报》 EI CAS CSCD 北大核心 2024年第2期441-454,共14页
区块链技术近年来受到了广泛关注.区块链技术驱动的加密货币市场复杂且不稳定,容易受到政治、经济、社会等各方面因素的影响.现有的研究工作集中于原生加密货币,如比特币和以太坊币.然而,加密货币市场中存在大量基于ERC-20智能合约的代... 区块链技术近年来受到了广泛关注.区块链技术驱动的加密货币市场复杂且不稳定,容易受到政治、经济、社会等各方面因素的影响.现有的研究工作集中于原生加密货币,如比特币和以太坊币.然而,加密货币市场中存在大量基于ERC-20智能合约的代币.ERC-20代币占据大量市值,吸引了许多投资者的关注.本文提出了TokenVis可视分析系统,用于辅助用户分析不同ERC-20标准代币的演变模式并提供解释.TokenVis集成了一个不同时间粒度的可视分析框架,提出了针对时间序列的切分排序可视化以及基于时间约束的优化算法构建的新闻分布布局,建立了演变模式与新闻之间的关系进而解释了代币演变模式.本文还介绍了与领域专家合作开展的分析案例,包含不同类型代币的演变模式,验证了TokenVis可视分析系统的有效性与可用性. 展开更多
关键词 区块链 智能合约 加密货币 可视分析 ERC-20代币
下载PDF
基于深度卷积-Tokens降维优化视觉Transformer的分心驾驶行为实时检测 被引量:1
3
作者 赵霞 李朝 +2 位作者 付锐 葛振振 王畅 《汽车工程》 EI CSCD 北大核心 2023年第6期974-988,1009,共16页
针对基于端到端深度卷积神经网络的驾驶行为检测模型缺乏全局特征提取能力以及视觉Transformer(vision transformer,ViT)模型不擅长捕捉底层特征和模型参数量较大的问题,本文提出一种基于深度卷积和Tokens降维的ViT模型用于驾驶人分心... 针对基于端到端深度卷积神经网络的驾驶行为检测模型缺乏全局特征提取能力以及视觉Transformer(vision transformer,ViT)模型不擅长捕捉底层特征和模型参数量较大的问题,本文提出一种基于深度卷积和Tokens降维的ViT模型用于驾驶人分心驾驶行为实时检测,并通过开展与其他模型的对比试验、所提模型的消融试验和模型注意力区域的可视化试验充分验证了所提模型的优越性。本文所提模型的平均分类准确率和精确率分别为96.93%和96.95%,模型参数量为21.22 M,基于真实车辆平台在线推理速度为23.32 fps,表明所提模型能够实现实时分心驾驶行为检测。研究结果有利于人机共驾系统的控制策略制定和分心预警。 展开更多
关键词 汽车工程 分心驾驶行为检测模型 视觉Transformer 多头注意力机制 卷积神经网络 tokens降维
下载PDF
Empirical evidence on the ownership and liquidity of real estate tokens 被引量:1
4
作者 Laurens Swinkels 《Financial Innovation》 2023年第1期1246-1274,共29页
To better understand the potential and limitations of the tokenization of real asset mar-kets,empirical studies need to examine this radically new organization of financial mar-kets.In our study,we examine the financi... To better understand the potential and limitations of the tokenization of real asset mar-kets,empirical studies need to examine this radically new organization of financial mar-kets.In our study,we examine the financial and economic consequences of tokenizing 58 residential rental properties in the US,particularly those in Detroit.Tokenization aims at fragmented ownership.We found that the residential properties examined have 254 owners on average.Investors with a greater than USD 5,000 investment in real estate tokens,diversify their real estate ownership across properties within and across the cities.Property ownership changes about once yearly,with more changes for proper-ties on decentralized exchanges.We report that real estate token prices move accord-ing to the house price index;hence,investing in real estate tokens provides economic exposure to residential house prices. 展开更多
关键词 Blockchain Cryptocurrency Real estate tokenIZATION
下载PDF
Language-Independent Text Tokenization Using Unsupervised Deep Learning
5
作者 Hanan A.Hosni Mahmoud Alaaeldin M.Hafez Eatedal Alabdulkreem 《Intelligent Automation & Soft Computing》 SCIE 2023年第1期321-334,共14页
Languages–independent text tokenization can aid in classification of languages with few sources.There is a global research effort to generate text classification for any language.Human text classification is a slow p... Languages–independent text tokenization can aid in classification of languages with few sources.There is a global research effort to generate text classification for any language.Human text classification is a slow procedure.Conse-quently,the text summary generation of different languages,using machine text classification,has been considered in recent years.There is no research on the machine text classification for many languages such as Czech,Rome,Urdu.This research proposes a cross-language text tokenization model using a Transformer technique.The proposed Transformer employs an encoder that has ten layers with self-attention encoding and a feedforward sublayer.This model improves the efficiency of text classification by providing a draft text classification for a number of documents.We also propose a novel Sub-Word tokenization model with frequent vocabulary usage in the documents.The Sub-Word Byte-Pair Tokenization technique(SBPT)utilizes the sharing of the vocabulary of one sentence with other sentences.The Sub-Word tokenization model enhances the performance of other Sub-Word tokenization models such pair encoding model by+10%using precision metric. 展开更多
关键词 Text classification language-independent tokenization sub word tokenization
下载PDF
Non‑fungible tokens:a bubble or the end of an era of intellectual property rights
6
作者 Elli Kraizberg 《Financial Innovation》 2023年第1期777-796,共20页
The viability of exponentially growing non-fungible token(NFT)market is evaluated by identifying potential value-generating mechanisms that can be rationalized.After identifying the value-generating mechanisms underly... The viability of exponentially growing non-fungible token(NFT)market is evaluated by identifying potential value-generating mechanisms that can be rationalized.After identifying the value-generating mechanisms underlying the positive values of NFTs,this study establishes a pricing model for NFTs that follows a continuous-time financial framework.As NFTs are claimed to securitize“ownership rights short of use”,and as such they may potentially serve as a substitute for the need to rely replace the reliance on the legal protection provided by intellectual property rights(IPRs).Considering this issue,this study evaluates the likelihood that NFTs will replace existing mechanisms that protect producers’rightful claim to use their assets or the need to apply the legal code that governs IPRs.The financial condition for this potential shift is derived for a category of assets whose use or consumption does not reduce supply as the notion of scarcity does not apply. 展开更多
关键词 Non-fungible tokens Intellectual property rights STATUS
下载PDF
自然语言处理领域中的词嵌入方法综述 被引量:6
7
作者 曾骏 王子威 +2 位作者 于扬 文俊浩 高旻 《计算机科学与探索》 CSCD 北大核心 2024年第1期24-43,共20页
词嵌入作为自然语言处理任务的第一步,其目的是将输入的自然语言文本转换为模型可以处理的数值向量,即词向量,也称词的分布式表示。词向量作为自然语言处理任务的根基,是完成一切自然语言处理任务的前提。然而,国内外针对词嵌入方法的... 词嵌入作为自然语言处理任务的第一步,其目的是将输入的自然语言文本转换为模型可以处理的数值向量,即词向量,也称词的分布式表示。词向量作为自然语言处理任务的根基,是完成一切自然语言处理任务的前提。然而,国内外针对词嵌入方法的综述文献大多只关注于不同词嵌入方法本身的技术路线,而未能将词嵌入的前置分词方法以及词嵌入方法完整的演变趋势进行分析与概述。以word2vec模型和Transformer模型作为划分点,从生成的词向量是否能够动态地改变其内隐的语义信息来适配输入句子的整体语义这一角度,将词嵌入方法划分为静态词嵌入方法和动态词嵌入方法,并对此展开讨论。同时,针对词嵌入中的分词方法,包括整词切分和子词切分,进行了对比和分析;针对训练词向量所使用的语言模型,从概率语言模型到神经概率语言模型再到如今的深度上下文语言模型的演化,进行了详细列举和阐述;针对预训练语言模型时使用的训练策略进行了总结和探讨。最后,总结词向量质量的评估方法,分析词嵌入方法的当前现状并对其未来发展方向进行展望。 展开更多
关键词 词向量 词嵌入方法 自然语言处理 语言模型 分词 词向量评估
下载PDF
Mode and Logic of Token Transaction Supervision
8
作者 Shunyu Zhao 《Economics World》 2023年第1期31-35,共5页
This paper mainly studies the attitude and supervision mode of various countries towards digital tokens.The strength and methods of supervision in various countries are different.There are cross-border transaction tok... This paper mainly studies the attitude and supervision mode of various countries towards digital tokens.The strength and methods of supervision in various countries are different.There are cross-border transaction tokens and other chaotic situations.It is difficult to supervise and protect the interests of investors,which is not conducive to the healthy development of financial economy in various countries.In addition,with the development of globalization,digital tokens are going to the world and need to circulate among countries.Therefore,a recognized regulatory principle is needed to ensure the healthy development of digital finance worldwide.With the goal of single independent law,with the help of“regulatory sandbox”and“white list”,we explore regulatory principles. 展开更多
关键词 digital finance digital token regulatory model
下载PDF
论NFT数字作品的权属特点与规则适用 被引量:4
9
作者 闫冬 《上海师范大学学报(哲学社会科学版)》 北大核心 2024年第1期75-86,共12页
NFT是一种技术,它通过对数字客体进行标识、登记和固定,使其具有可支配性和特定性。数字作品经过NFT处理后,其“物”的特性得到了强化,从而在一定程度上超出了债权客体的范畴,更接近于物权客体的特征。虽然NFT数字作品的铸造和交易应该... NFT是一种技术,它通过对数字客体进行标识、登记和固定,使其具有可支配性和特定性。数字作品经过NFT处理后,其“物”的特性得到了强化,从而在一定程度上超出了债权客体的范畴,更接近于物权客体的特征。虽然NFT数字作品的铸造和交易应该适用物权规则,但在占有和处分这些作品的过程中,其登记性和非同质性特点却十分鲜明。因此,传统物权规则在应用于该种新型物时需要进行内部调整,同时还需要与外部规则相适配。NFT与区块链登记公示的高度绑定有别于传统的动产物权登记和著作权自愿登记,它应该比照不动产而非动产物权登记机制进行规范,并明确该登记行为在著作权规则中的地位。NFT通过独特识别符形成的非同质性,与同质化代币相比存在巨大差异,因此在适用货币化、证券化规则时应该更加谨慎。 展开更多
关键词 NFT 数字作品 法律属性 物权客体 区块链
下载PDF
联合物理层与MAC层的multi-TRP上行重叠传输处理机制
10
作者 景小荣 熊杰 +1 位作者 孙健 陈前斌 《通信学报》 EI CSCD 北大核心 2024年第8期110-124,共15页
针对非理想回程下现有协议难以有效处理多传输接收节点(multi-TRP)场景中多定时提前(multi-TA)导致的严重上行链路(UL)重叠传输问题,联合改进物理层复用技术和介质访问控制(MAC)令牌桶技术,提出了一种新型的UL重叠传输处理机制。该新型... 针对非理想回程下现有协议难以有效处理多传输接收节点(multi-TRP)场景中多定时提前(multi-TA)导致的严重上行链路(UL)重叠传输问题,联合改进物理层复用技术和介质访问控制(MAC)令牌桶技术,提出了一种新型的UL重叠传输处理机制。该新型机制通过改进物理层重叠信道识别流程、复用要求及复用规则,将物理层复用信息与重叠信息反馈至MAC层,并对MAC层令牌桶技术进行优化。通过仿真实验对所提机制与现有协议机制进行对比,结果表明,在逻辑时隙不可重叠和可重叠2种情形下,物理上行控制信道(PUCCH)实际复用数量性能平均提升了57.58%和49.40%,物理上行共享信道(PUSCH)实际可用资源数量性能平均提升了12.09%和26.03%;优先级最高逻辑信道实际占用资源数量性能平均提升了33.33%和45.48%。 展开更多
关键词 多传输接收节点 上行链路 重叠传输 信道复用 令牌桶
下载PDF
基于自注意力机制神经机器翻译的软件缺陷自动修复方法
11
作者 曹鹤玲 刘昱 韩栋 《电子学报》 EI CAS CSCD 北大核心 2024年第3期945-956,共12页
循环神经网络对于代码序列数据有着良好的处理能力,软件缺陷修复的补丁生成模型大多采用循环神经网络实现.然而,基于循环神经网络的补丁生成模型在处理代码序列中长距离依赖问题时仍然具有局限性,其修复成功率和修复效率较低.针对此问题... 循环神经网络对于代码序列数据有着良好的处理能力,软件缺陷修复的补丁生成模型大多采用循环神经网络实现.然而,基于循环神经网络的补丁生成模型在处理代码序列中长距离依赖问题时仍然具有局限性,其修复成功率和修复效率较低.针对此问题,提出一种基于自注意力神经机器翻译的软件缺陷自动修复方法(Self-attention Neural machine translation based automatic software Repair,SNRepair).首先,为有效缓解源码中的未登录词问题,对数据集引入子词切分技术进行预处理;其次,为解决源代码中棘手的长距离依赖问题并更充分地利用局部信息,构建融合局部建模的Transformer程序补丁生成模型;然后,采用缺陷自动定位技术定位缺陷语句位置,利用参数优化后的Transformer补丁生成模型生成候选补丁;最后,运行测试用例验证候选补丁.在具有395个真实Java软件缺陷的Defects4J缺陷库上实验评估,结果表明SNRepair方法与对比方法比较,修复成功率和修复效率更高. 展开更多
关键词 软件缺陷自动修复 神经机器翻译 自注意力机制 子词切分 局部建模
下载PDF
基于多模态融合和自适应剪枝Transformer的脑肿瘤图像分割算法 被引量:1
12
作者 姚宗亮 黄荣 +2 位作者 董爱华 韩芳 王青云 《宁夏大学学报(自然科学版)》 CAS 2024年第1期16-24,共9页
脑肿瘤是目前世界上最致命的肿瘤之一,所以脑肿瘤图像的自动分割在临床诊疗中变得日益重要.近年来,基于CNN和Transformer的脑肿瘤分割方法在医学图像分割领域取得了令人欣喜的成就.然而,大多数方法没有充分利用脑肿瘤多模态间的互补性... 脑肿瘤是目前世界上最致命的肿瘤之一,所以脑肿瘤图像的自动分割在临床诊疗中变得日益重要.近年来,基于CNN和Transformer的脑肿瘤分割方法在医学图像分割领域取得了令人欣喜的成就.然而,大多数方法没有充分利用脑肿瘤多模态间的互补性和差异性,并且模型中的Transformer在捕获远程依赖性的同时,忽略了其较大的计算复杂性、冗余依赖性等问题.针对此问题,提出一种基于多模态融合和自适应剪枝Transformer的脑肿瘤图像分割方法(MF-MAPT Swin UNETR),其中多模态融合模块可以充分学习性质相近的模态间信息和不同模态不同尺度的特征变化,为后续分割提供了充分的准备;基于多模态的自适应剪枝Transformer可以降低计算复杂度,对提升性能有一定的帮助,将MF-MAPT Swin UNETR模型在两个公共数据集上进行了实验验证,结果表明,该模型较最先进的方法整体具有突出的分割性能. 展开更多
关键词 脑肿瘤分割 TRANSFORMER 模态交叉连接 多尺度特征融合 token融合 自适应剪枝
下载PDF
NFT仿冒欺诈的测量与检测技术 被引量:1
13
作者 廖鹏 方滨兴 +3 位作者 刘潮歌 王志 张云涛 崔翔 《计算机学报》 EI CAS CSCD 北大核心 2024年第5期1065-1081,共17页
近年来非同质化代币(Non-Fungible Token,NFT)繁荣发展,但安全问题也日益凸显,尤其是NFT的仿冒问题.在去中心化的环境下,仿冒已有的NFT作品变得相对容易,而辨别真伪却尤其困难.本文围绕仿冒NFT的测量与仿冒检测方法的评估进行了系统深... 近年来非同质化代币(Non-Fungible Token,NFT)繁荣发展,但安全问题也日益凸显,尤其是NFT的仿冒问题.在去中心化的环境下,仿冒已有的NFT作品变得相对容易,而辨别真伪却尤其困难.本文围绕仿冒NFT的测量与仿冒检测方法的评估进行了系统深入的研究.建立了包括形式化定义、仿冒过程和仿冒特征在内的NFT仿冒威胁模型,给出了 NFT仿冒定义,分析了 NFT仿冒方式,给出了判定仿冒NFT的一般性方法.大规模采集了全球最大的NFT交易平台OpenSea上50 000个NFT项目的智能合约地址和历史交易数据,并从以太坊区块链上采集了这些NFT项目的名称、创建时间、元数据以及链下存储的NFT图像数字载体,从中选取668个交易量排名靠前的NFT项目围绕NFT仿冒问题开展了测量工作,结果表明其中95个项目被仿冒248次,交易金额超过2600万美元,足见NFT生态所面临的仿冒欺诈问题之严重.本文采用了 22种图像数据增强方法,构造了 5000个扰动较小的攻击测试样本数据集,评估了 OpenSea和知名的第三方商业检测平台Fnftf对仿冒NFT检测的鲁棒性,测试结果表明有6种图像数据增强方法构造的攻击测试样本能够轻易绕过检测,揭示了 NFT行业仿冒欺诈检测产品的脆弱性.为提高对仿冒NFT检测的鲁棒性,本文提出并实现了一种基于深度学习的NFT图像仿冒检测模型,实验表明其AUC值相较于Fnftf提升了 15.9%. 展开更多
关键词 非同质化代币 区块链 以太坊 深度学习 对抗攻击
下载PDF
基于Token编辑距离检测克隆代码 被引量:13
14
作者 张久杰 王春晖 +2 位作者 张丽萍 侯敏 刘东升 《计算机应用》 CSCD 北大核心 2015年第12期3536-3543,共8页
针对当前Type-3克隆代码检测工具较少、效率偏低等问题,提出了一种基于Token的能有效检测Type-3克隆代码的检测方法。该方法同时能有效检测Type-1和Type-2克隆代码。首先将源代码Token化得到特定代码粒度的Token串,其次将所有Token串的... 针对当前Type-3克隆代码检测工具较少、效率偏低等问题,提出了一种基于Token的能有效检测Type-3克隆代码的检测方法。该方法同时能有效检测Type-1和Type-2克隆代码。首先将源代码Token化得到特定代码粒度的Token串,其次将所有Token串的定长子串进行映射,在对映射信息进行查询的基础上,利用编辑距离算法确定克隆对,然后通过并查集算法快速构建克隆群,最终反馈克隆代码信息。实现了原型工具FClones,利用基于代码突变的框架对工具进行了评价,并与领域内较优秀的两款工具Ni Cad及Sim Cad进行了对比。实验结果表明,FClones在检测三类克隆代码时查全率均不低于95%,查准率均不低于98%,能更好地检测Type-3克隆代码。 展开更多
关键词 克隆代码 克隆检测 编辑距离 Type-3 token
下载PDF
基于模糊统计的模糊Petri网token确定方法 被引量:6
15
作者 袁杰 史海波 +2 位作者 刘昶 单玉刚 尚文利 《山东大学学报(理学版)》 CAS CSCD 北大核心 2008年第3期30-33,共4页
在模糊Petri网应用研究中,普遍存在模糊token由专家直接给出或主观假定的问题。基于这种情况,提出了通过模糊统计法来获得库所的模糊token,为成功应用模糊Petri网理论创造了条件。给出了计算模糊token的通用形式化算法。实例论证了模糊... 在模糊Petri网应用研究中,普遍存在模糊token由专家直接给出或主观假定的问题。基于这种情况,提出了通过模糊统计法来获得库所的模糊token,为成功应用模糊Petri网理论创造了条件。给出了计算模糊token的通用形式化算法。实例论证了模糊统计法在求取模糊token时的可行性与有效性。 展开更多
关键词 模糊统计 模糊 PETRI网 token(托肯)
下载PDF
多尺度卷积神经网络融合Transformer的竹材缺陷识别方法
16
作者 杨松 张锐 朱良宽 《林业工程学报》 CSCD 北大核心 2024年第5期126-133,共8页
在竹材缺陷识别的研究中,竹片形状、缺陷部位颜色深浅及裂纹大小差异都是制约模型识别准确率的关键。针对上述问题,提出一种适用于中小数据集的多尺度卷积神经网络融合Transformer的竹材缺陷识别方法,以更好地提高竹材缺陷识别的准确率... 在竹材缺陷识别的研究中,竹片形状、缺陷部位颜色深浅及裂纹大小差异都是制约模型识别准确率的关键。针对上述问题,提出一种适用于中小数据集的多尺度卷积神经网络融合Transformer的竹材缺陷识别方法,以更好地提高竹材缺陷识别的准确率。该方法在卷积神经网络的主干上进行改进,从获取不同尺度语义信息的角度出发,首先利用卷积神经网络在不同尺度的特征图上捕捉图像局部语义信息,然后将不同尺度的语义特征映射为特征符号,同时引入Sinkhorn分词器对不同阶段的卷积神经网络特征符号化以减少特征冗余,再通过Transformer对特征符号之间的关系进行建模以学习图像全局语义信息。试验结果表明,与VGG16、ResNet50、DenseNet121、ViT这4种深度学习模型相比,基于多尺度卷积神经网络融合Transformer的方法能够更高效地提高竹材缺陷识别模型的性能,在竹材缺陷图像数据集上的平均识别准确率达到了99.13%。该方法识别速度更快、精度更高,且具有良好的鲁棒性,为竹材缺陷的实时自动识别提供了新思路,同时也验证了所提出方法的有效性。 展开更多
关键词 竹材缺陷识别 多尺度 卷积神经网络 TRANSFORMER Sinkhorn分词器
下载PDF
基于RFieldbus的Token-Passing协议实时性能建模 被引量:4
17
作者 侯维岩 费敏锐 +1 位作者 汪敏 陈伯时 《系统仿真学报》 EI CAS CSCD 北大核心 2005年第2期296-299,共4页
RFieldbus 无线现场总线的 MAC 协议 Token Passing 可看成是一个多台多队列排队系统。在分析了 TTR(令牌目的循环时间)对 RFieldbus 中 3 个优先级队列的服务时间的动态限制后,多台单队列排队模型 RF-P 被提出。对从站的轮巡交换数据... RFieldbus 无线现场总线的 MAC 协议 Token Passing 可看成是一个多台多队列排队系统。在分析了 TTR(令牌目的循环时间)对 RFieldbus 中 3 个优先级队列的服务时间的动态限制后,多台单队列排队模型 RF-P 被提出。对从站的轮巡交换数据任务被转化为RF-P 中的令牌内走步时间,原有的高、低级别两个队列则化成了两个具有不同 Poisson 到达率的 M/G/1/∞服务台。利用排队论中的准守恒 PCL 定律,在将服务时间限制转换为数量限制后,求出了等待响应时间的数学解析式。与试验结果的比较表明,在负载不大于 60%时其偏差度约在 10-20%间。 展开更多
关键词 token Passing协议 多台单队列排队模型 实时性能 准守恒PCL定律
下载PDF
一种基于Token匹配的中文数据清洗方法 被引量:7
18
作者 刘嘉 张璟 李军怀 《计算机应用与软件》 CSCD 2009年第11期43-45,53,共4页
拼写错误和缩写问题是中文数据清洗的核心问题,目前相关研究还很欠缺。提出了一种基于Token匹配的中文数据清洗方法,将中文字符串转换成拼音字符串,采用Token匹配算法检测处理中文数据中的"脏数据"。实验表明,提出的方法能够... 拼写错误和缩写问题是中文数据清洗的核心问题,目前相关研究还很欠缺。提出了一种基于Token匹配的中文数据清洗方法,将中文字符串转换成拼音字符串,采用Token匹配算法检测处理中文数据中的"脏数据"。实验表明,提出的方法能够有效地提高数据的准确度,大大减少了人工工作量。 展开更多
关键词 中文数据清洗 token 拼写错误 缩写
下载PDF
局部加全局视角遮挡人脸表情识别方法
19
作者 南亚会 华庆一 《计算机工程与应用》 CSCD 北大核心 2024年第13期180-189,共10页
实际场景中各种遮挡增加了表情识别难度。为此,提出一种滑块局部加权卷积注意力和全局注意力池化的视觉Transformer结合的方法来解决遮挡问题。利用主干网络提取表情特征图,将表情特征图裁剪成多个区域块,利用局部Patch注意力单元通过... 实际场景中各种遮挡增加了表情识别难度。为此,提出一种滑块局部加权卷积注意力和全局注意力池化的视觉Transformer结合的方法来解决遮挡问题。利用主干网络提取表情特征图,将表情特征图裁剪成多个区域块,利用局部Patch注意力单元通过自适应计算局部特征的注意力权重来感知被遮挡的区域,提取表情局部特征。同时,表情特征图转换成Patch块,通过Patch级和Token级注意力池化的视觉Transformer,从全局角度捕获Patch块之间的相互作用和相关性。引导模型强调最具区别性的特征,而忽略遮挡减少不相关特征的影响。在三个表情数据集及其遮挡子集和一个遮挡数据集上进行实验,结果表明所提模型在遮挡表情识别上优于现有方法。 展开更多
关键词 遮挡人脸表情识别 滑块局部卷积注意力 Patch注意力池化 token注意力池化 vision Transformer
下载PDF
从ChatGPT到Sora发展中的术语问题 被引量:7
20
作者 冯志伟 《中国科技术语》 2024年第2期88-92,共5页
在从ChatGPT到Sora的发展过程中,出现了不少新术语。这些术语,有的被翻译为中文,有的一直使用英文原文。文章在分析这些新术语的相关技术、概念的基础上,探讨如何为其翻译或者赋予适当的中文名称。并指出大量科技新术语不能够及时、高... 在从ChatGPT到Sora的发展过程中,出现了不少新术语。这些术语,有的被翻译为中文,有的一直使用英文原文。文章在分析这些新术语的相关技术、概念的基础上,探讨如何为其翻译或者赋予适当的中文名称。并指出大量科技新术语不能够及时、高效地被本土化,这对我国的术语规范化工作提出了新的挑战,期望学界共同关注这一问题。 展开更多
关键词 人工智能 ChatGPT SORA TRANSFORMER token scaling law
下载PDF
上一页 1 2 70 下一页 到第
使用帮助 返回顶部