期刊文献+
共找到38篇文章
< 1 2 >
每页显示 20 50 100
Design of area and power efficient Radix-4 DIT FFT butterfly unit using floating point fused arithmetic 被引量:2
1
作者 Prabhu E Mangalam H Karthick S 《Journal of Central South University》 SCIE EI CAS CSCD 2016年第7期1669-1681,共13页
In this work, power efficient butterfly unit based FFT architecture is presented. The butterfly unit is designed using floating-point fused arithmetic units. The fused arithmetic units include two-term dot product uni... In this work, power efficient butterfly unit based FFT architecture is presented. The butterfly unit is designed using floating-point fused arithmetic units. The fused arithmetic units include two-term dot product unit and add-subtract unit. In these arithmetic units, operations are performed over complex data values. A modified fused floating-point two-term dot product and an enhanced model for the Radix-4 FFT butterfly unit are proposed. The modified fused two-term dot product is designed using Radix-16 booth multiplier. Radix-16 booth multiplier will reduce the switching activities compared to Radix-8 booth multiplier in existing system and also will reduce the area required. The proposed architecture is implemented efficiently for Radix-4 decimation in time(DIT) FFT butterfly with the two floating-point fused arithmetic units. The proposed enhanced architecture is synthesized, implemented, placed and routed on a FPGA device using Xilinx ISE tool. It is observed that the Radix-4 DIT fused floating-point FFT butterfly requires 50.17% less space and 12.16% reduced power compared to the existing methods and the proposed enhanced model requires 49.82% less space on the FPGA device compared to the proposed design. Also, reduced power consumption is addressed by utilizing the reusability technique, which results in 11.42% of power reduction of the enhanced model compared to the proposed design. 展开更多
关键词 floating-point arithmetic floating-point fused dot product radix-16 booth multiplier radix-4 FFT butterfly fast fouriertransform decimation in time
下载PDF
基于Radix-4 Booth编码的乘法器优化设计 被引量:5
2
作者 陈海民 李峥 谢铁顿 《计算机工程》 CAS CSCD 2012年第1期233-235,共3页
传统Radix-4 Booth编码在负值部分积生成过程中会产生大量求补操作,影响乘法器的工作效率。为此,提出一种重组部分积的乘法器优化设计。通过增加一个"或"门运算以及重组硬连线,避免求补过程中的加法运算,并且未产生多余的部... 传统Radix-4 Booth编码在负值部分积生成过程中会产生大量求补操作,影响乘法器的工作效率。为此,提出一种重组部分积的乘法器优化设计。通过增加一个"或"门运算以及重组硬连线,避免求补过程中的加法运算,并且未产生多余的部分积。在32位乘法器上的验证结果表明,该设计能有效减小关键路径延迟和芯片面积消耗。 展开更多
关键词 radix-4Booth编码 乘法器 部分积 关键路径延迟 芯片面积消耗
下载PDF
一个新的基于radix-4从左到右编码的标量乘算法
3
作者 程一飞 侯整风 《微型电脑应用》 2007年第5期44-45,55,共3页
椭圆曲线标量乘是椭圆曲线密码系统中最关键、最耗时的运算,因此如何快速高效实现标量乘运算是研究的重点。目前常见的标量乘算法有:double-and-add算法,NAF算法,MOF算法等,但它们都是基于radix-2编码表示的,无论采用何种编码,倍点运算... 椭圆曲线标量乘是椭圆曲线密码系统中最关键、最耗时的运算,因此如何快速高效实现标量乘运算是研究的重点。目前常见的标量乘算法有:double-and-add算法,NAF算法,MOF算法等,但它们都是基于radix-2编码表示的,无论采用何种编码,倍点运算的次数都不变,减少的只是点加(或点减)运算的次数。提出一个基于radix-4表示的新的编码方法,并提出一个基于radix-4表示的标量乘算法,通过用四倍点运算代替倍点运算,且编码是从左到右(即从最高位向最低位)进行,编码和主计算可以合并,提高实现效率并节省内存空间。实验结果表明,该算法较经典的double-and-add算法能够提高效率30%以上。 展开更多
关键词 椭圆曲线密码系统 标量乘 radix-4表示 改进Booth算法 编码
下载PDF
基于Radix-4 Booth编码的模2^n+1乘法器设计 被引量:1
4
作者 鄢斌 李军 《通信技术》 2015年第10期1168-1173,共6页
模2n+1乘法(n=8、16)在分组密码算法中比较常见,如IDEA算法,但由于其实现逻辑复杂,往往被视为密码算法性能的瓶颈。提出了一种适用于分组密码算法运算特点的基于Radix-4Booth编码的模2n+1乘法器实现方法,其输入/输出均无需额外的转换电... 模2n+1乘法(n=8、16)在分组密码算法中比较常见,如IDEA算法,但由于其实现逻辑复杂,往往被视为密码算法性能的瓶颈。提出了一种适用于分组密码算法运算特点的基于Radix-4Booth编码的模2n+1乘法器实现方法,其输入/输出均无需额外的转换电路,并通过简化部分积生成、采用重新定义的3-2和4-2压缩器等措施以减少路径时延和硬件复杂度。比较其他同类设计,该方法具有较小的面积、时延,可有效提高分组密码算法的加解密性能。 展开更多
关键词 分组密码算法 radix-4 BOOTH编码 3—2和4-2压缩器 模2^n+1乘法
下载PDF
基于RADIX-4的Turbo码全并行译码算法 被引量:1
5
作者 赵瑞祥 潘克刚 王欣婷 《电讯技术》 北大核心 2021年第4期468-475,共8页
针对Turbo码全并行译码算法译码迭代次数多、硬件消耗大的问题,提出了一种基于RADIX-4的改进译码算法。将译码算法中状态转移图的相邻两步状态合并为一步计算,译码时以"比特对"的形式操作进行迭代。在保留译码最大并行度同时... 针对Turbo码全并行译码算法译码迭代次数多、硬件消耗大的问题,提出了一种基于RADIX-4的改进译码算法。将译码算法中状态转移图的相邻两步状态合并为一步计算,译码时以"比特对"的形式操作进行迭代。在保留译码最大并行度同时,译码计算单元使用量减少一半,显著降低了Turbo码全并行译码算法的运算复杂度和存储开销。仿真结果表明,在相同迭代次数条件下,该方法的译码性能较全并行译码算法平均提高约0.5 d B。 展开更多
关键词 TURBO码 全并行译码 radix-4 比特对
下载PDF
高性能基4快速傅里叶变换处理器的设计 被引量:11
6
作者 段小东 顾立志 《计算机工程》 CAS CSCD 北大核心 2008年第24期238-240,243,共4页
研究并设计高性能基4快速傅里叶变换(FFT)处理器。采用基4算法、流水线结构的蝶形运算单元,提高了处理速度,使芯片能在更高的时钟频率上工作。运用溢出检测状态机对每个蝶形运算单元输出的数据进行块浮点检查,确保对溢出情况进行正确判... 研究并设计高性能基4快速傅里叶变换(FFT)处理器。采用基4算法、流水线结构的蝶形运算单元,提高了处理速度,使芯片能在更高的时钟频率上工作。运用溢出检测状态机对每个蝶形运算单元输出的数据进行块浮点检查,确保对溢出情况进行正确判断。验证与性能评估结果表明,该FFT处理器具有较高性能。 展开更多
关键词 快速傅里叶变换算法 4算法 块浮点算法 蝶形运算单元
下载PDF
基于ARMv4T架构指令集的乘法器设计
7
作者 陈海民 李峥 杨先文 《计算机应用研究》 CSCD 北大核心 2011年第2期587-590,共4页
针对硬件IP核的速度和面积两大性能指标,提出了基于可变执行周期的多周期乘法器设计思想,设计出一款适用于32位嵌入式微处理器的乘法器模块。该乘法器兼容ARMv4T架构的所有乘法指令,同时引入字节判断机制,可以根据操作数的特点在2~5个... 针对硬件IP核的速度和面积两大性能指标,提出了基于可变执行周期的多周期乘法器设计思想,设计出一款适用于32位嵌入式微处理器的乘法器模块。该乘法器兼容ARMv4T架构的所有乘法指令,同时引入字节判断机制,可以根据操作数的特点在2~5个周期内执行完毕。采用Radix-4 Booth编码,只需两级压缩树进行部分积压缩。乘加运算的基址寄存器数据作为部分积进入压缩树,节约了一个单独的执行周期。实验结果表明,该设计占用芯片资源少,且结构简单高效。 展开更多
关键词 ARMv4T架构 乘法器 可变执行周期 radix-4Booth编码 4-2压缩树
下载PDF
基-4FFT处理器的优化设计与应用 被引量:1
8
作者 高博 尹若童 +1 位作者 张乙海 宋紫祎 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2022年第11期1491-1496,共6页
快速傅里叶变换(fast Fourier transform,FFT)因其高效而广泛应用于信号处理系统。文章通过分析按时间抽取的基-4FFT算法,针对1024点设计了一款5级流水线型FFT处理器。在处理器结构中每级内采用蝶形运算单元的分时复用方法降低了硬件资... 快速傅里叶变换(fast Fourier transform,FFT)因其高效而广泛应用于信号处理系统。文章通过分析按时间抽取的基-4FFT算法,针对1024点设计了一款5级流水线型FFT处理器。在处理器结构中每级内采用蝶形运算单元的分时复用方法降低了硬件资源消耗;在5级连接结构设计中采用流水线技术提高算法处理速度。该处理器采用现场可编程逻辑门阵列(field programmable gate array,FPGA)进行验证,结果表明,在50 MHz的条件下,11.9μs即可完成1024点运算,通过光电容积脉搏波检测应用验证了其正确性。 展开更多
关键词 坐标旋转数字计算(CORDIC)算法 基-4时域抽取快速傅里叶变换(FFT) 蝶形运算单元 流水线结构 分时复用
下载PDF
FPGA实现的基4FFT处理器高效排序算法研究 被引量:7
9
作者 伍万棱 邵杰 冼楚华 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2005年第2期222-226,共5页
在FFT处理器的设计中,蝶形处理部件是关系整个处理器运行速度与资源的核心部分。对于1 0 2 4点的FFT复数浮点运算,本文旨在提出一种高效的基4排序算法,该算法基于按时间抽取的基4FFT,结合了流水线和并行方式的特点,利用4个循环序列进行... 在FFT处理器的设计中,蝶形处理部件是关系整个处理器运行速度与资源的核心部分。对于1 0 2 4点的FFT复数浮点运算,本文旨在提出一种高效的基4排序算法,该算法基于按时间抽取的基4FFT,结合了流水线和并行方式的特点,利用4个循环序列进行时序控制,用3个实数乘法器实现基4蝶形的3次复数乘法,相对于传统的基4FFT算法可以节省75 %的乘法器逻辑资源。实验结果表明,用该算法设计的1 0 2 4点复数基4FFT处理器在1 0 0 MHz的主时钟频率下运算速度为5 1 .2 9μs,满足了FFT运算的高速实时性要求。由于该排序思想可以较方便地扩展到基8或基1 6,但不增加进行一次基本蝶算的时钟周期数,依然是4个,故对于高基数将具有更高的效率。 展开更多
关键词 FFT处理器 4排序算法 流水线方式 并行方式 4蝶形
下载PDF
基于FPGA的激光测距系统中基4算法的FFT研究 被引量:1
10
作者 周孟然 刘文清 +1 位作者 刘建国 魏庆农 《激光与红外》 CAS CSCD 北大核心 2005年第4期290-293,共4页
文章提出了利用可编程逻辑器件FPGA通过硬件来实现快速傅立叶变换(FFT)的基4算法,提出了采用两个蝶形运算器同时并行计算,每次蝶形运算按顺序进行的结构,将并行处理与顺序处理相结合,提高并行度和数据吞吐量,每次蝶形运算时间不超过1μs... 文章提出了利用可编程逻辑器件FPGA通过硬件来实现快速傅立叶变换(FFT)的基4算法,提出了采用两个蝶形运算器同时并行计算,每次蝶形运算按顺序进行的结构,将并行处理与顺序处理相结合,提高并行度和数据吞吐量,每次蝶形运算时间不超过1μs,完成整个256点复数FFT运算大约需要120μs左右,同时又节省资源。该方法在激光矿井提升机位置跟踪系统中应用取得了良好效果。 展开更多
关键词 激光测距 可编程逻辑器件 4算法的FFT 蝶形运算
下载PDF
基于CORDIC算法的基4DIT-FFT处理器的设计 被引量:3
11
作者 李晓彤 李欣 《现代电子技术》 北大核心 2016年第21期95-98,共4页
随着海洋开发和信息产业的发展,高速、大容量、高可靠性的水声通信系统成为研究热点。论述了一种用于水声通信系统中的基4DIT-FFT处理器的设计。该设计利用CORDIC算法优化蝶形运算单元,将复数乘法转换为硬件易于实现的加、减、移位运算... 随着海洋开发和信息产业的发展,高速、大容量、高可靠性的水声通信系统成为研究热点。论述了一种用于水声通信系统中的基4DIT-FFT处理器的设计。该设计利用CORDIC算法优化蝶形运算单元,将复数乘法转换为硬件易于实现的加、减、移位运算,并通过Matlab对伸缩系数与旋转系数进行预处理,大大加快了运算速度且降低了系统复杂性。在此基础上设计了一种1024点12位的基4DIT-FFT处理器。 展开更多
关键词 CORDIC算法 4DIT—FFT 蝶形运算单元 流水线结构
下载PDF
基于FPGA的高速基4FFT设计与实现 被引量:2
12
作者 王金川 高强 高光辉 《物联网技术》 2012年第7期38-40,44,共4页
针对实时高速信号处理要求,设计并实现了一种基于FPGA的高速流水线结构的基4FFT处理器。根据各种不同基算法的运算量、硬件面积和控制复杂度,选定按时间抽取的基4算法,同时采用单路延时反馈(Single-path Delay Feedback,SDF)流水线结构... 针对实时高速信号处理要求,设计并实现了一种基于FPGA的高速流水线结构的基4FFT处理器。根据各种不同基算法的运算量、硬件面积和控制复杂度,选定按时间抽取的基4算法,同时采用单路延时反馈(Single-path Delay Feedback,SDF)流水线结构,提高了处理速度。通过Verilog HDL语言进行模块化描述和验证,结果表明,该FFT处理器具有较高性能。 展开更多
关键词 FFT 流水线 4 蝶形运算
下载PDF
一种高性能的基-4FFT蝶形运算单元 被引量:2
13
作者 陈媚媚 朱恩 《电子工程师》 2008年第12期40-44,共5页
基于TSMC(台湾集成电路制造公司)0.18μm CMOS工艺库,设计了一种高性能的基-4FFT(快速傅里叶变换)蝶形运算单元,并对结构进行了研究和改进。结合流水线技术和并行结构的特点,利用循环序列进行时序控制,对IEEE754单精度浮点数构成的复数... 基于TSMC(台湾集成电路制造公司)0.18μm CMOS工艺库,设计了一种高性能的基-4FFT(快速傅里叶变换)蝶形运算单元,并对结构进行了研究和改进。结合流水线技术和并行结构的特点,利用循环序列进行时序控制,对IEEE754单精度浮点数构成的复数进行处理。相对于传统的基-4FFT蝶形运算单元可以节省75%的乘法器逻辑资源和72.7%的加法器逻辑资源。逻辑综合与版图综合后的报告显示核面积为1.12mm2。仿真结果表明,系统能够稳定工作在200MHz时钟下,且输出数据精度较高。本设计的速度、精度及面积均达到了设计指标。 展开更多
关键词 基-4 FFT蝶形运算 流水线结构 并行方式 循环序列
下载PDF
一款基于MVR-CORDIC的高速64点基-4FFT处理器 被引量:1
14
作者 侯卫华 郭晖 +1 位作者 刘明峰 于宗光 《电子与封装》 2008年第5期22-25,共4页
文中设计了一款64点基-4FFT处理器,用改进的CORDIC(MVR-CORDIC)处理单元代替常规FFT处理器中的复数乘法器,改进的CORDIC处理单元在保证SQNR性能下,仅用极少次数的移位加法运算即可完成一次复数乘法,缩减了完成一次基本蝶形运算的时间并... 文中设计了一款64点基-4FFT处理器,用改进的CORDIC(MVR-CORDIC)处理单元代替常规FFT处理器中的复数乘法器,改进的CORDIC处理单元在保证SQNR性能下,仅用极少次数的移位加法运算即可完成一次复数乘法,缩减了完成一次基本蝶形运算的时间并减小了面积开销。该FFT处理器结构采用两块独立的RAM,并对中间数据作"乒-乓"式存储操作以节省数据存储时间,从而提高完成一次FFT运算的速度。所设计的FFT处理器通过FPGA进行验证,结果表明平均完成一次64点FFT运算仅需要不到1μs。 展开更多
关键词 基-4蝶形单元 FFT MVR-CORDIC
下载PDF
H.264中的整数DCT及其蝶形算法 被引量:3
15
作者 孙少林 汤伟 +1 位作者 任小青 申莉华 《信息技术》 2013年第10期165-166,169,共3页
H.264是应用非常广泛的视频图像编码标准。其频域图像预处理采用的是基于4×4图像块的整数DCT。研究了如何由4×4浮点DCT得到4×4整数DCT,并设计了4×4整数DCT的蝶形算法,比较了蝶形算法与普通算法的运算量。
关键词 4×4浮点DCT 4×4整数DCT 蝶形算法
下载PDF
流水线结构FFT/IFFT处理器的设计与实现 被引量:9
16
作者 何星 张铁军 侯朝焕 《微电子学与计算机》 CSCD 北大核心 2007年第4期141-143,147,共4页
针对实时高速信号处理的要求,设计并实现了一种高效的FFT处理器。在分析了FFT算法的复杂度和硬件实现结构的基础上,处理器采用了按频率抽取的基-4算法,分级流水线以及定点运算结构。可以根据要求设置成4P点的FFT或IFFT。处理器可以对多... 针对实时高速信号处理的要求,设计并实现了一种高效的FFT处理器。在分析了FFT算法的复杂度和硬件实现结构的基础上,处理器采用了按频率抽取的基-4算法,分级流水线以及定点运算结构。可以根据要求设置成4P点的FFT或IFFT。处理器可以对多个输入序列进行连续的FFT运算,消除了数据的输入输出对延时的影响,平均每完成一次N点FFT运算仅需要N个时钟周期。整个设计基于Verilog HDL语言进行模块化设计,并在Altera公司的CycloneII器件上实现。 展开更多
关键词 FFT 流水线 基—4 蝶形运算
下载PDF
OFDM系统中傅里叶变换的硬件实现方法 被引量:1
17
作者 汤晓峰 戎蒙恬 +1 位作者 邓波 林巍 《计算机工程与应用》 CSCD 北大核心 2005年第25期106-108,111,共4页
在宽带OFDM系统中,FFT处理器是一个重要组成部分。文章介绍了一种适合OFDM系统的高效FFT处理器的VLSI设计方法,针对高效的特点采用了改进的Radix-4DIT算法,乒乓RAM的设计思想,以及流水线结构。根据Radix-4算法的特点,在基4运算单元CU(Co... 在宽带OFDM系统中,FFT处理器是一个重要组成部分。文章介绍了一种适合OFDM系统的高效FFT处理器的VLSI设计方法,针对高效的特点采用了改进的Radix-4DIT算法,乒乓RAM的设计思想,以及流水线结构。根据Radix-4算法的特点,在基4运算单元CU(Computing Unit)设计,存取地址混序,每级迭代控制,数据对齐等方面也有一些特点。文章针对256点,36bit位长,浮点复数进行FFT运算。目前,此FFT处理器已经通过了FPGA验证,处理能力为100MSPS。 展开更多
关键词 OFDM FFR radix-4流水线
下载PDF
具有蝶型单元的FFT在FPGA上的实现 被引量:9
18
作者 淮永进 屈晓声 《微电子学》 CAS CSCD 北大核心 2008年第3期342-344,348,共4页
描述了一种使用FPGA实现FFT处理器的方法,基于按时间抽取(DIT)基-4算法,采用4组RAM并行为蝶型单元提供数据,使用交换器对数据进行重行排序。实验结果表明,该方案保证了运算正确性、运算精度和实现复杂度。提出了两种改进的设计思路及方... 描述了一种使用FPGA实现FFT处理器的方法,基于按时间抽取(DIT)基-4算法,采用4组RAM并行为蝶型单元提供数据,使用交换器对数据进行重行排序。实验结果表明,该方案保证了运算正确性、运算精度和实现复杂度。提出了两种改进的设计思路及方法,使处理器可以获得更高的处理速度。 展开更多
关键词 快速傅里叶变换 蝶型单元 基-4算法 FPGA
下载PDF
DVB-T接收系统中2k-8k FFT处理器的设计及ROM优化 被引量:1
19
作者 黄秋元 雷艳敏 李卫国 《微电子学与计算机》 CSCD 北大核心 2009年第2期16-20,共5页
结合高速、实时快速傅立叶变换的实际需求,设计并实现了一种采用多级级联的同步流水线结构、基于SRAM、SDF(single-path delay feedback)、DIF等结构与方法的2k与8k共享硬件结构的变模FFT处理器.2k/8kFFT处理分解为5/6级基4蝶形单元与1... 结合高速、实时快速傅立叶变换的实际需求,设计并实现了一种采用多级级联的同步流水线结构、基于SRAM、SDF(single-path delay feedback)、DIF等结构与方法的2k与8k共享硬件结构的变模FFT处理器.2k/8kFFT处理分解为5/6级基4蝶形单元与1级基2蝶形单元的级联,并对存储旋转因子的ROM面积进行了最优化处理.本FFT处理器整体划分为多个模块,RTL电路全部采用Verilog HDL硬件语言描述,并对其进行了功能一致性仿真验证及RTL综合. 展开更多
关键词 DVB-T FFT 旋转因子 ROM radix-4
下载PDF
基于FPGA的高速FFT处理器的设计与实现 被引量:5
20
作者 满峰 汶德胜 朱家佳 《科学技术与工程》 2006年第17期2657-2660,2672,共5页
针对高速实时信号处理的要求,提出了4096点快速傅立叶变换(FFT)处理器在现场可编程门阵列(FPGA)中的设计与实现方法。该方法采用了按频率抽取(DIF)基4算法和6级流水线结构,每级均采用FIFO存储器实现延迟功能,和四路转接器一起共同完成... 针对高速实时信号处理的要求,提出了4096点快速傅立叶变换(FFT)处理器在现场可编程门阵列(FPGA)中的设计与实现方法。该方法采用了按频率抽取(DIF)基4算法和6级流水线结构,每级均采用FIFO存储器实现延迟功能,和四路转接器一起共同完成序列的码位抽取。为了避免数据溢出,采用块浮点结构来表示数据,节省了器件资源。实验结果表明,该方法在保证运算精度和实现复杂度的同时,提高了处理器的数据时钟频率和处理速度。 展开更多
关键词 FFT 4蝶形运算 流水线结构 FPGA
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部