高速数字信号处理技术
以DSP为核心的信息处理技术
高速数字信号处理技术是以DSP为核心,具有高速,实时的特点的一种信息处理技术。其本质是信息的变换和提取。
信号处理
信号处理的本质是信息的变换和提取,是将信息从各种噪声、干扰的环境中提取出来,并变换为一种便于为人或机器所使用的形式。从某种意义上说,信号处理类似于“沙里淘金”的过程:它并不能增加信息量(即不能增加金子的含量),但是可以把信息(即金子)从各种噪声、干扰的环境中(即散落在沙子中)提取出来,变换成可以利用的形式(如金条等)。如果不进行这样的变换,信息虽然存在,但却是无法利用的,这正如散落在沙中的金子无法直接利用一样。
高速实时信号处理是信号处理中的一个特殊分支。它的主要特点是高速处理和实时处理,被广泛应用在工业和军事的关键领域,如对雷达信号的处理、对通信基站信号的处理等。高速实时信号处理技术除了核心的高速DSP技术外,还包括很多外围技术,如ADC、DAC等外围器件技术、系统总线技术等。
DSP技术
DSP的概念
DSP(digitalsignalprocessor),即数字信号处理器,是一种专用于数字信号处理的可编程芯片。它的主要特点是:
①高度的实时性,运行时间可以预测;
②Harvard体系结构,指令和数据总线分开(有别于冯·诺依曼结构);
RISC指令集,指令时间可以预测;
④特殊的体系结构,适合于运算密集的应用场合;
⑤内部硬件乘法器,乘法运算时间短、速度快;
⑥高度的集成性,带有多种存储器接口和IO互联接口;
⑦普遍带有DMA通道控制器,保证数据传输和计算处理并行工作;
⑧低功耗,适合嵌入式系统应用。
DSP有多种分类方式。其中按照数据类型分类,DSP被分为定点处理器(如ADI的ADSP218x/9x/BF5xx、TI的TMS320C62/C64)和浮点处理器(如ADI的SHARC/TigerSHARC系统、TI的TMS320C67)。
雷达信号处理系统对DSP的要求很高,通常是使用32bit的高端DSP;而且浮点DSP更能满足雷达信号大动态范围的要求。
DSP和其他处理器的比较
在高性能嵌入系统/实时信号处理领域,占统治地位的处理器是DSP;而诸如MCU(微控制器)、GPP/RISC(通用处理器)、FPGA、ASIC等都在分享这一市场。它们在性能、价格、开发难度、功耗等等方面有着不同的特点,因此各自适合不同的市场领域。表1对它们的特点进行比较。
其中,GPP和MCU和DSP一样都可以通过高层语进行编程;而FPGA则需要硬件描述语言进行开发设计;ASIC则属于功能定制产品。它们和DSP有着很大区别,主要在于GPP多用于通用计算机,内部采用冯·诺依曼结构,只有处理内核没有DMA控制器,没有丰富的IO设备接口,不适合实时处理,而且功率很大,如Intel的CPU的功耗多在20~100W左右,PowerPC的功耗最小也要5~10W,而且DSP可以做到1~2W。而MCU主要用于嵌入式系统的控制,没有计算和处理能力。就信号处理能力而言,DSP最适合信号处理的前端,GPP/RISC处理器比较适合复杂算法或者混合信号处理与数据处理的场合。
DSP的发展和趋势
1982年TI公司推出了世界上第一款成功商用的DSP-TMS320C10。在上世纪90年代,DSP技术有很大的发展,出现了几款典型的DSP,主要有ADI公司的ADSP2106x/ADSP21160和TI公司的TMS320C62x/C67x。ADI的DSP具有出色的浮点处理能力,多用于雷达/声纳等信号处理;独特的多DSP互联能力(总线直接互联和Link口互联),使它们被称为“多DSP系统的实现标准”。而TI公司的DSP则更注重单片的处理能力,在民用高端DSP市场占有很大份额。
进入21世纪,DSP在各方面性能都有了飞跃。ADI公司推出TigerSHARC系列,TS101主频达到300MHz,已经得到大量的应用;2003年推出最新的TS201,主频达到600MHz,处理能力为3.6GFLOPS,是当前处理能力最强的浮点DSP之一。TI公司则推出了C64系列,2004年初已经公布了1GHz的TMS320C6416的技术是少数突破1GHz的DSP之一,定点处理能力达到8000MIPS。TS201和1GHzC64都仍处于工程样品阶段,ADI公司预计在2004年8月正式量产TS201。
DSP的发展趋势是向速度更快、集成度更高的方向发展。DSP将会在其内部集成特殊的运算单元,以适合矩阵运算等运算密集的特殊算法。另外,光DSP(ODSP,OpticalDSP)也将成为一个新的发展热点。ODSP采用光调制矩阵进行光速级的矢量和矩阵的运算。以色列的LENSLET公司公布的ODSP原型机Enlight256,处理能力相当于1GHzC64的1000倍。
当前DSP性能状态和比较
主流DSP的技术性能
PowerPC系列虽然属于MPU,但是由于它的出色处理性能,而且低功耗(相对于Intel的CPU)等特点,使得它非常适合嵌入式的实时信号处理系统中,PowerPC处理器在国际上军用信号处理市场占有大部分市场。但由于PowerPC毕竟属于MPU,在结构上和DSP有些差异,例如它没有内部DMA控制器、IO处理器、存储器外设接口,内核在计算的同时,还需要负责读取数据,使得整个处理时间加长。因此虽然PowerPC系列有着标称值很高的指标,但是对于需要持续实时信号处理的系统并不一定都合适。下面简单给出一个TS101、C64和MPC7410的比较结论:
①TigerSHARC适合于多DSP互联、动态范围大、带宽处理量比较平均的持续实时信号处理系统;
②TMS320C64适合于动态范围不大、对DSP片间互联要求不高的持续实时信号处理系统;
③MPC7410适合于动态范围大、对DSP片间互联要求不高、带宽处理量比较小的事后数据处理系统。
外围器件
外围技术
基于DSP的高速实时信号处理系统功能框图如图《基于DSP的高速实时信号处理系统功能框图》。
外围电路可以分成几类:
①模拟信号数字信号的转换电路,ADC、DAC、DDS等;
②用于数字信号下变频和上变频的DDC、DDU;
③缓冲和存储电路,RAM、FIFO等;
④逻辑控制和协处理器,CPLD和FPGA;
⑤通信接口电路,光纤、LVDS等。
ADC器件技术状态和趋势
ADC器件对处理系统起到关键作用,影响到系统的可实现性和系统的性能。ADC器件由其内部构造不同,可以分成串并行和全并行。前者通过多级串行的逐次比较,可以很好地提供ADC量化精度,但缺点是速率较慢;500MHz以下的ADC多是采用这种类型。后者是将输入模拟信号同时和2N个比较器比较,并行产生量化值,因此也称为FlashADC;这种ADC器件可以实现很高频率的模数转换,但是缺点是精度较低,而且功耗很大。
串并行ADC以ADI公司的AD6645为例,可以实现最大采样率105msps,14bit量化精度。全并行ADC以ATMEL公司的TS83102G0为例,可以实现最大采样率2GSPS,10bit量化精度,采用LVDS接口,功耗只有4.6W。
ADC器件发展的趋势是:
①高输入带宽、高采样速率、高量化精度;
②对外接口电平发展为LVDS等高速电平;
③低功耗、多通道集成、多功能集成。
DAC器件技术状态和趋势
DAC器件在系统中的作用和ADC相反,所以其内部结构和ADC也相反的过程。DAC的指标相对ADC要更高一些,例如ADI公司的AD736可以实现1.2GSPS的转换速率,精度为14bit,对外接口采用DDR方式的LVDS电平;而其功耗却只有0.55W。
当前DAC的发展趋势是:
①高速、高精度、低功耗;
②多功能集成,如增加滤波器;
③接口电平采用高速协议:LVDS、DDR等技术。
RAM、FIFO技术
存储器技术的技术状态是同步技术、双沿和多沿传输技术的广泛应用。
同步静态存储器成为高速、大容量SRAM中的主要力量,例如SBSRAM、ZBTSRAM等同步SRAM,时钟频率可以高达200MHz以上。另外,新型DDRSRAM、甚至QDRSRAM,可以在一个时钟周期内传输2个或者4个数据,这将大大提高SRAM的读写带宽。
而动态RAM中,由于DDR技术的应用,使得存储速率可以达到每线400Mb/s;而且由于新的芯片封装技术和制造工艺的应用,使得单片DRAM的容量越来越大,单片最大1Gbit的DDRSDRAM已经大量应用。
常用的FIFO器件仍然是高速同步FIFO,同步时钟可以达到100MHz以上。出现了DDR接口的FIFO器件,可以达到250MHz以上,大大提高了带宽。
存储器发展的主要趋势是:
①高速、大带宽:采用DDR、QDR等技术,甚至LVDS等接口电平逻辑;
②低功耗、高密度:采用更新的芯片封装和制造工艺,提高单片容量、降低功耗。
CPLD、FPGA技术
CPLD和FPGA一直是数字电路中的重要成员。传统的小规模的CPLD大多实现逻辑控制和逻辑转换的功能;而大规模的FPGA则通常实现更加复杂的算法、信号处理等工作,它们的效率往往要高于DSP很多。
FPGA的技术已经达到了千万门级的水平,而且通常嵌入一些信号处理的功能模块,如DSP模块、存储器模块、Gbit串行收发模块等等;另外FPGA的另一大技术特点是FPGA的IO管脚支持越来越多的电平协议。这些技术的出现使得SOPC的系统设计大大增加。
CPLD和FPGA的重要厂商仍然是Xilinx、Altera和Lattice。它们的典型高端器件如:VirtexII/VirtexIIPro、Stratix/StratixGX、ISPGDX等器件。它们共同的特征是:
①大规模、超大规模的门数设计;
②内嵌大容量SRAM、DSP模块、硬件乘加器等资源;
③具有高速串行通信的硬件模块,如Xilinx的RocketIO可到10Gb/s。
光纤通信
光纤通信是利用光来传输信息的一种传输方式。由于光信号的特点,决定了光纤传输有很多天生的优点:
①容许频带宽,传输容量大;
②单波长光纤传输系统的传输速率一般为2.5Gb/s和10Gb/s,多模为1.0625Gb/s和1.25Gb/s;
③损耗小,中继距离很长且误码率很小,传输距离从几百米到几公里;
④抗电磁干扰性能好;
⑤无串音干扰,保密性好;
⑥光纤线径细、重量轻、柔软;
⑦光纤的原材料资源丰富,用光纤可节约金属材料;
⑧耐腐蚀力强、抗核辐射、能源消耗小。
光纤传输在很早就被用于电信系统的中继传输中,但直到最近几年才被广泛应用在嵌入式系统的数据传输中,例如FibreChannel、光纤以太网等技术。这些光纤传输技术的带宽已经可以到达10Gb/s以上。
基于低压差分电平的串行传输技术
低压差分电平协议是比较流行的一种电平形式,它具有摆幅小、抗干扰强、辐射小等优点,广泛应用于高速数字信号的传输协议中;例如LVDS协议就是满足最流行的传输协议之一,它的共模电压为1.2V,差模电压为350mV,传输速率可以达到上Gb/s。很多第三代互联技术都是以低压差分电平一些为基础,例如RAPIDIO协议、InfiniBand协议等等。
而基于低压差分电平的串行传输协议,更是将铜线传输带宽提高到一个前所未有的水平。采用了时钟打包和时钟恢复技术的串行传输协议,不用再考虑数据线和时钟线之间的skew和Jitter等问题,更容易提高传输速率,而且减少线对数量,降低实现成本。通过对信号的预加重和均衡处理,串行RapidIO协议可以支持3.125Gb/s,而Xilinx公司的RocketIO接口可以实现单线对10Gb/s的串行传输速率。这种技术已经逐步成熟,将会大量应用于板内、底板间、机箱间等大量高速数据传输的场合。
系统设计
随着处理系统规模的增大,系统设计时通常被分成多个较独立的功能模块。总线技术就是为了解决系统各模块之间的管理、控制、通信等问题而产生的。早期的系统由于功能较简单,故很多系统采用了自定义总线的方式,即用户根据自己系统的要求设计一套满足特定功能的总线。随着信号处理技术的发展,自定义总线对系统的使用和扩展带来了很大的制约,而且每个新系统的开发时间和开发成本都难以降低。
随后在DSP信号处理系统中使用标准总线系统的思路被提出,所谓标准总线系统就是满足一定工业标准或国际标准的总线(如PCI总线)。这种方式可以提供很多优点。
(1)提供DSP系统的通用、标准的扩展和互联能力。
①总线接口逻辑的统一标准;
②板卡物理尺寸和结构的统一标准;
③使DSP系统便于扩展、互联和快速构建平台。
(2)提供DSP系统方便的控制界面和用户界面。
标准总线系统的计算机平台可以通过标准总线对DSP系统进行控制、管理和设置。
(3)提供DSP板卡之间的通信、传输方式。
板卡之间通过标准总线互联,便于通信。
(4)节省开发时间、降低开发成本。
可以选择很多商用的标准总线产品(COTS)来实现用户系统。
标准总线的发展和当前技术
标准总线性能对比表,如图《标准总线性能对比表》。
工业中较为流行的标准总线有多种:ISA总线、PCI总线、cPCI总线、VME总线、PC104等。
ISA总线已经基本被淘汰。PCI总线随着PC市场的发展而迅速壮大起来,成为技术最先进、应用最广、支持最多的总线之一。但由于PCI总线标准的物理结构,限制了它在环境恶劣的工业领域尤其是军事领域中的应用。而基于PCI总线逻辑协议的cPCI总线标准,却能很好的弥补这个问题。因为cPCI总线除了机械标准外,其他都是采用PCI的标准;而机械标准是采用欧洲卡标准,具有很强的加固能力;因此cPCI总线可应用到任何恶劣环境的工业系统和军用系统中。
VME总线则是最老牌的系统总线,它是Motorola等几家大公司在80年代初提出的一种独立于DSP的总线标准,而且在机械结构方面同样也是采用了欧洲卡的标准。由于美国军方在早期大量使用基于VME标准的产品,因此VME标准总线仍是世界范围内军用系统的最大标准。
在2000年左右,工业界掀起了一场总线之争“THEBUSWAR”,主要的争论就是cPCI和VME总线谁会在未来的系统中取得绝对的地位。但是3年过去了,争论还是没有结果。在技术方面cPCI虽然领先于VME标准,但是VITA组织发起的“VME复兴”计划,也可以在一定程度上继续提高VME的带宽等性能。而且由于军方用户更多的考虑系统投入的继承性,因此他们不会轻易的放弃原有的VME总线而转向cPCI总线。反而倒是那些从事先期研究工作和开发全新项目的人员会更多的选择cPCI总线。另外,从国内的开发技术角度上分析,cPCI总线要比VME总线更容易开发和掌握。因为毕竟前者在通信业广泛应用,在国内的技术支持会更好。
毫无疑问在今后的一段时间内,PCI、cPCI、VME三种总线仍然会继续共同存在。但是它们各自都将有很大的发展。基本的发展趋势是提高传输带宽。但实现方式可能由总线形式过渡为基于点对点的交换式互联方式。例如PCI发展为PCI-Express,cPCI在原来总线标准基础上,提出扩展规范,增加交换协议(如PICMG2.16是基于以太网的扩展,PICMG2.18是基于RapidIO协议的扩展);另外PICMG组织在2002年提出的ATCA标准,将完全抛弃总线形式的互联,转向交换式互联技术。VME标准管理组织VITA提出的VME复兴计划中,也采用了交换式互联技术补充或者替代现有的VME64x总线(如VITA41、VITA46标准)。
发展及应用
嵌入式并行DSP处理系统技术的发展
MIMP并行DSP体系的结构图, 如图《MIMP并行DSP体系的结构图》。
嵌入式信号处理系统已经发展了很多年,期间经历了3个过程。
最初的系统采用完全定制的功能设计,根据算法确定硬件系统的结构和实现方法;这种系统往往效率很高、实时性好,但灵活性很差,不易扩展和通用。
上世纪80年代后期,随着DSP、FPGA等可编程器件技术的发展,系统的并行性和灵活性开始受到重视。期间出现了很多细粒度的脉动阵列(systolic)结构、wavefront结构处理系统和粗粒度的多处理器等系统。它们的灵活性、可编程性有很大提高,但是在可扩展性方面比较差。
到90年代后期,雷达系统向多功能、多模式的方向发展,雷达处理系统的设计思想也发生了改变,人们开始探讨研制通用数字信号处理系统的可能性,并提出了“软件雷达”的概念。新一代的雷达信号处理系统希望具有标准化、可扩展、可重构的特点,系统的各个功能单元可以统一由通用的模块承担,通过软件编程,或者简单的硬件扩展,能够进行快速的系统重构,适应不同雷达体制下的信号处理任务。这无疑可以大大缩短系统的开发周期,节省研制经费。该思路的发展方向是采用COTS产品构建高性能的嵌入式并行DSP处理系统,最早期代表系统是LockheedMartin公司的HPSC(highperformancescalablecomputingsystem)系统。
所谓COTS(commercialoff-theshelf)产品通常是指具有一定独立功能、具有标准的总线协议和接口形式的模块化电路产品。它不是针对某种应用开发的,而是作为一个公司的通用产品出现。国际上有很多公司都专门从事COTS产品的开始和生产工作,而且有很多公司专门从事基于COTS产品的嵌入式系统集成工作,如Mercury,RadStone等等。这种设计思路和产品已经成为国外军用处理系统的主流方式。
北京理工大学雷达技术研究所在近20年的实时信号处理研究的基础上,设计出了一套标准化、模块化、可扩展、可重构的雷达数字信号处理系统。该系统采用了一种多层次互联、混合并行模式的并行dsp架构——MIMP(multi-layerinterconnection、mixingparallelprocessing)结构。该系统参考了COTS产品设计思想,采用先进的总线技术和互联技术以及DSP技术,构建了一个适合雷达信号处理的硬件平台,可以用于快速构建功能复杂的雷达处理系统。
基于标准技术的COTS产品设计和开发
上述标准化、模块化、可扩展、可重构的雷达数字信号处理系统在技术上的特点是:
①采用标准cPCI总线作为基本互联方式;
②采用ADI公司的Link口作为高速实时互联协议;
③采用自定义的高精度定时同步网络作为整体系统的统一的同步控制;
④采用6UcPCI板卡和PMC子板两种标准的物理接口形式;
⑤处理节点基本采用ADI的SHARC和TigerSHARC系列DSP,以及大规模FPGA;
⑥并行方式采用共享存储器方式和基于消息传递方式的结合;
⑦采用标准的商用cPCI机箱作为实现平台,使用不同功能的COTS产品实现不同系统。
该系统的COTS产品主要分为几种功能类型:
(1)处理单元,如通用ADSP21160处理板、通用TigerSHARC处理板等;
(2)IO单元,如100MHzADCPMC板,500MHzADCPMC板,光纤接口PMC板等;
(3)特殊功能单元,如定时同步PMC板,海量电存储板等。
基于COTS产品的系统构建方案
下面以某机载SAR实时成像系统为例,说明这种基于COTS产品构建系统的具体方法。
(1)系统功能指标分析。
该机载SAR系统指标如下:
①工作模式:正侧视条带成像;
②分辨力:1m×1m(详查),3m×3m(普查);
③成像区宽度:1km(详查),3km(普查);
④最大作用距离:20km。
根据上述功能要求和技术指标,先分析系统采用的算法和处理流程,然后估计出系统的处理量和处理粒度,以确定处理单元的选择。然后根据系统对外接口的要求,选择IO单元的类型和指标。
(2)COTS产品选择。
根据上述指标具体分析之后,得到本处理系统的硬件结构如下:
①DSP处理板:6块通用ADSP21160处理板,总处理能力120亿浮点处理/s(6UcPCI);
②双通道500MHz高速ADC板卡(6UcPCI);
③ADC数据输入接口板(PMC);
④图像结果输出接口板(外购)(PMC);
⑤上位机主控单元(CPU板)(外购);
⑥8槽标准6UcPCI机箱:1个CPU板、1个ADC板、6个DSP板。
在选择COTS产品时,可以通过外购其他公司的标准COTS产品来弥补一些功能的缺陷。
(3)系统的实现。
采用上述硬件资源,在标准cPCI平台上实现互联,就可以实现该SAR实时成像系统的硬件平台
参考资料
最新修订时间:2022-07-25 12:09
目录
概述
信号处理
参考资料