电子工程师的网站
首 页 |  新闻资讯 | 最新产品 | 解决方案 | 技术参数
设计应用
电路图 | 技术资料 | 芯片资料 | 技术论坛
  现在位置: 首页 > 设计应用 > 嵌入式系统/ARM技术 > 详细信息
嵌入式系统/ARM技术:关于嵌入式多媒体应用中的片上存储器分配
来源:   时间: 2008-1-28 2:32:42    
   引言

  随着CPU速度的迅速提高,CPU与片外存储器的速度差异越来越大,匹配CPU与外部存储器的方法通常是采用Cache或者片上存储器。微处理器中片上存储器结构通常包含指令Cache ,数据Cache 或者片上存储器。对于嵌入式设备上的数据密集的应用,数据Cache 与片上存储器相比存在以下缺陷:(1) 片上存储器是固定的单周期访问,可在设计时而不是运行时研究数据访问模式;而Cache还要考虑击不中的情况,因而有可变的数据访问时间,执行时间的预测更加困难。(2) 使用Cache 执行时间的不可预测性影响编译器的优化;(3) 细颗粒的Cache 对于图像编码等的规则数据访问并不合适,因而使用Cache 对于嵌入式设备可能不是最优的。文指出,对于大多数应用,使用片上存储器比使用数据Cache能量平均大约节省40 % ,芯片面积与时间的乘积仅为Cache的46%。因而对于嵌入式多媒体处理器,片上RAM作为数据Cache的替代,功耗更低。片上存储器的有效使用对于提高嵌入式应用的速度,降低功耗具有重要的意义。

  文讨论了在同时具有数据Cache和片上SRAM的处理器上标量和矩阵变量的存储器分配方法。文以摩托罗拉公司的DSP56000为平台,文以AMS Gepard DSP为平台,分别讨论了如何把数据分配到X/Y数据存储器块,以便最大限度地利用数据移动的并行性。DSP56000片上X、Y数据存储器都是单端口的,并且容量较小。与DSP56000不同,TI公司的TMS320C55x具有更多的数据总线,片上RAM容量更大,且分块多,具有访问能力更强的DARAM。

  TMS320C55x具有极低的功耗(0.05mW/MIPS) ,非常适合手持设备,现在已经集成至TI 公司专门针对3G手机的高性能多媒体处理器上。C55x 片上除了24K字节的指令Cache外,还有64K字节的双端口存储器(DARAM),96K字节的单端口存储器(SARAM)。DARAM和SARAM总共160K字节,分成20个块,每个块8K字节。本文以C55x的视频编码器为例,讨论片上存储器的有效使用。

  数据的片外、片上动态分配

  因为片上存储器比片外存储器具有更高的数据访问能力和更小的访问功耗,所以尽可能分配数据到片上存储器,未能分配到片上的数据可在CPU处理前转移到片上,已经转移到片上的数据,应尽可能在片上保存直到其生命期结束,以便尽可能减少数据从片外存储器到片上存储器的数据转移。在视频编码等应用中,标量、常数相对于矩阵而言,通常数量较少,可以分配到片上;若分配到片外,在运算时直接存取片外数据,CPU流水线将会停滞。直接存储器存取(DMA)可以在存储器之间,存储器与外设之间转移数据,除了DMA通道参数初始化以外,DMA转移数据和CPU处理数据可以并行进行。设置DMA通道参数需要一定的时间,采用DMA来转移单个变量或常数的开销可能比直接存取更大,因此DMA适合转移具有较多数据的矩阵,并不适合片外标量的转移。包含大量元素的矩阵可以分配到片外,处理前使用DMA转移到片上存储器。

  局部变量由编译器分配到软件栈上,C55x具有两个软件栈:数据栈和系统栈。C55x的栈有三种工作模式,可设置成双16比特快返回模式,以减少栈所占的存储器空间,并提高其运行速度。数据栈和系统栈在函数调用及返回时同时访问,可将这两个栈分配到DARAM块或者不同的SARAM块内。

  本文中数据存储器的分配,强调从实际多媒体应用处理的基本数据块出发,分析简单直观。多媒体算法总是将原始输入数据分成一定大小的块进行处理,并产生对应该输入的最后输出。如果片上没有足够的存储器,大量的输入数据和最后结果仅能可存储在片外。对于元素较多的矩阵,可以根据算法特征将矩阵分成若干数据子块,如H.263编码器中的宏块,搜索窗等,或者单纯根据可得到的片上存储器数量分成适当大小的子块逐个运算,然后分析数据子块的生命期和使用频率。我们定义数据子块的生命期为首次使用到最后一次使用之间的间隔,而通常变量的生命期为定义到最后使用之间的间隔,例如定义整型数组int MB[384],用来存储待编码宏块的数据,图像的某个宏块的数据在该宏块编码结束后,该宏块数据的生命期也就结束,然后该数组用来存储下一宏块的数据,因而变量的生命期远比存储在该变量中的某一具体数据生命期要长。若数据子块具有不相交的生命期,则可以共享相同的片上存储器。

  很多数据子块在运算中多次使用,可在首次运算前转移到片上,并尽可能保存到生命期结束,即直到这些数据不再使用为止,因而这些数据仅需要一次转移。将程序执行时间看成是由很多连续的时间间隔组成的,若在下个时间间隔内需要转移新的数据到片上供CPU处理,而片上又没有足够的存储器存储这些数据,这时将随后需要连续频繁使用的数据保留到片上;对于随后较少使用的数据,若片外存储器还保存有该数据的备份,这些数据可直接覆盖,等到下次使用时再从片外存储器拷贝到片上;否则,在覆盖前将数据转移到片外。在片上分配一定的缓冲区,用来存储需要再次使用的数据,可有效地减少片外存储器的访问。对于中间结果,尽量在使用前分阶段计算,使用后释放,以缩减存储中间结果的存储器需求。通过数据的这种动态分配,既可以减少或避免访问片外慢速存储器所引起的指令延迟,又可以减少片外到片上的数据转移。

  在H.263视频编码器中,编码是按宏块顺序进行的,INTRA宏块编码仅需要当前的编码宏块数据,INTER宏块编码还需要以当前宏块为中心的重建图像搜索窗。因此根据算法特征将整帧输入图像划分成宏块,某个宏块数据在编码前转移到片上,这一宏块编码结束后就不再使用,这部分片上存储器就可释放,用来存储下一宏块数据。若在编码的同时采用DMA转移下一个宏块,这需要在片上分配两个宏块的存储器空间,用来存储编码的原始图像。

  在进行INTER帧编码时,运动搜索需要使用前一帧的重建图像作为参考,设搜索范围为[-16,+16],编码该宏块需要搜索参考图像中以编码宏块位置为中心的9个宏块,即前一帧中宏块(x,y) 的的重建图像直到编码(x+1,y+1)宏块后生命期才结束。以CIF分辨率为例,不可能把一帧图像的所有重建宏块保存到生命期结束,因而部分重建图像必需暂时存储在片外,若在编码(x-1,y-1) 前将重建宏块(x,y)拷贝到片上并一直保存到编码(x+1,y+1) 宏块结束,只需要在片上分配将近3个GOB的空间用来存储参考图像,就可以保证每个宏块的重建图像数据只需要一次片外到片上的转移。

相关信息
发表评论
打印本页 关闭本页
泰克推出业内首个手持式RF干扰查找工具
    泰克公司日前宣布,在其NetTek系列中增加最新产品-RF Scout干扰查找器。据称,这一产品在一个坚固耐用的手持式平台中为查找RF干扰、检查信号质量提供了所有必要的工具,使得网络性能规划和优化团队能够在随时可以用于现场的工具中,探索、发现、分析和存档干扰或其它信号质量问题。   转向速度更高的无线数据业务的发展趋势,正推动着对更干净的RF信号的需求,因为高速数据速率依...
>>详细内容
高性能射频调制器促成多载波通信发送器设计(上)
    蜂窝发送器的设计依赖于能够保持高线性度和高动态范围的高性能RF调制器。随着多载波发送器的增长,RF调制器必须保持低噪声基底,从而提供较高的性能指标,这通常取决于二阶或三阶互调。本文讨论了这些需求,并说明MAX2022能够满足典型四载波WCDMA发送架构的要求。 概述   现有的蜂窝基站大多采用超外差结构发送或接收射频信号。这种结构需要两次变频或更多的上、下变频级、中间滤...
>>详细内容
高性能射频调制器促成多载波通信发送器设计(下)
    蜂窝发送器的设计依赖于能够保持高线性度和高动态范围的高性能RF调制器。随着多载波发送器的增长,RF调制器必须保持低噪声基底,从而提供较高的性能指标,这通常取决于二阶或三阶互调。本文讨论了这些需求,并说明MAX2022能够满足典型四载波WCDMA发送架构的要求。 工作在UMTS波段的多载波WCDMA   多项性能指标综合体现出的优势在于多载波的互调特性。从本文可以看出,MAX2022能够...
>>详细内容
CSR蓝牙技术帮助诺基亚推出高性能蓝牙耳机
    目前已经上市的新款诺基亚蓝牙耳机BH-200采用了CSR公司的BlueCore3-Audio Flash (BlueCore3-AF),其语音通讯完全符合蓝牙v1.2技术规范。诺基亚蓝牙耳机BH-200是采用HFP1.5免提协议的第一款耳机,也是诺基亚公司采用CSR BlueCore技术并且已经上市的高端无线耳机系列之一。   诺基亚蓝牙耳机BH-200仅重14克,尺寸为49x22x21毫米,支持5小时30分钟通话时间及150小时待机时间。该款耳...
>>详细内容
PC-ISDN的接口设计
    摘要:提出了PC与基本速率ISDN连接的软硬件设计方案。介绍了基于PC总线、80C188微处理器、Mitel公司的ISDN通信器件以及IDT公司的EPLD逻辑硬件的ISDN卡的硬件结构,同时对软件的结构、任务和模块以及实现方案也作了说明。   关键词:PC-ISDN   ISDN 数据通信 Intel 80C188   1 系统设计考虑  计算机的普及及促进了远程通信的发展。然而1M字节大小的文件经过目前最快的V.34  ...
>>详细内容
德州仪器 Aureus™ 数字音频解决方案
  德州仪器Aureus™数字音频解决方案助力哈曼卡顿、安桥与雅马哈家庭娱乐新品获奖的音频DSP帮助OEM厂商为客户实现精彩特性。   日前,德州仪器(TI)宣布三家领先的音视频(A/V)接收机制造商(哈曼卡顿、安桥与雅马哈)已采用获奖的Aureus™系列高性能音频DSP产品,并应用在多款新一代A/V接收机与数字媒体中心产品中,从而为创新型家庭娱乐应用带来质量出众的音频体验。   TI高性...
>>详细内容
已有(
)位对此新闻感兴趣的网发发表了看法 >>更多评论
内 容:
     
 
热点新闻
一周排行
关于我们 | 服务项目 | 付款方式 | 广告服务 | 联系我们 | 友情链接 | 投诉 建议 合作 | 网站地图 | 加入收藏
Copyright © 2007-2008 WEEQOO.COM Corp.All Rights Reserved. 版权所有 经营许可证编号:浙B2-20050339 法律声明
维库电子旗下网站:维库电子市场网 | ChinaICMart | 维库电子开发网 | 维库电子人才网
总部:杭州市下城区朝晖路182号国都发展大厦1号楼80A
电话:0571-85889139-8007 QQ:303939539 | MSN:zh1226@hotmail.com |  邮箱:laz8258@163.com dzsc51@163.com