[1]陈加忠 夏涛 欧阳昆 黎单 孙自龙.GPU平台上ADL算法的实现[J].计算机技术与发展,2011,(01):165-168.
 CHEN Jia-zhong,XIA Tao,OUYANG-Kun,et al.Implementation of ADL Algorithm on GPU[J].,2011,(01):165-168.
点击复制

GPU平台上ADL算法的实现()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2011年01期
页码:
165-168
栏目:
安全与防范
出版日期:
1900-01-01

文章信息/Info

Title:
Implementation of ADL Algorithm on GPU
文章编号:
1673-629X(2011)01-0165-04
作者:
陈加忠 夏涛 欧阳昆 黎单 孙自龙
华中科技大学计算机科学与技术学院
Author(s):
CHEN Jia-zhongXIA Tao OUYANG-Kun LI Dan SUN Zi-long
College of Computer Science and Technology, Huazhong University of Science and Technology
关键词:
GPU并行提升小波变换图像编码
Keywords:
GPU parallelization lifting wavelet transform image coding
分类号:
TP301.6
文献标志码:
A
摘要:
自适应方向提升小波变换(ADL)利用图像纹理特征进行变换编码,从而获得更高的编码质量,但同时也增加了计算复杂度。为了提高图像编码速率,在统一计算设备架构(CUDA)的图形处理器(GPU)上,提出一种并行实现ADL中的插值和方向变换计算的新方案,对插值部分同时采用粗粒度和细粒度的并行,即把图像数据分成若干个块进行粗粒度的并行,而对块中的每个像素点采用细粒度的并行。对变换部分中的9个变换方向采用粗粒度的并行。实验表明,在GPU上并行实现ADL变换是CPU实现的4倍左右,CPU—GPU整体架构下的ADL变换编码的速度是CPU平台下的3倍左右
Abstract:
In order to gain much better image quality, ADL ( adaptive directional lifting) wavelet transform takes use of the texture property of image to implement the transform coding at the cost of high computation complexity. Implement the interpolation and directional lifting transform of ADL in parallel on GPU (graphic processing unit) with CUDA (compute unified device architecture) to speed up the image encoding. Both fine-grained and coarse-grained granularity parallelization are used for data block and pixels respectively in interpolation, while only coarse-grained granularity is used in nine directions for transform. Experiments results show that implementation of ADL on GPU is 4 times faster than that on CPU. The total time of ADI, transform image coding on CPU-GPU framework is almost 4 times faster than on CPU

相似文献/References:

[1]张林才 张燕 王红霞.节点对等WebSpider设计与实现[J].计算机技术与发展,2010,(03):195.
 ZHANG Lin-cai,ZHANG Yan,WANG Hong-xia.Design and Realization of Peer - to - Peer Web Spider[J].,2010,(01):195.
[2]严颖 汪峥.单件生产实验系统控制及仿真的多线程实现[J].计算机技术与发展,2010,(02):197.
 YAN Ying,WANG Zheng.Multi- Thread- Based Implementation of Control and Simulation for an Experimental One - of- a - Kind Production System[J].,2010,(01):197.
[3]任参 刘少君 黄道平.一种改进的并行签密方案[J].计算机技术与发展,2010,(04):151.
 REN Shen,LIU Shao-jun,HUANG Dao-ping.An Improved Parallel Signcryption Scheme[J].,2010,(01):151.
[4]秦学勇 刘栋[].数据仓库的可扩展性研究与设计[J].计算机技术与发展,2009,(05):65.
 QIN Xue-yong,LIU Dong.Research and Design on Scalability of Data Warehouse[J].,2009,(01):65.
[5]喻家龙 姜太平 汪光阳.在GPU上基于物体空间的碰撞检测[J].计算机技术与发展,2009,(09):83.
 YU Jia-long,JIANG Tai-ping,WANG Guang-yang.Object- Space Collision Detection on Programmable Graphics Hardware[J].,2009,(01):83.
[6]郭彦伟 王洪国 王鑫 于惠.一种基于并行策略的BP改进算法[J].计算机技术与发展,2008,(10):110.
 GUO Yan-wei,WANG Hong-guo,WANG Xin,et al.An Improved BP Algorithm Based on Parallel[J].,2008,(01):110.
[7]肖潇 李伟 沈绪榜.基于HEXBS算法的运动估计器的设计[J].计算机技术与发展,2006,(03):17.
 XIAO Xiao,LI Wei,SHEN Xu-bang.Design of Motion Estimation Circuit Based on HEXBS Algorithm[J].,2006,(01):17.
[8]韩守忠 郑诚.银行业数据仓库的性能优化方法[J].计算机技术与发展,2006,(04):196.
 HAN Shou-zhong,ZHENG Cheng.Performance Optimizing Methods of Data Warehouse about Banking[J].,2006,(01):196.
[9]赵莉 程荣.一种并行BP神经网络的动态负载平衡方案[J].计算机技术与发展,2006,(07):67.
 ZHAO Li,CHENG Rong.A Dynamic Load Balancing Scheme for Parallel Back- Propagation Neural Networks Algorithm[J].,2006,(01):67.
[10]雷珺琳 张俊峰 刘京 曹喜信.一种基于H264的改进的运动估计三步搜索算法[J].计算机技术与发展,2010,(12):5.
 LEI Jun-lin,ZHANG Jun-feng,LIU Jing,et al.An Improved Motion Estimated Three-Step Search Algorithm Based on H264[J].,2010,(01):5.

备注/Memo

备注/Memo:
部委基金“基于服务定制的智能存储系统研究”(编号略);国家自然科学基金项目(60803112,60873226)陈加忠(1970-),男,博士,副教授,CCF会员,研究方向为图像与视频处理、GPU计算与体系结构;夏涛,博士,讲师,研究方向为流媒体技术与嵌入式计算
更新日期/Last Update: 1900-01-01