心中有不少心得体会时,不如来好好地做个总结,写一篇心得体会,如此可以一直更新迭代自己的想法。那么我们写心得体会要注意的内容有什么呢?接下来我就给大家介绍一下如何才能写好一篇心得体会吧,我们一起来看一看吧。
数字图像处理心得体会篇一
课程英文译名:digital image processing 适用专业:空间信息工程、摄影测量与遥感全日制本科一、一、课程性质、目的和任务:
本课程是空间信息工程系、摄影测量与遥感系开设的必修的专业基础课之一。
通过本课程的学习,要求学生掌握有关数字图像处理的基本概念、方法、原理及应用,培养和增强学生数字图像处理技能的创新意识和创新思维,提高实际动手能力和创新能力,为学生进一步学习数字摄影测量、遥感和地理信息系统等专业课程奠定基础。二、二、课程教学的基本要求:
2.掌握空间滤波的卷积算法、几何校正和灰度内插法等;
3.了解图像复原与重建、数据压缩、模板匹配、分类、图像处理与分析的发展趋势。
三、三、课程内容的重点和难点
1.重点内容:
主要是数字图像处理的基本概念和算法。具体包括:数字图像与图像数字化的概念;灰度直方图;图像处理算法形式;傅立叶变换、图像空间域、频率域增强;图像分割的边缘检测;纹理分析;二值图像处理与分析等。
2.难点
傅立叶变换、频率域图像增强与恢复、边缘跟踪、纹理的灰度共生矩阵分析法等。
四、四、本课程与其他课程之间的联系与分工
本课程的数学基础是建立在高等数学、离散数学、线性代数、概率论与数理统计等课程之上;光学、摄影学与计算机应用是学习和掌握该课程的重要基础知识;该课程是为数字摄影测量、遥感、地理信息系统、计算机视觉等课程服务;模式识别、图像理解是该课程内容的深入发展;与计算机图形学相互渗透、补充。在学习数字摄影测量、遥感、模式识别、图像理解和计算机视觉等课程之前,应先修该基础课程。
五、五、各教学实践环节的主要内容
本课程教学时数为52学时,课堂教学52学时,课外实习3次共6学时。实习内容如下:
实习一 编写统计影像灰度直方图的程序
教材:贾永红编著《计算机图像处理与分析》武汉大学出版社
参考书:1.荆仁杰等 《计算机图像处理技术》浙江大学出版社
2.容观澳
《计算机图像处理》清华大学出版社七、七、课程内容及安排
第一章 绪论(2学时)1.1数字图像处理的概念
1.2数字图像处理的内容和特点 1.3数字图像处理的应用
第三章 图像变换(4学时)
3.1图像变换的预备知识
3.2付立叶变换及其性质
第六章 图像压缩(3学时)6.1概述
6.2图像保真度准则 6.3统计编码方法 6.4图像压缩的标准
第七章 图像分割(10学时)7.1边缘检测 7.2 边缘跟踪
7.3 hough变换检测直线 7.4区域分割 7.5区域增长
第八章 二值图像处理(7学时)8.1二值图像的连接性和距离
8.2连接成分的变形操作 8.3图形的形状分析
第九章 纹理分析(6学时)9.1概述
第十章 模板匹配(1学时)
数字图像处理心得体会篇二
姓名:黄冬芬
学号:070212051
班级:12级通信工程1班
数字图像是我们生活中接触最多的图像种类,他伴随人们的生活、学习、工作,并在军事、工业和医学方面发挥着极大地作用,可谓随处可见,尤其在生活方面作为学生的我们,会在外出旅游,生活和工作中拆下许多数字照片,现在已进入信息化时代,图片作为信息的重要载体,在信息传输方面有着不可替代的作用,并且近年来图像处理领域,数字图像处理技术取得了飞速的发展,作为计算机类专业的大学生更加有必要对数字图像处理技术有一定的掌握,而大多数人对于数字图像的知识也很模糊,比如各类繁多的各种图像格式之间的特点,不同的情况该用何种图像格式,还有关于图像的一些基本术语也不甚了解。尤为重要的是一些由于拍摄问题导致的令人不甚满意的照片该如何处理,或者如何对一些照片进行处理实现特殊的表现效果。所以对于数字图像处理这门课大家有着极大地兴趣。我们班有的同学学过photoshop软件,因此对于数字图像处理有了一些基础,更加想利用这门课的学习加深自己数字图像处理的理解并提高在数字图像处理方面的能力。
通过这8周的学习,我们虽然还没有完全掌握数字图像处理技术,但是收获不少,对于数字图像方面的知识有了更深的了解。更加理解了数字图像处理的本质,即是一些数字矩阵,但灰度图像和彩色图像的矩阵形式是不同的。对于一些耳熟能详的数字图像相关的术语有了明确的认识,比如,常见的像素(衡量图像的大小)、分辨率(衡量图像的清晰程度)、位图(放大后会失真)、矢量图(经过放大不会失真)等大家都能叫上口但都很模糊的名词。也了解图像处理技术中一些常用处理技术的实质,比如锐化处理是使模糊的图像变清晰,增强图片的边缘等细节。而平滑处理的目的是消除噪声、模糊图像,在提取大目标之前去除小的细节或弥合目标间的缝隙。对常见的rgb图像和灰度图像有了明确的理解,这对大家以后应用photoshop等图像处理软件对图像进行处理打下了坚实的基础。更重要的是学习到了数字图像处理的思想。通过学习也是对c++编程应用的很好的实践和复习。
当然通过8周的学习还远远不够,也有许多同学收获甚微,我总结了下大家后期学习的态度与前期学习的热情相差很大的原因。刚开始大家是有很高的热情去学习这门课,可随着这门课的更深入的学习,大家渐渐发现课程讲授内容与自己起初想学的实用图像处理技术是有很大的差别的,大家更着眼于如何利用软件、技术去处理图像而得到满意的效果,或者进行一些图像的创意设计,可是课程的内容更偏向于如何通过编程实现如何多图像进行一些类似锐化、边缘提取、模糊、去除噪声等基础功能的实现,这其中涉及很多算法、函数,需要扎实的数学基础和编程基础,并且需要利用大量时间在课下编写代码,并用visual c++软件实现并进行调试,然而大部分人的c++实践能力和编程能力还有待提高,尤其是对于矩阵进行操作的编程尤为是个考验。
在老师授课方面的建议是可以再课上多进行一些具体操作,这样可以提起大家的学习兴趣,也可以让大家在课下积极准备,然后在课上让学生进行演示,还可以加入一些图像处理的经典范例,加深同学们的学习热情。
数字图像处理心得体会篇三
数字图像处处理(digitalimageprocessing)是将图像信号转换成数字信号并利用计算机对其进行处理。早期的数字图像处理的目的是提高图像的视觉效果。目前已广泛应用于科学研究、工农业生产、医学工程、航空航天、军事、文化产业等众多领域。
1数字图像处理技术概要
1.1数字图像处理技术的概念
在图像处理技术中,低级处理涉及初级技术,如噪声降低、对比度处理和锐化处理。中级处理涉及分割、缩减对目标像素群的定义,以便于对不同像素或像素群的识别及计算机计算处理。高级处理是算法对图像分析中被识别像素群的总体分析结果,以及运算与视觉效果相关的分析函数等处理技术。
在应用数学理论时,将图像定义为二维函数f(x,y),x和y为空间坐标,在任意一组空间坐标f(x,y)的幅值f称为图像在该坐标位置的强度或灰度.
当x,y和幅值f是离散的、有限的数值时,称该坐标位置是由有限的元素组成的,每一个像素都有一个特定的位置和幅值。
1.2数字图像处理技术的发展
数字图像处理技术最早出现于20世纪中期,图像处理的目的是提高图像的呈现质量。图像处理的是视效较低的图像,要求输出尽可能提高效果后的图像。主要采用噪声减弱、灰度变换、几何校正等方法进行处理,并考虑了明暗效果和对比度等诸多因素,由计算机进行更为复杂的图像处理。
20世纪初期,图像处理技术首次应用于提升通讯传输后的图像质量提升。到20世纪中期,计算机发展到了一定的技术水平后,数字图像处理才广泛应用于各种高质图像需求的领域。计算机对飞行器发回的天体照片进行图像处理,收到明显的效果。
进而不断地推广和发展,数字图像处理形成了较为完备的学科体系。目前,各个应用领域对数字图像处理技术提出更高的需求,促进了这一学科体系向更高的技术方向发展。特别是在像素群的理解与识别处理方面,已经由二维图像处理发展到三维模型化的定义方法。
数字图像处理心得体会篇四
图像处理方法一般有数字法和光学法两种,其中数字法的优势很明显,已经被应用到了很多领域中,相信随着科学技术的发展,其应用空间将会更加广泛。数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理是从20世纪60年代以来随着计算机技术和vlsl的发展而产生、发展和不断成熟起来的一个新兴技术领域。数字图像处理技术其实就是利用各种数字硬件与计算机,对图像信息通过转换而得到的电信号进行相应的数学运算,例如图像去噪、图像分割、提取特征、图像增强、图像复原等,以便提高图像的实用性。其特点是处理精度比较高,并且能够对处理软件进行改进来优化处理效果,操作比较方便,但是由于数字图像需要处理的数据量一般很大,因此处理速度有待提高。目前,随着计算机技术的不断发展,计算机的运算速度得到了很大程度的提高。在短短的历史中,它却广泛应用于几乎所有与成像有关的领域,在理论上和实际应用上都取得了巨大的成就。
由于数字图像处理的方便性和灵活性,因此数字图像处理技术已经成为了图像处理领域中的主流。数字图像处理技术主要涉及到的关键技术有:图像的采集与数字化、图像的编码、图像的增强、图像恢复、图像分割、图像分析等。
图像的采集与数字化:就是通过量化和取样将一个自然图像转换为计算机能够处理的数字形式。
图像编码:图像编码的目的主要是来压缩图像的信息量,以便能够满足存储和传输的要求。
图像的增强:图像的增强其主要目的是使图像变得清晰或者将其变换为机器能够很容易分析的形式,图像增强方法一般有:直方图处理、灰度等级、伪彩色处理、边缘锐化、干扰抵制。
图像的恢复:图像恢复的目的是减少或除去在获得图像的过程中因为各种原因而产生的退化,可能是由于光学系统的离焦或像差、被摄物与摄像系统两者之间的相对运动、光学或电子系统的噪声与介于被摄像物跟摄像系统之间的大气湍流等等。
图像的分割:图像分割是将图像划分为一些互相不重叠的区域,其中每一个区域都是像素的一个连续集,通常采用区域法或者寻求区域边界的境界法。
图像分析:图像分析是指从图像中抽取某些有用的信息、数据或度量,其目的主要是想得到某种数值结果。图像分析的内容跟人工智能、模式识别的研究领域有一定的交叉。
1)数字图像处理的信息大多是二维信息,处理信息量很大。因此对计算机的计算速度、存储容量等要求较高。
2)数字图像处理占用的频带较宽。与语言信息相比,占用的.频带要大几个数量级。所以在成像、传输、存储、处理、显示等各个环节的实现上技术难度较大,成本亦高。这就对频带压缩技术提出了更高的要求。
3)数字图像中各个像素不是独立的,其相关性大。在图像画面上,经常有很多像素有相同或接近的灰度。所以,图像处理中信息压缩的潜力很大。
4)数字图像处理后的图像受人的因素影响较大,因为图像一般是给人观察和评价的。
数字图像处理的优点主要表现在4个方面。
1)再现性好。数字图像处理与模拟图像处理的根本不同在于它不会因图像的存储、传输或复制等一系列变换操作而导致图像质量的退化。只要图像在数字化时准确地表现了原稿,那么数字图像处理过程始终能保持图像的再现。
2)处理精度高。将一幅模拟图像数字化为任意大小的二维数组,主要取决于图像数字化设备的能力。
3)适用面宽。图像可以来自多种信息源,它们可以是可见光图像,也可以是不可见的波谱图像。只要针对不同的图像信息源,采取相应的图像信息采集措施,图像的数字处理方法适用于任何一种图像。
4)灵活性高。图像处理大体上可分为图像的像质改善、图像分析和图像重建三大部分,每一部分均包含丰富的内容。
图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方方面面,随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。
航天和航空技术:在飞机遥感和卫星遥感技术中用配备有高级计算机的图像处理系统来判读分析,既节省人力又加快了速度,还可以从照片中提取人工所不能发现的大量有用情报。
生物医学工程:除了ct技术之外,还有对医用显微图像的处理分析,如红细胞、白细胞分类,染色体分析,癌细胞识别等。
通信工程:当前通信的主要发展方向是声音、文字、图像和数据结合的多媒体通信。在一定意义上讲,编码压缩是这些技术成败的关键。除了已应用较广泛的熵编码、dpcm编码、变换编码外,目前国内外正在大力开发研究新的编码方法,如分行编码、自适应网络编码、小波变换图像压缩编码等。
工业和工程领域:图像处理技术有着广泛的应用,如自动装配线中检测零件的质量并对零件进行分类,印刷电路板疵病检查,弹性力学照片的应力分析,流体力学图片的阻力和升力分析,邮政信件的自动分拣,在一些有毒、放射性环境内识别工件及物体的形状和排列状态,先进的设计和制造技术中采用工业视觉等等。
军事方面:图像处理和识别主要用于导弹的精确末制导,各种侦察照片的判读,具有图像传输、存储和显示的军事自动化指挥系统,飞机、坦克和军舰模拟训练系统等;公安业务图片的判读分析,指纹识别,人脸鉴别,不完整图片的复原,以及交通监控、事故分析等。
文化艺术:电视画面的数字编辑、动画的制作、电子图像游戏、纺织工艺品设计、服装设计与制作、发型设计、文物资料照片的复制和修复、运动员动作分析和评分等等。
视频和多媒体系统:电视制作系统广泛使用的图像处理、变换、合成,多媒体系统中静止图像和动态图像的采集、压缩、处理、存贮和传输等。
电子商务:图像处理技术在电子商务中也大有可为,如身份认证、产品防伪、水印技术等。
在这门课程的最后,代课老师给我们讲授了数字视频处理,让我们了解到数字视频就是以数字形式记录的视频,和模拟视频相对的。数字视频有不同的产生方式,存储方式和播出方式。比如通过数字摄像机直接产生数字视频信号,存储在数字带,p2卡,蓝光盘或者磁盘上,从而得到不同格式的数字视频。然后通过pc,特定的播放器等播放出来。了解了数字视频发展过程和视频压缩的概念和分类等。
我们这门课程主要是上理论课,其中有很复杂的数学原理,专业术语多,基础知识要求高,理解起来有些困难。当初选择这门课是希望能有一些具体软件的教学。就我了解,视频处理的软件有maya、premiere、绘声绘影、windows自带的movemaker;处理数字图像的软件主要有matlab、photoshop、imagej(java图像处理程序)。其中,matlab和ps很具有教学性,这两个软件也运用的很广。
matlab全称是matrixlaboratory(矩阵实验室),一开始它是一种专门用于矩阵数值计算的软件,从这一点上也可以看出,它在矩阵运算上有自己独特的特点。实际运用中matlab中的绝大多数的运算都是通过矩阵这一形式进行的,这一特点决定了matlab在处理数字图像上的独特优势。理论上讲,图像是一种二维的连续函数,然而计算机对图像进行数字处理时,首先必须对其在空间和亮度上进行数字化,这就是图像的采样和量化的过程。
photoshop是adobe公司旗下最为出名的图像处理软件之一,集图像扫描、编辑修改、图像制作、广告创意,图像输入与输出于一体的图形图像处理软件,深受广大平面设计人员和电脑美术爱好者的喜爱。
如果能理论和实践相结合,相信我们会把数字图像处理理解的跟透彻,同时也锻炼了大家的动手能力。希望老师能考虑我的这点建议,多开设实际动手的课程。
数字图像处理心得体会篇五
实验目的:本实验内容旨在让学生通过用vc等高级语言编写数字图像处理的一些基本算法程序,来巩固和掌握图像处理技术的基本技能,提高实际动手能力,并通过实际编程了解图像处理软件的实现的基本原理。为学生进一步学习数字摄影测量、遥感和地理信息系统等专业课程以及应用图像处理解决实际问题奠定基础。
二、实验原理和方法
(1)raw格式到bmp格式的转换:
raw格式:raw格式文件是按照数字图像组成的二维矩阵,将像素按行列号顺序存储在文件中。这种文件只含有图像像素数据,不含有信息头,因此,在读图像时,需要根据文件大小,计算图像所包含的行列号,或者需要事先知道图像大小(矩阵大小)。raw文件按图像上行到下行、左列到右列顺序存储。
bmp格式:bmp文件数据区按图像上下行到上行、左列列到右列顺序存储到数据区。bmp文件由文件头、信息头、颜色表、数据区四个部分组成。
做raw格式文件到bmp格式文件的转化,先要为bmp格式文件申请四部分的内存:文件头,位图信息头,颜色表,图象数据,然后根据输入值以及raw文件信息,bmp格式文件信息计算出这几部分的值,赋给他们,写到bmp文件中去。
(2)灰度图象的线性拉伸:
灰度变化是点运算,将原图象的每个像素的灰度值改成线性变化之后的灰度即可。
灰度的线性变换就是指图像的中所有点的灰度按照线性灰度变换函数进行变换。灰度变换方程如下:
该方程为线性方程。式中参数为输入图像的像素的灰度值,参数为输出图像的
灰度值。
设原图象的灰度范围为[a,b],变化之后的范围为[a’,b’],则:
fa=(b’-a’)/(b-a)
fb=-(b’-a’)/(b-a)*a+a’
如果算出来的值大于255,则让它等于255,小于0则让其等于0。
(3)局部处理(3*3高通滤波,3*3低通滤波):
局部处理在处理某一像素时,利用与该像素相邻的一组像素,经过某种变换得到处理后图像中某一点的像素值。目标像素的邻域一般是由像素组成的二维矩阵,该矩阵的大小为奇数,目标像素位于该矩阵的中央,即目标像素就是区域的中心像素。经过处理后,目标像素的值为经过特定算法计算后所得的结果。
实际上都是利用卷积来实现的,卷积往往用一个矩阵表示,将矩阵的中心对齐某个像素,矩阵中的值乘到相应的像素中去,然后将所有乘积加起来就得到中心像素的灰度值。边界像素不做处理,仍为原来的灰度值。求出的像素灰度值若超过[0~255],则向离其最近的属于该范围的`像素值靠拢。
3*3低通滤波的算子见表1。
3*3高通滤波的算子见表2。
表格1
1/9
1/9
1/9
1/9
1/9
1/9
1/9
1/9
1/9
表格2
-1
-1
-1
-1
9
-1
-1
-1
-1
(4)图象几何处理(图象平移,图象缩放):
对于图像平移来说,若平移量是(tx,ty),像素在原图像中的坐标为(x0,y0),则变化后的坐标为(x1,y1),x1=x0+tx,y1=y0+ty。平移只需改变像素的灰度值,不必改变位图信息头和调色板内容。
对于图像缩放,假设放大因子为ratio,缩放的变换矩阵为:
图像信息头中新图像的宽度和高度都变为原来宽度和高度分别与水平垂直比例的乘积,图像大小变为新宽度(变为4的整数倍)与新高度的乘积。
(5)灰度图象中值滤波:
中值滤波也属于局部处理的一种,将窗口中的各个像素排序之后排序,取中值赋给模板中心的像素,所以窗口中个数一般是基数。
我用的中值滤波窗口是十字丝的9个数的窗口。
(6)灰度图象边缘检测:
边缘检测有三种算子:roberts,prewit,sobel。三种算子都是做一阶差分的,通过算子算出各个像素的梯度值,将水平梯度的绝对值和垂直梯度的绝对值相加,若此梯度值大于某个阈值,则将其灰度值赋为255,否则赋为0。
(7)图象旋转:
图像旋转一般是以图像中心为中心顺时针旋转,利用图像的四个角点求出图像旋转后的大小。
先计算以图像中心为原点坐标系下原图像四个角点的坐标值,按照旋转矩阵计算其旋转之后的坐标值,根据四个角点的新坐标值计算出最大宽度和高度作为新图像的宽度和高度值,按照计算值修改位图信息头,申请一块新内存,存储旋转后图像的灰度值。
旋转矩阵如下:
同样要求各个像素在原图像中的坐标,先将新图像的坐标系平移到图像中心,做逆时针旋转,然后再平移到屏幕左上角,然后将原图像对应坐标的值赋给新图像。
(8)图象二值化:
判断分析法:假定图像的灰度区间为[0,l-1],则选择一阈值t将图像的像素分为两组。
为最大值所对应的t,就是所求判断分析法的分割阈值。
搜寻到阈值之后,灰度值小于阈值的像素赋0,其他的赋1,修改文件信息头,调色板,申请新内存。
(9)图象直方图:
统计各灰度值出现的频数,以及像素的总个数,用频数除以总个数作为频率,以灰度值作为横坐标,频率作为纵坐标绘图。
三、实验过程和步骤
首先要建立一个基于mfc的多文档工程,将视图基类改为滚动视图,以自己的学号命名。
我用的是书上给的cdib类,类里面有获取bmp宽度,高度的函数,有指向位图信息头的指针,指向图象数据的指针,因此我在文档类(doc类)里定义了一个cdib类的对象,打开以及保存文件的时候利用这个对象去调用cdib里读取与存储文件的函数,并且可以利用这个对象的两个指针对打开的图象进行各种操作。
格式到bmp格式的转换:
首先建立一个rawtobmp的对话框,在上面加上四个编辑框(一个输入打开文件的路径一个输入保存文件的路径,另两个),两个按钮,以及默认的确认,取消按钮。利用类向导插入此对话框类,并且为前两个编辑框定义cstring的两个变量,用来存储打开与保存文件的路径。同时为两个浏览按钮添加消息响应函数,在消息函数里创建cfiledialog对象,利用此对象的函数将两个路径值赋给前两个编辑框的成员变量。再为ok键添加消息响应函数,分别定义bmp格式文件前三部分数据变量,计算出各变量的值,并且利用一个cfile对象获取raw图象的数据,利用另一个cfile对象将数据存储到所输入的路径的文件中去,cfile对象的read函数会自动创建一个文件。
然后在菜单上新建一个菜单,为菜单添加消息响应函数,在其消息响应函数里创建rowtobmp对话框。这样点击菜单后就会弹出一个对话框,按确定键之后就可以读取raw文件并且存储bmp文件,完成整个消息循环。
2.灰度图象的线性拉伸:
数字图像处理心得体会篇六
——学习数字图像处理后对于车牌识别过程的认识
本人导师张崎,主要从事智能交通方面的研究。高年级学长曾做过车牌识别的研究。在学完数字图像处理这门课后,于是有了这篇关于车牌识别系统的心得体会。
仔细翻阅了几遍平时上课做的笔记,梳理了下各种图像处理方法在各中图像处理中起到的作用。结合对实际车牌识别过程的了解,谈谈自己对图像处理的各种方法在识别过程中起到的作用。
老师总说图像处理就是不讲道理,我觉得这就是最大的道理。为什么有人能够把不讲道理的东西做出来?这其中实际上蕴藏着深刻的道理。就像爱因斯坦证明布朗运动是毫无规律的运动一样,你发现他是毫无规律的,这其实就是他最大的规律。我想,只有对图像有了深刻的认识,才能完成这种你也说不出道理的事。好了,现在我想结合这门课和车牌识别展开说说。
有时候,计算机跟人相比真的很傻,扔一张车牌尾号过来,不管它多么破旧、不清晰,人们能够轻而易举的读出上面的数字。而计算机呢?他要不停的运算、识别,而你算法上的一个小小漏洞,更会导致识别的大大不同。通过数字图像处理这门课的学习,我觉得可能通过下面的一些列步骤能较好的识别出车牌上的号码数字。
首先,我觉得我们需要将彩色的图片转换为灰色图像,这样便于计算机分析,计算机跟人刚好相反,好看的不一定好处理,而灰色的图像虽然不美观,但是正好适合计算机来处理。另一方面,将彩色图像转化为灰色图像也能减少图像所占的存储空间,简化和加快后续处理的工作。
其次,我觉得我们需要根据实际需要,对图像就行简单的预处理。我们应当让我们所关心的图像内容,显现的更加突出。而弱化那些我们所不关心的背景类似的东西。这里我觉得,我们就可以利用我们上课所学到的图像增强的知识了。需要注意的是,图像增强并不能增加原始图像的信息,只是通过某些技术有选择的突出对某一具体应用有价值的信息,即图像增强只通过突出某些信息,以增强对这些信息的辨识能力,而其他信息信息则被削弱,这就是我对图像增强的理解,我认为他是我们后期识别车牌的重要准备,增强的好坏直接影响了后期识别的准确度和速度。
然后,图像增强后,我觉得我们就应该对处理后的图像就行边缘检测,这里就直接会用到我们上课所学到的边缘检测的各种方法,边缘是图像的最基本特征,边缘部分集中了图像的大部分信息。边缘确定和提取对于整个图像场景的识别是非常重要的。而上一部的图像强也增强了边缘信息。
下一步,我认为就应该进行图像分割了,把各个字母数字单独分割出来,便于后续的进一步识别。
最后,就应该开始识别这些分割出来的图像,这一部分,我们课上内容并没有涉及,查阅了些资料,找到了比较可行的办法。即模式识别。我理解的过程是,首先我们应该建立一个标准模版库,然后通过将提取出来的样品与标准模版进行比较,来识别他们。
这就是上完数字图像处理课,我所能想到的车牌识别的整个过程,基本上需要用到我们所学的所有内容,而且都是比较基础的知识,我觉得,往往一个图像处理的问题,就是应该分成很多小问题来解决,一步步简化问题。一步步将图像中我们所最关心的内容提取出来。
毕竟没有深入学习过这方面的知识,本文纯属心得体会,过程中难免存在很多不足或者错误。恳请老师指出。
数字图像处理心得体会篇七
实验目的:本实验内容旨在让学生通过用vc等高级语言编写数字图像处理的一些基本算法程序,来巩固和掌握图像处理技术的基本技能,提高实际动手能力,并通过实际编程了解图像处理软件的实现的基本原理。为学生进一步学习数字摄影测量、遥感和地理信息系统等专业课程以及应用图像处理解决实际问题奠定基础。
二、实验原理和方法
(1)raw格式到bmp格式的转换:
raw格式:raw格式文件是按照数字图像组成的二维矩阵,将像素按行列号顺序存储在文件中。这种文件只含有图像像素数据,不含有信息头,因此,在读图像时,需要根据文件大小,计算图像所包含的行列号,或者需要事先知道图像大小(矩阵大小)。raw文件按图像上行到下行、左列到右列顺序存储。
bmp格式:bmp文件数据区按图像上下行到上行、左列列到右列顺序存储到数据区。bmp文件由文件头、信息头、颜色表、数据区四个部分组成。
做raw格式文件到bmp格式文件的转化,先要为bmp格式文件申请四部分的内存:文件头,位图信息头,颜色表,图象数据,然后根据输入值以及raw文件信息,bmp格式文件信息计算出这几部分的值,赋给他们,写到bmp文件中去。
(2)灰度图象的线性拉伸:
灰度变化是点运算,将原图象的每个像素的灰度值改成线性变化之后的灰度即可。
灰度的线性变换就是指图像的中所有点的灰度按照线性灰度变换函数进行变换。灰度变换方程如下:
该方程为线性方程。式中参数为输入图像的像素的灰度值,参数为输出图像的
灰度值。
设原图象的灰度范围为[a,b],变化之后的范围为[a’,b’],则:
fa=(b’-a’)/(b-a)
fb=-(b’-a’)/(b-a)*a+a’
如果算出来的值大于255,则让它等于255,小于0则让其等于0。
(3)局部处理(3*3高通滤波,3*3低通滤波):
局部处理在处理某一像素时,利用与该像素相邻的一组像素,经过某种变换得到处理后图像中某一点的像素值。目标像素的邻域一般是由像素组成的二维矩阵,该矩阵的大小为奇数,目标像素位于该矩阵的中央,即目标像素就是区域的中心像素。经过处理后,目标像素的值为经过特定算法计算后所得的结果。
实际上都是利用卷积来实现的,卷积往往用一个矩阵表示,将矩阵的中心对齐某个像素,矩阵中的值乘到相应的像素中去,然后将所有乘积加起来就得到中心像素的灰度值。边界像素不做处理,仍为原来的灰度值。求出的像素灰度值若超过[0~255],则向离其最近的属于该范围的像素值靠拢。
3*3低通滤波的算子见表1。
3*3高通滤波的算子见表2。
表格1
1/9
1/9
1/9
1/9
1/9
1/9
1/9
1/9
1/9
表格2
-1
-1
-1
-1
9
-1
-1
-1
-1
(4)图象几何处理(图象平移,图象缩放):
对于图像平移来说,若平移量是(tx,ty),像素在原图像中的坐标为(x0,y0),则变化后的坐标为(x1,y1),x1=x0+tx,y1=y0+ty。平移只需改变像素的灰度值,不必改变位图信息头和调色板内容。
对于图像缩放,假设放大因子为ratio,缩放的变换矩阵为:
图像信息头中新图像的宽度和高度都变为原来宽度和高度分别与水平垂直比例的乘积,图像大小变为新宽度(变为4的整数倍)与新高度的乘积。
(5)灰度图象中值滤波:
中值滤波也属于局部处理的一种,将窗口中的各个像素排序之后排序,取中值赋给模板中心的像素,所以窗口中个数一般是基数。
我用的中值滤波窗口是十字丝的9个数的窗口。
(6)灰度图象边缘检测:
边缘检测有三种算子:roberts,prewit,sobel。三种算子都是做一阶差分的,通过算子算出各个像素的梯度值,将水平梯度的绝对值和垂直梯度的绝对值相加,若此梯度值大于某个阈值,则将其灰度值赋为255,否则赋为0。
(7)图象旋转:
图像旋转一般是以图像中心为中心顺时针旋转,利用图像的四个角点求出图像旋转后的大小。
先计算以图像中心为原点坐标系下原图像四个角点的坐标值,按照旋转矩阵计算其旋转之后的坐标值,根据四个角点的新坐标值计算出最大宽度和高度作为新图像的宽度和高度值,按照计算值修改位图信息头,申请一块新内存,存储旋转后图像的灰度值。
旋转矩阵如下:
同样要求各个像素在原图像中的坐标,先将新图像的坐标系平移到图像中心,做逆时针旋转,然后再平移到屏幕左上角,然后将原图像对应坐标的值赋给新图像。
(8)图象二值化:
判断分析法:假定图像的灰度区间为[0,l-1],则选择一阈值t将图像的像素分为两组。
为最大值所对应的t,就是所求判断分析法的分割阈值。
搜寻到阈值之后,灰度值小于阈值的像素赋0,其他的赋1,修改文件信息头,调色板,申请新内存。
(9)图象直方图:
统计各灰度值出现的频数,以及像素的总个数,用频数除以总个数作为频率,以灰度值作为横坐标,频率作为纵坐标绘图。
三、实验过程和步骤
首先要建立一个基于mfc的多文档工程,将视图基类改为滚动视图,以自己的学号命名。
我用的是书上给的cdib类,类里面有获取bmp宽度,高度的函数,有指向位图信息头的指针,指向图象数据的指针,因此我在文档类(doc类)里定义了一个cdib类的对象,打开以及保存文件的时候利用这个对象去调用cdib里读取与存储文件的函数,并且可以利用这个对象的两个指针对打开的图象进行各种操作。
格式到bmp格式的转换:
首先建立一个rawtobmp的对话框,在上面加上四个编辑框(一个输入打开文件的路径一个输入保存文件的路径,另两个),两个按钮,以及默认的确认,取消按钮。利用类向导插入此对话框类,并且为前两个编辑框定义cstring的两个变量,用来存储打开与保存文件的路径。同时为两个浏览按钮添加消息响应函数,在消息函数里创建cfiledialog对象,利用此对象的函数将两个路径值赋给前两个编辑框的成员变量。再为ok键添加消息响应函数,分别定义bmp格式文件前三部分数据变量,计算出各变量的值,并且利用一个cfile对象获取raw图象的数据,利用另一个cfile对象将数据存储到所输入的路径的文件中去,cfile对象的read函数会自动创建一个文件。
然后在菜单上新建一个菜单,为菜单添加消息响应函数,在其消息响应函数里创建rowtobmp对话框。这样点击菜单后就会弹出一个对话框,按确定键之后就可以读取raw文件并且存储bmp文件,完成整个消息循环。
2.灰度图象的线性拉伸:
向图像数据部分的指针m_dib.m_pbits,在数组中查出每个像素变化后的灰度值,并将此值赋给指针m_pbits指向的内存。刷新视图。
然后在菜单中加上线性拉伸的菜单,为该菜单的id添加消息响应函数,在该函数中创建对话框,并调用文档类线性拉伸的函数,将对话框的两个成员变量传给此函数。
3.局部处理:
在文档类里添加低通滤波和高通滤波的成员函数,在函数中使用m_dib对象中指向图像数据部分的指针m_pbits,首先申请一个新内存,将原来图像的灰度值存储起来,然后定义9个byte类型的指针,利用双重嵌套循环,在循环中每次用这9个指针指向复制图像对应模板中的9个数,然后按照模板中的数值计算出中心像素的灰度值,判断是否超过范围,如果超过范围则做相应的处理,否则将此值直接赋给m_pbits中对应的中心像素。循环之后刷新视图。
添加局部处理的菜单,为菜单设置消息响应函数,在菜单消息响应函数中调用文档类的函数,完成对m_dib的处理。
4.图像几何变换:
建立平移对话框,定义两个成员变量,分别存储输入的水平位移和垂直位移。
在文档类里添加平移函数,申请一块新内存复制原图像的信息,在函数中将
外层循环变量i视为纵坐标,内层循环变量j视为横坐标,通过双重循环,对每个像素,求出其在原图像中的坐标(i0,j0),将复制图像中的对应(i0,j0)的像素灰度值赋给m_dib.m_pbits指针中的图像。如果在原图像中找不到该像素,置为背景色。刷新视图。
在菜单中添加图像平移菜单,并为该菜单添加消息响应函数,在此函数中创建平移对话框,调用文档类的平移函数,将对话框的成员变量传入该函数。
建立缩放对话框类,为此类定义两个成员变量,存储输入的水平缩放因子和垂直缩放因子。
再在文档类中添加缩放函数,利用m_dib.m_pbmi(指向位图信息头的指针),修改位图信息头中的宽度,高度,图像大小。计算出新图像的大小,申请一块新内存存储新图像,同平移函数一样,计算出每个像素在原图像中的坐标,i0=i/pratio,j0=j/vratio,pratio与vratio分别为水平缩放因子和垂直缩放因子。将原图像中对应坐标的灰度值赋给新内存,然后将m_dib.m_pbit指向新内存,刷新视图。
5.中值滤波:
在文档类中添加两个成员函数。一个用来把传入的指针里的内容排序,一个用来做中值滤波。也要申请一块新内存来复制原图像的信息,双重嵌套循环,边界像素不处理,对每个像素,使用一个大小为9个字节的数组来存放复制图像窗口中各像素值,然后将数组首地址传入排序的函数中,将中间的值赋给当前图像窗口中心的像素。排序函数我用的是快速排序法。
在菜单中添加中值滤波菜单项,为其添加消息响应函数,调用文档类的中值滤波函数。
6.边缘检测:
在文档类中定义三个函数,分别为roberts,prewit,sobel算子处理函数,处理时,先申请新内存复制原来图像信息,边界像素不作处理,对每个像素值,求出其在复制图像中的梯度,判断,若梯度值大于150(这个是我自己定的),则将灰度值赋为255,否则置零。
菜单中添加边缘检测菜单,置属性为pop—up,添加三个下一级菜单,分别为roberts,prewit,sobel,各个菜单的消息响应函数中调用文档类中各自的处理函数。
7.图像旋转:
创建一个对话框输入旋转角度,在文档类中添加成员函数。
先将角度化为弧度值。
计算原图像四个角点的坐标,以及新图像四个角点的坐标。
根据新图像四个角点的坐标,取对角线上两个点横坐标差值较大值作为宽度,纵坐标差值较大值作为高度。
根据计算出来的高度和宽度修改文件信息头,并且申请内存存储新图像。
计算每点的像素在原来图像中的坐标从而获取其灰度值,写入新内存。
将m_dib.m_pbits指向该新内存。刷新视图。
添加图像旋转菜单,在菜单响应函数中创建对话框,调用文档类中旋转函数,将对话框中获取的角度传给旋转函数。
8.图像二值化:
在文档类添加一个成员函数,根据传人的图像和阈值返回组间方差和组内方差的比值。
再添加一个成员函数,进行二值化。
在函数中:
计算新bmp文件的大小,申请一块新内存,存储新的整个bmp文件的信息,将位图信息头中bibitcount置为1,调色板数组只有两个两个元素,下标为0的三个灰度值都为0,下标为1的三个灰度值为255。
从最大灰度值到最小灰度值之间搜寻上述函数返回值最大的值,作为阈值。
对每个像素,若其原来灰度值小于阈值,赋1,否则赋0。
将m_dib,m_pbits指向新内存的图像数据部分,m_dib.m_pbmi指向位图信息头。
9.图像直方图:
为文档类添加一个int型指针成员变量m_pgray,在构造函数中将该指针赋空,在文档类中定义了一个函数,统计各个灰度值出现的频数,申请一个内存,存储在这个内存中,并将m_pgray指向它。
创建一个画直方图的对话框,添加picture控件,在控件里调用文档类成员变量,画直方图。添加一个滚动条,用来确定阈值,为滚动条添加消息响应函数,按照滚动条的值进行二值化。
在菜单中添加直方图菜单,添加消息响应函数,在响应函数中创建直方图对话框对象。
最后,因为我开始做工程的时候没有把菜单设计好,做得有点乱,所以,我又在view里添加wm_contextmenu消息响应函数,在函数体内用cmenu类来实现弹出菜单。
四、结果分析与评价
(1)raw格式到bmp格式的转换:效果见图1。
图表1
老师说在转化的时候后面用一个循环会降低效率,但是实际上只要宽度是4的整数倍,后面的循环就不会做了。所以这个算法效率我觉得还行吧。
(2)线性变化:输入线性变化范围10~20,效果见图2。
图表2
用了线性查找表之后,这个算法的效率应该会高很多,但是我的算法里是线性表从0~255都有变化之后的值,实际上,如果图片的灰度范围小一些的话,做了很多无用的计算,而且前面已经搜寻过原图像的最大最小灰度值了,所以线性表的生成循环可以只从最小灰度做到最大灰度。另外,我设计的算法里,如果最大值和最小值输反了的话,程序会自动交换他们的值,做这个可能就会多算一些东西了。
(3)低通滤波:效果见图3。
图表3
取的是8邻域内的平均值,效果不是很好。
高通滤波:效果见图4。
图表4
基本上我觉得边缘还是有突出了吧。
中值滤波:效果见图5。
图表5
这个中值滤波的效果我还是比较满意的,因为排序所以要调用其他函数,我用了快速排序,而且用的是9个数的十字丝窗口,所以速度要比25个数的窗口快一些。平滑的效果出来还可以。
(4)边缘检测:
roberts算子:效果见图6。
图表6
prewit算子:效果见图7。
图表7
sobel算子:效果见图8。
图表8
由于prewit算子和sobel算子都用了8个数去做,所以效果要好一些,相比之下,sobel算子对这幅图又要效果好些,应该是对4邻域赋予了更大权的缘故。但是后两种算法计算量也要大一些。
(5)图像平移:效果见图9。
图表9
这个图像平移量比较大,所以被裁切的也显得不真实了。主要是因为我的图像大小和坐标都没有变化,所以只在原来的图像坐标范围内显示平移后的图像,实际上,我既可以改变图像的大小,并且为了节省计算,可以让循环变量i和j从一个新的值开始做计算,前面的全都赋背景色。
图像缩放:水平比例0.4,垂直比例0.5,效果见图10。
图表10
在此基础上旋转:效果见图11。
图表11
这几种算法主要的计算量都在for循环内,所以要想优化算法的话,必须简化循环里的计算。不过我的想法差不多跟书上的差不多,还没有什么优化。也许,这种优化的算法需要看很多别人做的好程序才能慢慢自己学会吧。
(6)二值化(判断分析法):效果见图12。
图表12
实际上,我用直方图看的最佳阈值应该在100多左右,而我做的程序阈值好像偏小一些,所以效果不太好,我计算组间方差和组内方差的时候调用了一个函数专门求阈值,可能这里的计算还是有一点问题。而且在我的函数里,要256次调用这个函数,又因为计算机是按字节处理数据的,因此写图像数据的时候要用每8个写到一个数组中,然后通过计算得到字节类型的值,这些都使得我的算法效率比较低,最后一个问题,我觉得如果使用位运算会快一些,但是前面的问题还没有想到比较好的解决方法。
(7)直方图:效果见图13。
这个图像255的像素太多,如果我没算错的话,量化应该不是很好吧。
图表13
五、实验总结与体会
这次实验学到最大的东西,是自己总算有mfc编程的概念了,虽然自己vc++考试的分数还不错,但是里面的很多东西,不通过自己的编程时绝对不能真正理解。比如说封装性,这次用cdib的方便,很好地利用了类的封装性。另外,比如mfc是基于消息响应机制的,这就决定了,要利用鼠标或者菜单响应函数去实现功能,而用c语言编写程序的时候,完全是按主函数的线程来的。
另外,我也学会了调试的真正含义。以前都只知道那几个按键是做什么用的,调试的真正目的,是根据自己的算法来检验程序计算的各个值是否符合,从而可以很快速方便地查到自己的错误。
自学也是很重要的一方面。实际上,在现在来说,用msdn也不是很难的事了,我们不应该被英文打到,而且现在,随着对一些专有名词熟悉了之后,看msdn也容易一些了,万一不懂的函数,也可以利用网络查到很多函数功能用法的解释。
刚开始的时候做的是位图的读取和显示,实在是不知从哪里做起,所以就照着实验书上敲了前面的部分,但是慢慢地也看懂了代码的意思。所以后来的基本上都是自己做的了,但是算法还是基本上和书上差不多。不过自己编的时候还是有很多细节的部分没有注意到,比如说,强制数据类型转换,我自己编的时候没有注意这个问题,结果出了很多错,有些事由于函数调用引起的,有些是由于不等号两边数据的匹配问题,还有的是由于指针的移动,直到这个时候,才真正明白实验书上程序为什么那么多强制类型转换,虽然书上很多东西不是尽善尽美,但是对于我这种刚开始学会编程的人还是有很多可以学习的地方的。
如老师所说,算法的效率是很重要的。要提高算法的效率,一个是要简化计算(不得不说,这需要数学基础),另外一个就是要避免许多重复的计算。在参考书上的程序里,很多时候,为了避免这种重复的计算(在循环中表现尤其明显),会把某些数当常数算出来,只要后来加上这个常数就可以,这样,效率高很多。
另外,对许多出错的情况,我的程序里也没有做好。比如,如果打开的不是8位图像,我的程序不会提示错误,正常结束,而可能做错,所以,这也是我应该向别人程序学习的地方。
最后一个,自己菜单的布局也是很乱的。要从一开始就布局好。
数字图像处理心得体会篇八
近期,我通过教师发展在线学习了《数字图像处理》这门课程,它是由天津理工大学杨淑莹教授及其教学团队主持和主讲的,是教育部“质量工程”项目——“高等学校教师网络培训系统”项目推出的数字化在线培训课程。
通过《数字图像处理》课程的网络学习,我觉得受益匪浅。首先,我们不应再教学中盲目“灌输”,主要还是激发学生对这门课的学习兴趣,应该让学生有一个平台可以看到图像数字处理的效果,产生一个所见即所得的印象,这样学生在学习中就有成就感,就会愿意动手去编程,在调试程序所面临的挫折中也能有信心和劲头去战胜困难;最后,多找些相关的例题和实例,让学生成立学习小组去完成一些学习任务,指导他们合理分工,从简单实例入手,慢慢增加难度,让学生以小组的形式独立完成。这样不仅提高了学生的编程能力,而且培养了他们的协作精神,增强了团队意识。以下是我对这门课程的认识:
图像处理是指对图像信息进行加工,从而满足人类的心理、视觉或者应用的需求的一种行为。图像处理方法一般有数字法和光学法两种,其中数字法的优势很明显,已经被应用到了很多领域中,相信随着科学技术的发展,其应用空间将会更加广泛。数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理是从20世纪60年代以来随着计算机技术和vlsl的发展而产生、发展和不断成熟起来的一个新兴技术领域。数字图像处理技术其实就是利用各种数字硬件与计算机,对图像信息通过转换而得到的电信号进行相应的数学运算,例如图像去噪、图像分割、提取特征、图像增强、图像复原等,以便提高图像的实用性。其特点是处理精度比较高,并且能够对处理软件进行改进来优化处理效果,操作比较方便,但是由于数字图像需要处理的数据量一般很大,因此处理速度有待提高。目前,随着计算机技术的不断发展,计算机的运算速度得到了很大程度的提高。在短短的历史中,它却广泛应用于几乎所有与成像有关的领域,在理论上和实际应用上都取得了巨大的成就。
数字图像处理需用到的关键技术主要有:图像的采集与数字化、图像的编码、图像的增强、图像恢复、图像分割、图像分析等。
数字图像处理的特点主要表现在数字图像处理的信息大多是二维信息,处理信息量很大。因此对计算机的计算速度、存储容量等要求较高;数字图像处理占用的频带较宽。与语言信息相比,占用的频带要大几个数量级。所以在成像、传输、存储、处理、显示等各个环节的实现上技术难度较大,成本亦高。这就对频带压缩技术提出了更高的要求;数字图像中各个像素不是独立的,其相关性大。在图像画面上,经常有很多像素有相同或接近的灰度。所以,图像处理中信息压缩的潜力很大。数字图像处理后的图像受人的因素影响较大,因为图像一般是给人观察和评价的。
数字图像处理的优点主要表现在再现性好、处理精度高、适用面宽、灵活性高等方面。图像处理大体上可分为图像的像质改善、图像分析和图像重建三大部分,每一部分均包含丰富的内容。
图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方方面面,随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。航天和航空技术、生物医学工程、通信工程、工业和工程领域、军事方面、文化艺术、视频和多媒体系统、电子商务都不同程度的应用了数字图像技术。
我们这门课程主要是理论课,其中有很复杂的数学原理,专业术语多,基础知识要求高,如果能理论和实践相结合,相信我们会把数字图像处理理解的跟透彻,同时也锻炼了大家的动手能力。希望老师能考虑我的这点建议,多开设实际动手的课程或引入教学实例引导同学们更好地理解、学习。
数字图像处理心得体会篇九
随着科学技术的发展,特别是四清在教学设计中的运用,要求教师必须掌握一定的结构图制作方法为自己的教学服务。通过学习,我对知识结构图有了进一步的认识,知道了好多以前根本没有接触过的东西,收获很大,下面我就谈谈自己的体会。
运用知识结构图可以将我们用语言难以表达清楚的问题直观、形象地展现给学生,有助于教学重点和难点的突破;在教学过程中把丰富多彩的图片资料展示给学生,可以引起学生的学习兴趣;通过某些问题的设置,可以培养学生对教学过程的参与意识,加深他们对问题的认识和理解程度;选择合适的媒体进行教学,可以增大我们的课容量,节约时间。
要让四清知识结构图在教学中发挥出应有的作用,它必须具备以下几个特点:
1、教学性
这是结构图最重要的一个特点。课件必须为教学服务,必须符合学科的教学规律,反映学科的教学过程和教学策略。在课件制作中,结构图的选择与组织、问题的设置等方面都必须体现这一特性。同时应深入浅出、注意启发。
2、科学性
“科学性”是知识结构图最基本的特点。结构图所涉及的内容必须科学、准确、健康、符合逻辑、层次清楚、合情合理,同时还要符合学生的年龄特点与知识水平。
3、美观性
结构图还包含各种类型的图标、树形等,让教师在课堂上更有灵活性,根据实际选择不同的学习路径。
1、结构图制作要简洁实用
知识结构图毕竟是一种辅助手段,它是用来辅助我们的教学的。一个好的课件关键在于它的实用性,应该说只要是有助于突破重点难点、有助于引起学生的深刻思考、有助于加深学生对问题的认识的课件就是好的知识结构图。
2、注意色彩的合理应用
色彩的应用可以给结构图增加感染力,但运用要适度,以不分散学生的注意力为原则。
3、注意字、图的混合
对于一些重点的字、词、句,除了采用不同的字号、字体和字形加以强调。

一键复制