| 查看: 2094 | 回复: 8 | ||||||||
| 【奖励】 本帖被评价3次,作者sdqdtt增加金币 2 个 | ||||||||
| 当前主题已经存档。 | ||||||||
[资源]
【转贴】机器视觉研究的关键问题研究【已搜无重复】
|
||||||||
|
计算机视觉是近20~30年出现的新技术,由于其固有的柔性好、非接触、快速等特点,在各个领域得到很广泛的应用,如航空航天、工业、军事、民用等等领域。计算机视觉的目标就是利用场景的一幅或几幅图像来达到理解场景内容,其终极目标就是模拟一套智能系统,类似人的眼睛和大脑的功能,能对场景的内容进行有选择性的处理、主动性的识别,目的性的观察等等。计算机视觉是交叉学科,相关学科有信号处理、图像处理、几何学、计算机科学、微电子学、心理学及神经生理学等,最好的模拟客观实体就是人类的眼睛。机器视觉与计算机视觉内涵基本一致,主要是前者偏重于计算机视觉技术在工程化应用中的知识,而后者只是视觉技术的理论指导,计算机视觉研究角度有两种:从信号处理的角度和从几何成像的角度,由于涉及知识较多,所以较难学,下面指出计算机视觉一些关键技术,若对这些都研究透了,那就可称为高手了。 1、Marr视觉理论 此理论从Marr提出开始到现在一直是计算机视觉的基本研究理论,他主要将视觉研究从信号处理的角度进行理解,将视觉研究分为三个层次:理论层次、算法表达、硬件实现;同时从信息处理将视觉分为三个阶段:原始信息、2.5维信息及三维信息;实际上这个研究方式与一般问题的研究方法是一致的,主要是理论->算法->实现这个研究方向;所以Marr视觉理论是视觉研究的方法学,指出研究的方法及对信息的处理方式。 2、计算机视觉模型 由于计算机视觉是基于光学成像、光电转换及信息处理建立的一套理论,光学成像一般遵循一定的几何知识,所以计算机视觉模型是基于透视投影理论建立的,即小孔成像模型,在是否考虑镜头畸变的情况下,可建立线性模型及非线性模型,同时利用几何变换理论,如射影几何、仿射几何、欧式几何可建立视觉模型的近似线性模型,在一些应用场合中,这些近似模型具有易理解、易标定等优势。 3、模型标定 由于视觉模型是用一些参数描述的,这些参数是摄像机的结构参数,如内部参数和外部参数,完成这些参数的确定过程就是视觉模型标定,即摄像机标定;摄像机标定一般采用被动式,如采用一些已知空间信息的控制点,通过模型理论,采用一定最优的方式建立目标函数,最后应用LM等最优化方法求解最优值;不同的视觉模型标定的方式可能不同,线性模型用线性最小二乘的方式就可求解,而非线性模型要采用非线性最优化的方式;如Tsai两步法、张正友任意位置法、DLT法等;还有一类标定称为主动标定式,一般应用在机器人手眼标定中,如马颂德法,但要求相机的移动是已知的。 4、视觉结构 这里的结构讨论与模型的讨论有些相关,计算机视觉按处理光照的方式可分为主动视觉和被动视觉两种,前者是控制光照的方式及光源的模式,而后者一般是利用自然光或均匀照明方式,在二维检测中一般用一个摄像机就可完成检测要求,但三维测量中就有很多中视觉结构可选用,如双目立体视觉、结构光三维视觉、莫尔条文三维视觉、阴影恢复三维理论等;双目立体视觉应用较广,而且其结构又具体分为好多种,不同结构有不同的优缺点,如在精度、成本、视场范围、复杂度等参数间进行权衡; 5、三维视觉系统的标定 双目立体视觉、结构光三维视觉及多传感器三维视觉系统是工业上常用的一些三维信息检测方法,由于系统结构不同,而且表达结构的参数不同,所以可用多种方法进行标定,这些视觉检测系统的基元是视觉传感器,视觉传感器可采用标准的方法进行内部参数标定,如Tsai\Zhang\DLT等方法,而视觉传感器间的关系(RT)是三维视觉系统标定的一个特点,如双目立体视觉的基线标定,结构光的三维视觉光平面标定,一般可采用间接中介法,即利用靶标坐标系作为中介坐标系,求视觉传感器间的关系,有时也可采用经纬仪建立的三维检测站作为中介坐标系完成转换;在大型工业现场中视觉传感器用的较多,如汽车车身检测,传感器达到几十个,这样传感器间可能没有共同的视场,所以要解决现场标定问题,同时由于尺寸链较长,所以如何控制标定精度是一个需要重点考虑的问题。 6、射影几何、仿射几何、欧式几何变换 从成像几何角度解释视觉传感器,可更好的理解一些成像过程中的不变量,利用这些不变量可简化目标的识别等操作。射影几何、仿射几何、欧式几何是建立在一定变换定义的基础上的几何,前者具有更广泛的意义,而后者是前者的特例,所以其不变量更多,在视觉传感器光学成像过程中,仿射几何可更好的表述成像过程,但由于视觉检测是一个复杂的系统,所以讨论的就不仅是仿射几何知识,同时也包括欧式几何知识,所以要好好的理解这三种几何的特点,才能更好的理解成像过程,才能更好的理解视觉模型,同时也才能更好的设计模型参数的标定方法。 7、图像处理 图像处理是自成体系的一个学科,它输入是一幅图像,输出可是一幅图像,也可是一些特征符号,这是图像处理的广义理解,图像处理涉及的面很广,每一方面知识都可写出一本书。图像处理按处理目的可分为:预处理(滤除噪声)、增强处理、图像分割、目标分析等。每种处理都有很多种方法,可参考图像处理书籍(章毓晋 图像处理 比较基础)。 8、图像理解 图像理解是图像处理的最后一个阶段,输入是目标区域,而输出是目标的各种几何、矩等特征参数,是完成识别过程的输入参数。对于一个如何定义其本质特征参数是关键的技术。 9、模式识别及分类研究 在一些视觉应用中,不仅要分析目标的特征参数,还要对目标进行分类操作,模式识别是指导分类的基本理论,分类有很多种方法,如基于统计的方法、神经网络法及结构模式识别等,但这些方法一个共同的特点就是大量有表现力的样本获得,有表现力是指样本的分布要能表达目标的真实分布情况。模式分类的一些关键技术我已经在另一篇文章简单指出,请参考。 10、数学能力 数学体现了人对问题的思维方式,所以其重要性怎么说都不为过,在整个计算机视觉研究过程中,数学起到了理论指导作用,其问题的思考方法、模型的建立及求解都离不开数学的指导,我们一定要好好学习数学呀,当然不需要多高深的数学知识,如高等数学、微积分、变换几何、空间理论、最优化等是必须备的知识。 11、计算机编程能力 目前常用的编程方法一般采用C/C++实现,要好好的学的。 12、方法论 方法论是一种研究问题的方法的理论,它指导你如何思考问题、如何解决问题等;如何将一个目标分解为小目标;如何权衡各方面的约束条件;系统方案采用何种结构合适,并行或串行、反馈或直接控制;研究开发过程中各个阶段如何划分,各个阶段的目标如何达到等;方法论具有一定哲学的意义,具有一定的广泛性;只有好的方法论的指导,才能达到事半功倍的效果。 在机器视觉研究中,我认为以上是一些关键点,当然可能有遗落,希望大家给补上,希望我们通过不断的交流,一起进步。上面简单的说了些问题,当然具体问题如何解决,我希望我能抛砖引玉,大家可以开辟几个专题,进行讨论。 [ Last edited by sdqdtt on 2007-9-27 at 08:46 ] |
» 收录本帖的淘帖专辑推荐
计算机视觉 | 计算机视觉相关资料 | 计算机视觉 | 研究生期间 |
科研是这样炼成的 | 技术前沿ABC量子力学等 |
» 猜你喜欢
溴的反应液脱色
已经有4人回复
参与限项
已经有5人回复
推荐一本书
已经有7人回复
有没有人能给点建议
已经有5人回复
假如你的研究生提出不合理要求
已经有12人回复
全日制(定向)博士
已经有5人回复
萌生出自己或许不适合搞科研的想法,现在跑or等等看?
已经有4人回复
Materials Today Chemistry审稿周期
已经有4人回复
对氯苯硼酸纯化
已经有3人回复
所感
已经有4人回复
2楼2007-09-27 08:38:09
3楼2007-09-30 10:53:46
4楼2007-10-01 09:31:41
5楼2007-10-07 08:37:33
6楼2008-01-31 23:54:30
7楼2008-03-01 09:48:57
简单回复
welltea8楼
2008-06-20 10:00
回复
感谢分享!
casia_my9楼
2008-09-21 11:51
回复
感谢分享!












回复此楼

好!!!对机器视觉有了了解.