到底如何学习机器视觉学习

机器视觉方面的牛人资料 - 精诚缕缕 - 上海大学乐乎博客--思考,交流,分享,行动,成长,快乐
我爱。。。
& 机器视觉方面的牛人资料
13:08:19&|&机器视觉方面的牛人资料
Michael I. Jordan:统计学习方向的大大大大牛,曾经在MIT任教授10年,现在在加州大学伯克利分校任教授。他的学生几乎遍历美国CS方向的前20的所有高校。其中Andrew Ng是他的学生。Jordan的主页是:http://www.cs.berkeley.edu/~jordan/&Andrew Ng:斯坦福大学人工智能实验室的director,虽然现在是副教授,但是成绩斐然。他主要是从事机器学习,增强学习相关的研究。公开课《机器学习》的主讲人。主页:http://ai.stanford.edu/~ang/index.html&&Ashutosh Saxena: 康奈尔大学CS学院Assistant professor,他是Andrew Ng的学生。研究领域包含:Artificial Intelligence, Machine Learning, Robotics, Computer Vision。最初接触他是他的Make3D成果,从单幅图片中学习出场景的结构,而且提供源代码。主页是:http://www.cs.cornell.edu/~asaxena/。&Alexei (Alyosha) Efros:CMU的CS学院的副教授。他是UC 伯克利毕业的phd,然后在Oxford呆了一段时间,和多视几何的大牛Andrew Zisserman合作过。他现在的研究方向是CV和CG。&Blocks World Revisited: Image Understanding using Qualitative Geometry and Mechanics&,&Detecting Ground Shadows in Outdoor Consumer Photographs&,等等其他方向都有源代码。主页:http://www.cs.cmu.edu/~efros/&Martial Hebert:CMU的教授,方向是目标的识别,场景的识别,事件监测等等。很多都有源码。主页是:http://www.cs.cmu.edu/~hebert/&Derek Hoiem:UIUC 的CS专业的assistant professor。主要的研究领域是一般的视觉场景理解。他是CMU 机器人实验室Alyosha Efros的学生。&Automatic Photo Pop-up&,&Recovering Occlusion Boundaries&等文章都有源代码,而且经调试发现结果还是不错的。主页:http://www.cs.uiuc.edu/homes/dhoiem/&David Lowe: 加拿大University of British Columbia的教授,著名的图像特征点SIFT的发明者。他主要研究计算机视觉,目标识别,人类视觉的计算模型。他的网页上有目标识别,图像拼接,SIFT图像特征点提取和匹配的源代码。http://www.cs.ubc.ca/~lowe/&James Malcolm:做图像分割和跟踪的,主要是研究水平集的方法进行图像分割和跟踪,图割的方法进行分割等。其中CV图像分割算法和多标号的图割算法由源码。主页是:/&Anat Levin:以色列The Weizmann Institute of Science Rehovot数学计算机系的教授。主要研究领域是中低级的视觉特征应用,以及视觉的识别和监测。其中&Colorization using Optimization&文章有源码。主页:http://www.wisdom.weizmann.ac.il/~levina/&Stephen Gould:澳大利亚国立大学的教授,主攻计算机视觉,machine learning,probalistic graph model 和optimizaiton。突出的贡献是在conditional Markov random fields方向的研究,用于场景的理解和寓意的理解。推出了机器学习和机器视觉的两个软件包Darwin和The STAIR Vision Library。主页:http://users.cecs.anu.edu.au/~sgould/index.html&Mubarak Shah:UCF(University of Central Florida)大学的教授,他是IEEE,AAAS,SPIE,IAPR的Fellow。主要研究方向:video surveillance, visual tracking, human activity recognition, visual analysis of crowded scenes, video registration, UAV video analysis, etc.主页:http://vision.eecs.ucf.edu/faculty/shah.html此贴由 syjman 在
13:08:52 进行编辑...<div class="votes" id="Score
(不得超过 50 个汉字) (输入完内容可以直接按Ctrl+Enter提交)2016第三届物联网大会
智能后视镜产品方案对接会
中国LED智能照明高峰论坛
第三届·无线通信技术研讨会
第二届·中国IoT大会
ETFo智能安防技术论坛
移入鼠标可放大二维码
机器视觉系统设计五大难点
来源:网站整理
作者:David日 10:11
[导读] 工业视觉应用一般分成四大类:定位、测量、检测和识别,其中测量对光照的稳定性要求最高。
  机器视觉系统的组成
  机器视觉系统是指用计算机来实现人的视觉功能,也就是用计算机来实现对客观的三维世界的识别。按现在的理解,人类视觉系统的感受部分是视网膜,它是一个三维采样系统。三维物体的可见部分投影到网膜上,人们按照投影到视网膜上的二维的像来对该物体进行三维理解。所谓三维理解是指对被观察对象的形状、尺寸、离开观察点的距离、质地和运动特征(方向和速度)等的理解。
  机器视觉系统的输入装置可以是摄像机、转鼓等,它们都把三维的影像作为输入源,即输入计算机的就是三维管观世界的二维投影。如果把三维客观世界到二维投影像看作是一种正变换的话,则机器视觉系统所要做的是从这种二维投影图像到三维客观世界的逆变换,也就是根据这种二维投影图像去重建三维的客观世界。
  机器视觉系统主要由三部分组成:图像的获取、图像的处理和分析、输出或显示。
  将近80%的工业视觉系统主要用在检测方面,包括用于提高生产效率、控制生产过程中的产品质量、采集产品数据等。产品的分类和选择也集成于检测功能中。下面通过一个用于生产线上的单摄像机视觉系统,说明系统的组成及功能。
  视觉系统检测生产线上的产品,决定产品是否符合质量要求,并根据结果,产生相应的信号输入上位机。图像获取设备包括光源、摄像机等;图像处理设备包括相应的软件和硬件系统;输出设备是与制造过程相连的有关系统,包括过程控制器和报警装置等。数据传输到计算机,进行分析和产品控制,若发现不合格品,则报警器告警,并将其排除出生产线。机器视觉的结果是CAQ系统的质量信息来源,也可以和CIMS其它系统集成。
  图像的获取
  图像的获取实际上是将被测物体的可视化图像和内在特征转换成能被计算机处理的一系列数据,它主要由三部分组成:
  * 照明
  * 图像聚焦形成
  * 图像确定和形成摄像机输出信号
  1、照明
  照明和影响机器视觉系统输入的重要因素,因为它直接影响输入数据的质量和至少30%的应用效果。由于没有通用的机器视觉照明设备,所以针对每个特定的应用实例,要选择相应的照明装置,以达到最佳效果。
  过去,许多工业用的机器视觉系统用可见光作为光源,这主要是因为可见光容易获得,价格低,并且便于操作。常用的几种可见光源是白帜灯、日光灯、水银灯和钠光灯。但是,这些光源的一个最大缺点是光能不能保持稳定。以日光灯为例,在使用的第一个100小时内,光能将下降15%,随着使用时间的增加,光能将不断下降。因此,如何使光能在一定的程度上保持稳定,是实用化过程中急需要解决的问题。
  另一个方面,环境光将改变这些光源照射到物体上的总光能,使输出的图像数据存在噪声,一般采用加防护屏的方法,减少环境光的影响。
  由于存在上述问题,在现今的工业应用中,对于某些要求高的检测任务,常采用X射线、超声波等不可见光作为光源。但是不可见光不利于检测系统的操作,且价格较高,所以,目前在实际应用中,仍多用可见光作为光源。
  照明系统按其照射方法可分为:背向照明、前向照明、结构光和频闪光照明等。其中,背向照明是被测物放在光源和摄像机之间,它的优点是能获得高对比度的图像。前向照明是光源和摄像机位于被测物的同侧,这种方式便于安装。结构光照明是将光栅或线光源等投射到被测物上,根据它们产生的畸变,解调出被测物的三维信息。频闪光照明是将高频率的光脉冲照射到物体上,照像机拍摄要求与光源同步。
  2、图像聚焦形成
  被测物的图像通过一个透镜聚焦在敏感元件上,如同照像机拍照一样。所不同的是照像机使用胶卷,而机器视觉系统使用传感器来捕捉图像,传感器将可视图像转化为电信号,便于计算机处理。
  选取机器视觉系统中的摄像机应根据实际应用的要求,其中摄像机的透镜参数是一项重要指标。透镜参数分为四个部分:放大倍率、焦距、景深和透镜安装。
  3、图像确定和形成摄像机输出信号
  机器视觉系统实际上是一个光电转换装置,即将传感器所接收到的透镜成像,转化为计算机能处理的电信号、摄像机可以是电子管的,也可是固体状态传感单元。
  电子管摄像机发展较早,20世纪30年代就已应用于商业电视,它采用包含光感元件的真空管进行图像传感,将所接收到的图像转换成模拟电压信号输出。具有RS-170输出制式的摄像机可直接与商用电视显示器相连。
  固体状态摄像机是在20世纪60年代后期,美国贝尔电话实验室发明了电荷耦合装置(CCD),而发展起来的。它上分布于各个像元的光敏二极管的线性阵列或矩形阵列构成,通过按一定顺序输出每个二极管的电压脉冲,实现将图像光信号转换成电信号的目的。输出的电压脉冲序列可以直接以RS-170制式输入标准电视显示器,或者输入计算机的内存,进行数值化处理。CCD是现在最常用的机器视觉传感器。
  图像处理技术
  机器视觉系统中,视觉信息的处理技术主要依赖于图像处理方法,它包括图像增强、数据编码和传输、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后,输出图像的质量得到相当程度的改善,既改善了图像的视觉效果,又便于计算机对图像进行分析、处理和识别。
  1、图像的增强
  图像的增强用于调整图像的对比度,突出图像中的重要细节,改善视觉质量。通常采用灰度直方图修改技术进行图像增强。
  图像的灰度直方图是表示一幅图像灰度分布情况的统计特性图表,与对比度紧密相连。
  通常,在计算机中表示的一幅二维数字图像可表示为一个矩阵,其矩阵中的元素是位于相应坐标位置的图像灰度值,是离散化的整数,一般取0,1,&&,255。这主要是因为计算机中的一个字节所表示的数值范围是0~255。另外,人眼也只能分辨32个左右的灰度级。所以,用一个字节表示灰度即可。
  但是,直方图仅能统计某级灰度像素出现的概率,反映不出该像素在图像中的二维坐标。因此,不同的图像有可能具有相同的直方图。通过灰度直方图的形状,能判断该图像的清晰度和黑白对比度。
  如果获得一幅图像的直方图效果不理想,可以通过直方图均衡化处理技术作适当修改,即把一幅已知灰度概率分布图像中的像素灰度作某种映射变换,使它变成一幅具有均匀灰度概率分布的新图像,实现使图象清晰的目的。
  2、图像的平滑
  图像的平滑处理技术即图像的去噪声处理,主要是为了去除实际成像过程中,因成像设备和环境所造成的图像失真,提取有用信息。众所周知,实际获得的图像在形成、传输、接收和处理的过程中,不可避免地存在着外部干扰和内部干扰,如光电转换过程敏感元件灵敏度的不均匀性、数字化过程的量化噪声、传输过程中的误差以及人为因素等,均会使图像变质。因此,去除噪声,恢复原始图像是图像处理中的一个重要内容。
  3、图像的数据编码和传输
  数字图像的数据量是相当庞大的,一幅512*512个像素的数字图像的数据量为256 K字节,若假设每秒传输25帧图像,则传输的信道速率为52.4M比特/秒。高信道速率意味着高投资,也意味着普及难度的增加。因此,传输过程中,对图像数据进行压缩显得非常重要。数据的压缩主要通过图像数据的编码和变换压缩完成。
  图像数据编码一般采用预测编码,即将图像数据的空间变化规律和序列变化规律用一个预测公式表示,如果知道了某一像素的前面各相邻像素值之后,可以用公式预测该像素值。采用预测编码,一般只需传输图像数据的起始值和预测误差,因此可将8比特/像素压缩到2比特/像素。
  变换压缩方法是将整幅图像分成一个个小的(一秀取8*8或16*16)数据块,再将这些数据块分类、变换、量化,从而构成自适应的变换压缩系统。该方法可将一幅图像的数据压缩到为数不多的几十个特传输,在接收端再变换回去即可。
  4、边缘锐化
  图像边缘锐化处理主要是加强图像中的轮廓边缘和细节,形成完整的物体边界,达到将物体从图像中分离出来或将表示同一物体表面的区域检测出来的目的。它是早期视觉理论和算法中的基本问题,也是中期和后期视觉成败的重要因素之一。
  5、图像的分割
  图像分割是将图像分成若干部分,每一部分对应于某一物体表面,在进行分割时,每一部分的灰度或纹理符合某一种均匀测度度量。某本质是将像素进行分类。分类的依据是像素的灰度值、颜色、频谱特性、空间特性或纹理特性等。图像分割是图像处理技术的基本方法之一,应用于诸如染色体分类、景物理解系统、机器视觉等方面。
  图像分割主要有两种方法:一是鉴于度量空间的灰度阈值分割法。它是根据图像灰度直方图来决定图像空间域像素聚类。但它只利用了图像灰度特征,并没有利用图像中的其它有用信息,使得分割结果对噪声十分敏感;二是空间域区域增长分割方法。它是对在某种意义上(如灰度级、组织、梯度等)具有相似性质的像素连通集构成分割区域,该方法有很好的分割效果,但缺点是运算复杂,处理速度慢。其它的方法如边缘追踪法,主要着眼于保持边缘性质,跟踪边缘并形成闭合轮廓,将目标分割出来;锥体图像数据结构法和标记松弛迭代法同样是利用像素空间分布关系,将边邻的像素作合理的归并。而基于知识的分割方法则是利用景物的先验信息和统计特性,首先对图像进行初始分割,抽取区域特征,然后利用领域知识推导区域的解释,最后根据解释对区域进行合并。
  6、图像的识别
  图像的识别过程实际上可以看作是一个标记过程,即利用识别算法来辨别景物中已分割好的各个物体,给这些物体赋予特定的标记,它是机器视觉系统必须完成的一个任务。
  按照图像识别从易到难,可分为三类问题。第一类识别问题中,图像中的像素表达了某一物体的某种特定信息。如遥感图像中的某一像素代表地面某一位置地物的一定光谱波段的反射特性,通过它即可判别出该地物的种类。第二类问题中,待识别物是有形的整体,二维图像信息已经足够识别该物体,如文字识别、某些具有稳定可视表面的三维体识别等。但这类问题不像第一类问题容易表示成特征矢量,在识别过程中,应先将待识别物体正确地从图像的背景中分割出来,再设法将建立起来的图像中物体的属性图与假定模型库的属性图之间匹配。第三类问题是由输入的二维图、要素图、2&5维图等,得出被测物体的三维表示。这里存着如何将隐含的三维信息提取出来的问题,当是今研究的热点。
  目前用于图像识别的方法主要分为决策理论和结构方法。决策理论方法的基础是决策函数,利用它对模式向量进行分类识别,是以定时描述(如统计纹理)为基础的;结构方法的核心是将物体分解成了模式或模式基元,而不同的物体结构有不同的基元串(或称字符串),通过对未知物体利用给定的模式基元求出编码边界,得到字符串,再根据字符串判断它的属类。这是一种依赖于符号描述被测物体之间关系的方法。
  那么,机器视觉系统设计的难点都有哪些?本文主要总结了一下五点,
  第一:打光的稳定性
  工业视觉应用一般分成四大类:定位、测量、检测和识别,其中测量对光照的稳定性要求最高,因为光照只要发生10-20%的变化,测量结果将可能偏差出1-2个像素,这不是软件的问题,这是光照变化,导致了图像上边缘位置发生了变化,即使再厉害的软件也解决不了问题,必须从系统设计的角度,排除环境光的干扰,同时要保证主动照明光源的发光稳定性。当然通过硬件相机分辨率的提升也是提高精度,抗环境干扰的一种办法了。比如之前的相机对应物空间尺寸是1个像素10um,而通过提升分辨率后变成 1个像素5um,精度近似可以认为提升1倍,对环境的干扰自然增强了。
  第二:工件位置的不一致性
  一般做测量的项目,无论是离线检测,还是在线检测,只要是全自动化的检测设备,首先做的第一步工作都是要能找到待测目标物。每次待测目标物出现在拍摄视场中时,要能精确知道待测目标物在哪里,即使你使用一些机械夹具等,也不能特别高精度保证待测目标物每次都出现在同一位置的,这就需要用到定位功能,如果定位不准确,可能测量工具出现的位置就不准确,测量结果有时会有较大偏差
  第三:标定
  一般在高精度测量时需要做以下几个标定,一光学畸变标定(如果您不是用的软件镜头,一般都必须标定),二投影畸变的标定,也就是因为您安装位置误差代表的图像畸变校正,三物像空间的标定,也就是具体算出每个像素对应物空间的尺寸。
  不过目前的标定算法都是基于平面的标定,如果待测量的物理不是平面的,标定就会需要作一些特种算法来处理,通常的标定算法是解决不了的。
  此外有些标定,因为不方面使用标定板,也必须设计特殊的标定方法,因此标定不一定能通过软件中已有的标定算法全部解决。
  第四:物体的运动速度
  如果被测量的物体不是静止的,而是在运动状态,那么一定要考虑运动模糊对图像精度(模糊像素=物体运动速度*相机曝光时间),这也不是软件能够解决的。
  第五:软件的测量精度
  在测量应用中软件的精度只能按照1/2&1/4个像素考虑,最好按照1/2,而不能向定位应用一样达到1/10-1/30个像素精度,因为测量应用中软件能够从图像上提取的特征点非常少。
机器视觉系统相关文章
机器视觉系统相关下载
机器视觉相关文章
机器视觉相关下载
胡煜华还说,公司需要将重点放在不出纰漏地实行方案,而非进行新的大笔投资。目前,公司具有一体化制造半导体的能力,在中国拥有3家研究中心和18家...
当前我国物联网技术正处于一个快速发展的阶段,家庭自动化、楼宇自动化等智慧环境代表着未来。同样的,一个智能化环境就意味着背后的各种传感器、...
创新实用技术专题
版权所有 & 深圳华强聚丰电子科技有限公司
电信与信息服务业务经营许可证:粤B2-让我们一起来学习机器人视觉引导的相关知识
| 官方视频:
3D视觉组件
机器视觉组件
科学图像组件
ITS及监控组件
联系电话:
您的位置:
> 让我们一起来学习机器人视觉引导的相关知识
让我们一起来学习机器人视觉引导的相关知识
来源: && 日期: && 点击次数:
工业革命为人类社会带来了翻天覆地的变化,让人们走上了机器生产的道路,人们可以解放双手又能够提高工作效率。随着时代的发展与进步,我们的现代化设备的发展也越来越高级了,就是一项比较先进的技术。人类在工作时可以使用自己的双眼来观察,减少工作上的失误,但是机器是没有眼睛的,它是如何进行工作的呢?相信很多人都有这个疑惑。接下来,凌云的专家就来为大家答疑解惑,为您解答机器人视觉引导的作用,希望我们的介绍能够给您带来帮助,也希望大家能够支持凌云企业的发展。
  通常来说,机器设备的运作都是比较单一的,技术人员通过一定的程序设置,使得机器设备能够完成人们一定的动作指示,但是,随着现代化产业的发展,这种单一的设备已经落后了,我们现在需要的就是像机器人视觉引导这类更加高级的技术。
  很多高科技的专业人士对于机器人智能设备的发明与创造可谓是煞费苦心,我们都知道,人是最高级的生物,要想将机器设备打造成高级的全自动机器,其中的难度我们就可想而知了。首先,专业技术人员需要突破的一个难关就是要使机器人具备视觉,使得机器人通过视觉观察对于周围的环境做出判断,从而做出下一步的动作。我们今天要为大家介绍的机器人视觉引导的作用就是使机器设备获得视觉感知。机器人本身是没有视觉系统的,技术人员通过连接机器人末端接触部位将视觉引导系统安装到机器上,与其他的配件共同组合成一个完整的系统。简单的来说,机器人视觉引导就是计算机的工作原理相似,就像扫描一个二维码一样,计算机能够识别出二维码的专有标志,对二维码做出感应,那么机器人视觉引导也是如此。正是这个系统让机器人能够”看得见“。
  以上就是我们对于机器人视觉引导的简单介绍,相信大家对于该方面的知识有了一定的了解了吧。如果大家想要深入的了解该方面的知识,我们建议大家到凌云的官网进行进一步的咨询,凌云的客服人员将会为您详细解答。
相关视觉新闻
地址:北京市海淀区翠湖南环路13号院7号楼知识理性大厦 &邮编:100094
&|版权所有
All rights reserved. 京ICP备号-3
本站关键词:&&&&&
友情链接:、、、如何学习机器视觉?
  很多人问如何学习?哪里有比较好的学习资料?总结了一下各个方向的学习资源总结,也会不定期在公众号里分享一些机器视觉相关内容,希望对有需要的人有帮助,也希望大家能多多交流讨论,共上一层楼。
  如何学习机器视觉?
  1、其实机器视觉涵盖的方向非常广泛,想要学习机器视觉而且以后要从事机器视觉相关工作的各位应该弄清楚自己以后想从事的方向,这一点可以先从相关企业招聘哪些岗位以及岗位要求来进行初步了解。然后针对不同岗位对岗位职责的要求进行学习补充。
  (1)有哪些机器视觉公司?
  可以直接百度搜索机器视觉等关键词,或者进入第三方信息平台:如机器视觉网查看现在的机器视觉公司有哪些
  (2)有哪些岗位
  根据你所找到的机器视觉公司百度查找 公司名称+招聘网站,比如直接搜索“+智联招聘”
  2、对于机器视觉基本概念的了解是必不可少的,因为从大范围大环境下去了解会非常利于你对其他零散知识的整合,也更容易接纳。比如对机器视觉及机器视觉相关词汇在理论上的认识:机器视觉、机器视觉系统、视觉检测,机器视觉技术等这些是什么?有什么作用?可应用在哪些领域?
  3、确定好自己在机器视觉领域的从业方向后,可以分为硬件或软件方向等确认学习目标;
  硬件:工业相机、工控机、线缆、镜头、照明(光源)、采集卡、延长器还有图像处理、视觉处理等其他硬件
  软件:视觉算法包、软件包,可以先去了解下市场上使用比较多的,还有使用的开发平台、编程工具等
  4、知道自己学习的方向并了解如何使用操作是非常重要的!这一点最好有自己动手操作的环境。
  视觉检测:能搭配硬件软件自己拍摄调试,了解其主要功能及调试方式。你能有相关条件跟随一个案例从头跟到尾,从客户提出需求-选型-调试-验收这个过程,了解每一步过程,跟了几个案例后自己就应该会比较清楚了。
  算法编程:先摸索主要流行软件包的主要框架及功能实现模块,再通过看相关书籍,跟随案例实际操作去熟悉。主要还是多学多问。
  以上可能介绍比较粗略,因为不管哪个方向的核心学习方法还是建议去询问在这一方向上比较有经验的人,应该更有成效。OPT(奥普特)是国内机器视觉做的比较好的企业,向学习的人可以去看看网页或者去OPT工作:/
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

我要回帖

更多关于 如何学习机器视觉 的文章

 

随机推荐