行业动态
机器视觉需要突破的问题有哪些?
浏览:1383 次
时间:2016-03-31 11:00:35

        从属性上讲,视觉是所有感觉中最为直观地反映事物特性的官能。而事物的特性所包含的方面就足够多了:面积,长度,数量,颜色,光照,纹理,运动,静止,分割,趋势等等。所以这也就决定了机器视觉所要关注的方向和领域是全方面的。

        所以,从底层来讲,机器视觉第一个问题或者说要有所突破的首先要关注底层视觉与感知。也就是东西的外在。这其中复杂的数据量,冗余的各类信息,都需要尽可能多的捕捉到。所以高性能的CCD或者CMOS感光元件还需要有进一步发展,相对来说更精确的检测元件也是十分必要的,要保证能够获得高精确度和高对比度的图像和底层视觉感知数据。毕竟只有底层完整的采样才能有后一步的识别检测和建模。硬件的精度始终是机器视觉领域的敲门砖

        第二个重要方面是在完整的底层采样之后,基于图像的物理建模,和数学建模不同的是,基于图像的物理建模涉及到立体视觉与运动结构的重构,这里面不仅仅是构建一个普适性算法的问题,可能还需要立体结构学,神经生物学,心理物理学,数据统计学科等多学科的交叉。比如苹果iPhone5S当下最热的指纹识别,也是首先由元件采集指纹信息,然后构建物理模型。而其中神经生物学知识必不可少。往更广层面上讲,医疗图像分析、智能交通的空间动态管理、大型构件的光电检测等等,凡是基于图像的机器视觉问题,都需要建立相关的物理模型,此间千变万化的库变化需要有更高效、更普适性的算法与数据结构的支撑。软件的高效与普适决定机器视觉的广度

        第三个问题是精确识别与模糊特征的智能取舍。理论上有高精度的硬件与高效的算法,机器视觉相对来说就能到达一个很高的适用度。但是机器与人类的差异在于智能的判断,也就是在精确识别与模糊特征之间进行智能取舍。举一个简单的例子,如果以人眼视觉识别,20岁的熟人与21岁的同一熟人的差异不足以让你将他拒之门外。因为你智能地摒弃了两者之间的模糊差异。而如果这扇门是一个机器视觉识别系统的话,复杂而庞大的信息流在精确识别与计算的前提下足以分辨20岁的你与21岁的你的差异,而这点差异可能会拒熟人于门外。这也是机器始终只是机器的原因。精确识别与模糊特征的取舍反映机器视觉是否智能。

        最后一个问题也是人工智能领域长期的困扰,经历了符号主义学派、行为主义学派、连接主义学派等一系列的发展但都没有找到令人满意的答案。如陈东岳老师所说,目前较新的思想认为应该从分析、了解和模拟人类大脑的信息处理功能去构建智能机器视觉系统,但神经科学的发展目前只能做到了解和模拟大脑的一个局部,所以其他学科的发展与交叉也从某种意义上决定和推动着机器视觉的发展。比如控制科学与工程领域有一个重要的方向就是生物神经网络与模糊系统。

        综合来说,机器视觉短期内还只能是特定领域的高效技术而已,虽然这一技术的想象空间巨大,但是要能“超乎技近乎道”还是有相当长的距离。

京ICP备14006130号-1
北京市海淀区上地信息路1号国际科技创业园1—1705
© Copyright 2011 北京萨尔笛科技 All rights reserved.