问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

计算机视觉(CV)的发展史

创作时间:
作者:
@小白创作中心

计算机视觉(CV)的发展史

引用
1
来源
1.
https://aijishu.com/a/1060000000460036

计算机视觉是人工智能领域的重要分支,近年来在图像识别、自动驾驶、医疗诊断等多个领域展现出巨大潜力。本文将带你回顾计算机视觉从诞生到繁荣的完整历程,了解这一技术如何一步步发展至今。

1. 20世纪50年代:二维图像分析与识别的开端

1959年,神经生理学家David Hubel和Torsten Wiesel通过猫的视觉实验,发现视觉处理过程总是从类似特定方向边缘的这类简单结构开始,这一发现为40年后计算机视觉技术的突破性发展奠定了基础,也成为了深度学习的核心准则之一。


图片来源:https://www.sohu.com/a/302537186_114877

同年,Russell和他的同学研制出了第一台数字图像扫描仪,这台仪器能够将图片转化为二进制机器可理解的灰度值,为后续的数字图像处理奠定了基础。这一时期的研究主要集中在光学字符识别、工件表面、显微图片和航空图片的分析与解释。

2. 20世纪60年代:三维视觉理解的开创

1965年,Lawrence Roberts在论文《三维固体的机器感知》中描述了从二维图片中推导三维信息的过程,这一工作被视为现代计算机视觉的先驱之一,开创了以理解三维场景为目标的计算机视觉研究。他对积木世界的创造性研究为后续研究提供了重要启发。


图片来源:https://www.sohu.com/a/84165588_297710

1966年,MIT AI实验室的Seymour Papert教授启动了夏季视觉项目,尽管最终未能成功,但这一尝试标志着计算机视觉作为一门科学领域的正式诞生。同年,贝尔实验室的Willard S. Boyle和George E. Smith研发的电荷耦合器件(CCD)成为高质量数字图像采集的重要工具,推动了计算机视觉在工业领域的应用。

3. 20世纪70年代:课程开设与理论体系的形成

70年代中期,麻省理工学院(MIT)AI实验室正式开设计算机视觉课程。1977年,David Marr在MIT AI实验室提出了计算机视觉理论,这一理论与Lawrence Roberts的积木世界分析方法截然不同,为80年代的计算机视觉研究提供了重要理论框架。

4. 20世纪80年代:独立学科的形成与理论应用

1980年,日本计算机科学家Kunihiko Fukushima基于Hubel和Wiesel的研究,建立了首个自组织的人工神经网络——Neocognitron,这是现代卷积神经网络(CNN)的早期雏形。1982年,David Marr发表的《视觉》一书,标志着计算机视觉成为一门独立学科。


图片来源:https://www.sohu.com/a/84165588_297710

1982年,日本COGEX公司生产的视觉系统DataMan是世界第一套工业光学字符识别(OCR)系统。1989年,Yann LeCun将后向传播学习算法应用于Fukushima的卷积神经网络结构,开发了LeNet-5,这是现代CNN的重要里程碑。

5. 20世纪90年代:特征对象识别的兴起

1997年,伯克利教授Jitendra Malik提出了基于图论算法的图像分割方法。1999年,David Lowe发表的《基于局部尺度不变特征(SIFT特征)的物体识别》标志着研究重点从三维模型重建转向基于特征的对象识别。同年,Nvidia公司推出的GPU概念为图像处理提供了强大算力支持。

6. 21世纪初:图像特征工程与高质量数据集的出现

2001年,Paul Viola和Michael Jones推出了首个实时工作的人脸检测框架。2005年,Dalal & Triggs提出的HOG特征被广泛应用于行人检测。2006年,Pascal VOC项目启动,提供了标准化的对象分类数据集和评估工具。

2006年左右,Geoffrey Hinton及其学生发明了用GPU优化深度神经网络的方法,并首次提出了“深度学习”的概念。2009年,Felzenszwalb教授提出的Deformable Parts Model(DPM)成为深度学习时代前最成功的物体检测与识别算法。

7. 2010年至今:深度学习的广泛应用与突破

2009年,李飞飞教授发布的ImageNet数据集成为计算机视觉领域的重要里程碑。2012年,Alex Krizhevsky等人开发的AlexNet在ImageNet挑战赛中取得突破性成果,将错误率从25%降低至16%,展示了CNN的强大能力。


图片来源:http://cs231n.stanford.edu/

2014年,蒙特利尔大学提出的生成对抗网络(GAN)成为计算机视觉领域的重大突破。近年来,PyTorch和TensorFlow等深度学习框架的成熟,以及各大科技公司对计算机视觉领域的投入,推动了技术的快速发展和广泛应用。

从20世纪中期至今,计算机视觉经历了从二维到三维、从理论到应用的快速发展。随着高质量视觉数据的不断积累,这一技术将在更多领域展现出其独特价值。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号