AI人工智能 概述
计算机视觉涉及使用计算机软件和硬件建模和复制人类视觉。 在本章中,我们将详细地学习。
计算机视觉
计算机视觉是一门学科,根据场景中存在的结构特性,研究如何从 2D 图像重构,中断和理解 3D 场景。
计算机视觉层次结构
计算机视觉分为以下三个基本类别 -
- 低级视觉 - 它包括用于特征提取的过程图像。
- 中级视觉 - 它包括物体识别和 3D 场景解释
- 高级视觉 - 它包括对活动,意图和行为等场景的概念性描述。
计算机视觉与图像处理
图像处理将图像转换为图像。 图像处理的输入和输出都是图像。
计算机视觉是从其图像中构建对物理对象的明确而有意义的描述。 计算机视觉的输出是 3D 场景中结构的描述或解释。
应用 计算机视觉在以下领域中应用 -
- 机器人领域
- 本地化 - 自动确定机器人位置
- 导航
- 避免障碍
- 装配(插入孔,焊接,喷漆)
- 操作(例如 PUMA 机器人操作器)
- 人机器人交互(HRI):智能机器人与人交互和服务
- 医学领域
- 分类和检测(例如病变或细胞分类和肿瘤检测)
- 2D/3D 分割
- 3D 人体器官重建(MRI或超声波)
- 视觉引导的机器人手术
- 安全领域
- 生物识别技术(虹膜,指纹,脸部识别)
- 监视 - 检测某些可疑的活动或行为
- 运输
- 自主车辆
- 安全,例如驾驶员警惕性监控
- 工业自动化应用
- 工业检查(缺陷检测)
- 部件
- 条码和包装标签阅读
- 对象排序
- 文件理解(例如 OCR)
安装有用的包
对于使用 Python 的计算机视觉,您可以使用名为 OpenCV(开源计算机视觉)的流行库。 它是一个主要针对实时计算机视觉的编程功能库。 它用 C++ 编写,其主要接口是 C++。 可以借助以下命令来安装此软件包 -
pip install opencv_python-X.X-cp36-cp36m-winX.whl
这里X代表示机器上安装的Python版本,以及所拥有的 win32 或 64 位版本。
如果您使用的是 anaconda 环境,请使用以下命令安装 OpenCV -
conda install -c conda-forge opencv