计算机视觉导读

本文记录计算机视觉的学习笔记。理论部分参考 Computer Vision: Algorithms and Applications, 2nd Edition 1计算机视觉理论与实践 2;实践部分参考 动手学深度学习 3

计算机视觉 (Computer Vision, CV) 是一个人工智能研究领域,主要利用「图像、视频」等数据解决「预测、生成」等下游任务。内容编排逻辑如下:

  1. 第一部分:介绍 图像分类 任务,即给定一张图像,输出图像的类别标签;
  2. 第二部分:介绍 目标检测 任务,即给定一张图像,框选出图像中的目标、目标类别标签、目标类别置信度;
  3. 第三部分:介绍 图像超分 任务,即给定一张图像,将其放大并尽可能降低因为放大带来的模糊度;
  4. 第四部分:介绍 视频理解 任务,即给定一个视频,完成动作识别、时序动作检测、时序动作分割等任务。
课程考核说明

课程分数分布:考勤 5%,作业 10%,实验 10%,大作业 25%,期末 50%。 期末考试说明 期末考试范围