目標檢測
基本概念
計算機視覺(jué)中關(guān)于圖像識別有四大類(lèi)任務(wù):
- 分類(lèi)-Classification:解決“是什么?”的問(wèn)題,即給定一張圖片或一段視頻判斷里面包含什么類(lèi)別的目標。
- 定位-Location:解決“在哪里?”的問(wèn)題,即定位出這個(gè)目標的的位置。
- 檢測-Detection:解決“是什么?在哪里?”的問(wèn)題,即定位出這個(gè)目標的的位置并且知道目標物是什么。
- 分割-Segmentation:分為實(shí)例的分割(Instance-level)和場(chǎng)景分割(Scene-level),解決“每一個(gè)像素屬于哪個(gè)目標物或場(chǎng)景”的問(wèn)題。
目標檢測算法分類(lèi)
Two stage目標檢測算法
先進(jìn)行區域生成(region proposal,RP)(一個(gè)有可能包含待檢物體的預選框),再通過(guò)卷積神經(jīng)網(wǎng)絡(luò )進(jìn)行樣本分類(lèi)。
任務(wù):特征提取—>生成RP—>分類(lèi)/定位回歸。
常見(jiàn)的two stage目標檢測算法有:R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN和R-FCN等。
R-CNN
標題:《Rich feature hierarchies for accurate object detection and semantic segmentation》
時(shí)間:2014
出版源:CVPR 2014
主要鏈接:
- arXiv:http://arxiv.org/abs/1311.2524
- github(caffe):https://github.com/rbgirshick/rcnn
2.One stage目標檢測算法
不用RP,直接在網(wǎng)絡(luò )中提取特征來(lái)預測物體分類(lèi)和位置。
任務(wù):特征提取—>分類(lèi)/定位回歸。
常見(jiàn)的one stage目標檢測算法有:OverFeat、YOLOv1、YOLOv2、YOLOv3、SSD和RetinaNet等。

0 評論