??低曉赑ASCAL VOC目標(biāo)檢測中奪冠 刷新世界紀(jì)錄
來源:數(shù)字音視工程網(wǎng) 編輯:郭雨婷 2016-09-28 09:52:02 加入收藏
(數(shù)據(jù)來源:http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 )
PASCAL VOC目標(biāo)檢測任務(wù)囊括了車、人、貓、狗等20類常見目標(biāo)。訓(xùn)練樣本較少、場景變化多端,非常具有挑戰(zhàn)性。提到奪冠之道,海康威視研究院常務(wù)副院長浦世亮表示:“我們的預(yù)研團(tuán)隊基于Faster R-CNN深度學(xué)習(xí)目標(biāo)檢測算法,通過調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)、上下文建模、優(yōu)化訓(xùn)練和預(yù)測等策略,大幅提升了檢測性能。研究成果可以應(yīng)用到視頻監(jiān)控的車輛檢測、車牌識別、人體檢測、人體屬性分析、視頻結(jié)構(gòu)化等產(chǎn)品中,將大幅提升產(chǎn)品性能與應(yīng)用效果。長遠(yuǎn)來看,在智能安全監(jiān)控、汽車輔助駕駛、智能交通感知、視頻語義理解、機(jī)器人和無人機(jī)等各方面都有著巨大的應(yīng)用價值。”
PASCAL VOC可謂視覺識別類競賽的鼻祖,是由利茲大學(xué)、蘇黎世聯(lián)邦理工學(xué)院、愛丁堡大學(xué)、微軟、牛津大學(xué)等組織的一個視覺識別競賽,包含了物體分類、目標(biāo)檢測、圖像分割等任務(wù)。PASCAL VOC對計算機(jī)視覺的發(fā)展具有深遠(yuǎn)而巨大的影響,后續(xù)的ImageNet競賽的任務(wù)設(shè)置就基本沿用了它的設(shè)定。此前,微軟、英特爾、CMU、Facebook、UC Berkeley等國際頂尖研發(fā)團(tuán)隊先后在這個排行榜上刷新紀(jì)錄。
海康威視研究院由智能分析、大數(shù)據(jù)技術(shù)、感知技術(shù)和多媒體技術(shù)等專業(yè)團(tuán)隊組成,突出在音視頻技術(shù)的專注和積累,著重研究視音頻的智能算法、大數(shù)據(jù)的分析、挖掘和計算,同時針對新的圖像傳感器等感知技術(shù),視頻的播放技術(shù),人機(jī)交互等多媒體技術(shù)進(jìn)行深入研究。目前在??低曆芯吭罕姸囝I(lǐng)域的研究都走在行業(yè)前列,2015年,海康威視研究院在KITTI的評測中,車輛檢測和車頭朝向估計兩項任務(wù)評分均排名世界第一;在MOT Challenge算法測評中獲得“計算機(jī)視覺的多目標(biāo)跟蹤算法”世界第一;名列TRECVID2016 SED第二名、PASCAL VOC 2012圖像分割任務(wù)第二名。
評論comment