實現(xiàn)智能監(jiān)控中圖像識別分析技術的應用
來源:中國數(shù)字音視網(wǎng) 作者:cofee 編輯:數(shù)字音視工程 2010-10-21 00:00:00 加入收藏
實現(xiàn)智能監(jiān)控,各廠家提出了不同的技術方案,但關鍵點都集中于圖像內容分析技術。這是正確的方向,可以說圖像內容分析技術的發(fā)展過程就是智能監(jiān)控的發(fā)展過程。智能監(jiān)控的實現(xiàn)必須有圖像內容分析技術的突破作為支撐。
圖像具有極大的信息量,它同時具有空間分辨和時間分辨的能力,但真正把這些信息提取和挖掘出來是復雜和困難的。圖像系統(tǒng)智能化的主要標志之一是:系統(tǒng)從目視解釋(視讀)走向機器解釋(機讀)。它意味著:視頻監(jiān)控將改變系統(tǒng)對圖像信息不作任何處理的現(xiàn)狀,處理就是對圖像信息自動的解讀,是理解(understanding)圖像,這就是圖像內容分析(videounderstanding)的含義所在?,F(xiàn)在市場上出現(xiàn)了一些IV(intelligentvideo)產(chǎn)品,都是對圖像內容進行基本的分析,如目標的分離、分類、統(tǒng)計,簡單背景下單目標的行為分析和跟蹤。研究機構則把它作為重要的課題,開展深入的研究,國家“十一五”科技攻關就列入了相關的課題。根據(jù)安全的需求,智能監(jiān)控技術的發(fā)展過程或圖像內容分析技術的研究可分為以下幾個階段:
1、將(運動)目標從視頻圖像中分離出來。這是體現(xiàn)圖像技術的優(yōu)勢,實現(xiàn)目標探測的前題。傳統(tǒng)的視頻(運動)探測其實是亮度探測,并沒有發(fā)揮圖像技術的特點。確定圖像中是否有探測目標(人、物等),并將目標從背景圖像中分離出來是圖像內容分析的首要任務,進而對目標分類、統(tǒng)計、關聯(lián)。判斷圖像中有無目標、目標的復合或離散等也是圖像過濾的基礎。
2、對目標進行行為分析,判定其運動的方向、方式,并能發(fā)現(xiàn)和告警異常的行為;產(chǎn)生目標的運動軌跡,并能進行目標的自動跟蹤。實現(xiàn)運動目標的跟蹤是很難的事,它要求系統(tǒng)能分析、預測目標的運動軌跡,并能實時地作出修正。同時,由于運動過程與伺服機構間傳遞函數(shù)的非線性,伺服系統(tǒng)也是很復雜的。
3、在復雜環(huán)境下實現(xiàn)目標的分離、行為分析和運動跟蹤,特別是實現(xiàn)多目標的跟蹤。上述兩點目前已有產(chǎn)品和應用,但基本上在簡單環(huán)境下,針對少數(shù)目標的情況。在復雜環(huán)境(既通常的視頻監(jiān)控環(huán)境)下實現(xiàn)這些功能,是圖像內容分析技術具有真正應用價值的關鍵。同時、解決多個圖像的綜合分析,圖像間目標的關聯(lián),目標跟蹤的連續(xù)。這都是市場迫切需要,目前還沒有解決的問題。
4、實現(xiàn)視頻語義的解析,圖像內容分析的最高層次。通過對一個圖像序列作出分析,得出其包含的真實信息,可以與話音的語義解析(已有了初步的成果)結合起來,逐步實現(xiàn)視頻語義的解析,如通過對大量的、多渠道的圖像資料的分析,得出社會對某一事件的反映程度;分析和統(tǒng)計某類事件發(fā)生,發(fā)展的規(guī)律(概率及時間、地域分布等)。能夠進行這樣分析,表明機器具有了與人一樣的理解圖像的能力,但具有人所不能達到的效率。這個過程是逐步發(fā)展、與時俱進的,沒有終極的結果。實現(xiàn)智能監(jiān)控的目標,要經(jīng)過不斷的技術積累,特別是核心技術的突破,它需要一個過程,不可能一蹴而就,認為監(jiān)控技術智能化已經(jīng)實現(xiàn)的觀點是不確切的。
圖像識別技術在安防系統(tǒng)中應用前景是非常廣闊的,也是安防系統(tǒng)智能化的一個主要方向。圖像識別的主要應用首先要明確圖像識別是指采用圖像技術對目標的個體識別,如認定某一個人,找到某一輛車或某一件物。以圖像生物特征識別為例,就是采用圖像(模式識別)技術識別人體自身載有的、具有唯一性和相對穩(wěn)定性的特征(如人臉、視網(wǎng)膜、虹膜、指紋、掌紋/形及步態(tài)等),確定個體的身份。
評論comment