圖像識別技術(shù)的具體行業(yè)應(yīng)用

來源：數(shù)字音視工程網(wǎng) 編輯：merry2013 2015-07-07 06:54:54 加入收藏咨詢

咨詢

所在單位:	*
姓名:	*
手機(jī):	*
職位:
郵箱:	*
其他聯(lián)系方式:
咨詢內(nèi)容:
驗(yàn)證碼:	不能為空驗(yàn)證碼錯(cuò)誤

確定

近一兩年來，人工智能領(lǐng)域得到了媒體界、產(chǎn)業(yè)界和學(xué)術(shù)界等前所未有的關(guān)注，大家一致認(rèn)為智能化時(shí)代正在到來，機(jī)器正在越來越多的取代人類特有的優(yōu)勢和技能，...

　　近一兩年來，人工智能領(lǐng)域得到了媒體界、產(chǎn)業(yè)界和學(xué)術(shù)界等前所未有的關(guān)注，大家一致認(rèn)為智能化時(shí)代正在到來，機(jī)器正在越來越多的取代人類特有的優(yōu)勢和技能，而其中最為重要的可能就是圖像識別技術(shù)。

　　1、圖像識別是重要的人工智能分支

　　圖像識別是計(jì)算機(jī)對圖像進(jìn)行處理、分析和理解，以識別各種不同模式的目標(biāo)和對像的技術(shù)。簡單來說，就是讓機(jī)器能夠通過對感知信息的處理像人類一樣讀懂圖片的內(nèi)容，而不是只看到像素。目前，伴隨著圖片成為互聯(lián)網(wǎng)中的主要信息載體，難題隨之出現(xiàn)。當(dāng)信息由文字記載時(shí)，我們可以通過關(guān)鍵詞搜索輕易找到所需內(nèi)容并進(jìn)行任意編輯，而當(dāng)信息是由圖片記載時(shí)，我們卻無法對圖片中的內(nèi)容進(jìn)行檢索，從而影響了我們從圖片中找到關(guān)鍵內(nèi)容的效率。圖片給我們帶來了快捷的信息記錄和分享方式，卻降低了我們的信息檢索效率。在這個(gè)環(huán)境下，計(jì)算機(jī)的圖像識別技術(shù)就顯得尤為重要。

　　計(jì)算機(jī)視覺有著廣泛應(yīng)用，其中包括，醫(yī)療成像分析被用來提高疾病的預(yù)測、診斷和治療;人臉識別被Facebook用來自動(dòng)識別照片里的人物;在安防及監(jiān)控領(lǐng)域被用來指認(rèn)嫌疑人;在購物方面，消費(fèi)者現(xiàn)在可以用智能手機(jī)拍攝下產(chǎn)品以獲得更多購買選擇。

　　我們在圖像識別領(lǐng)域的研究有著眾多突破性進(jìn)展，F(xiàn)acebook人工智能負(fù)責(zé)人YannLeCun發(fā)明的卷積神經(jīng)網(wǎng)絡(luò)促使整個(gè)人工智能領(lǐng)域在近期出現(xiàn)了快速發(fā)展，而其最重要的應(yīng)用就是圖像識別和語音識別。2012年一支由吳恩達(dá)領(lǐng)導(dǎo)的谷歌團(tuán)隊(duì)展示了一個(gè)無監(jiān)督學(xué)習(xí)的機(jī)器對數(shù)百萬張YouTube視頻圖像的分析。這個(gè)機(jī)器學(xué)會(huì)了給它見過的常見物體進(jìn)行分類，包括人類面孔和(供網(wǎng)民娛樂的)貓，包括網(wǎng)上隨處可見的各種動(dòng)作：睡著的、跳躍的、玩滑板的。人類沒有在這些視頻上標(biāo)明包含「面孔」或「貓」的字眼。相反，機(jī)器在看了每個(gè)物體不計(jì)其數(shù)的例子后簡單斷定，它們表現(xiàn)出來的統(tǒng)計(jì)模式已經(jīng)具備了足夠的普遍性，從而可以將這些物體進(jìn)行分類。斯坦福大學(xué)Andrej Karpathy和李飛飛發(fā)表的論文描述了一個(gè)計(jì)算機(jī)視覺系統(tǒng)可以標(biāo)出一個(gè)給定圖像的特殊部分。例如給它看一個(gè)早餐桌子，它可以識別出餐叉、香蕉片、一杯咖啡和桌子上的花以及桌子本身。它甚至可以在場景中用自然英語做出描述——盡管這項(xiàng)技術(shù)還不是特別完美。

　　2、應(yīng)用場景決定著圖像識別技術(shù)的普及程度

　　MIT 宇宙學(xué)家Max Tegmark說，人工智能的運(yùn)作已處于走出實(shí)驗(yàn)室進(jìn)入社會(huì)的階段了。我們目前確實(shí)看到甚至使用到了許多人工智能服務(wù)和產(chǎn)品，比如說更好的搜索引擎服務(wù)，語音助手等等。在和圖像識別技術(shù)有關(guān)的細(xì)分領(lǐng)域，這樣的服務(wù)和產(chǎn)品也非常多，比如說以圖搜圖、圖像對比、人臉識別、圖像自動(dòng)分類，等等。但我們雖然看到了如此多的產(chǎn)品或功能，但卻沒有發(fā)現(xiàn)將圖像識別進(jìn)行通用化的應(yīng)用。許多國內(nèi)外的創(chuàng)業(yè)公司，甚至是科技巨頭在圖像識別領(lǐng)域也沒有找到最具爆發(fā)性和發(fā)展前景的應(yīng)用方向。這其中的原因就在于應(yīng)用場景的缺失。

　　人工智能的發(fā)展和成熟取決于三個(gè)要素，算法、大數(shù)據(jù)和應(yīng)用場景。不論是創(chuàng)業(yè)公司，還是科技巨頭，他們都會(huì)在算法上給予足夠多的重視，會(huì)花費(fèi)大量人力和財(cái)力進(jìn)行算法和模型和研發(fā)。其次，得益于互聯(lián)網(wǎng)、社交媒體、移動(dòng)設(shè)備和廉價(jià)的傳感器，這個(gè)世界產(chǎn)生的數(shù)據(jù)量急劇增加。隨著對這些數(shù)據(jù)的價(jià)值的不斷認(rèn)識，用來管理和分析數(shù)據(jù)的新技術(shù)也得到了發(fā)展。大數(shù)據(jù)是人工智能發(fā)展的助推劑，這是因?yàn)橛行┤斯ぶ悄芗夹g(shù)使用統(tǒng)計(jì)模型來進(jìn)行數(shù)據(jù)的概率推算，比如圖像、文本或者語音，通過把這些模型暴露在數(shù)據(jù)的海洋中，使它們得到不斷優(yōu)化，或者稱之為“訓(xùn)練”——現(xiàn)在這樣的條件隨處可得。

　　百度科學(xué)家吳恩達(dá)曾把算法和數(shù)據(jù)比作火箭的發(fā)動(dòng)機(jī)和燃料，只有這兩者實(shí)現(xiàn)良好互補(bǔ)，人工智能這架火箭才能升空。這也是目前所有人工智能領(lǐng)域內(nèi)公司所重點(diǎn)關(guān)注的兩大方面，但是，大家容易忽略對人工智能起決定性作用的第三個(gè)因素——應(yīng)用場景。主要的原因在于，我們對于人工智能終極目標(biāo)是創(chuàng)造出一個(gè)在綜合智力水平方面能夠媲美人類的機(jī)器，但這樣一個(gè)略帶科幻色彩的目標(biāo)很難用來指導(dǎo)我們的具體工作，甚至可能會(huì)影響該領(lǐng)域的健康發(fā)展。當(dāng)回歸到人工智能的具體應(yīng)用時(shí)，我們應(yīng)該忘掉那個(gè)終極目標(biāo)，尊重一種循序漸進(jìn)的發(fā)展過程，注重人工智能技術(shù)的階段性進(jìn)步和各個(gè)行業(yè)的細(xì)分化應(yīng)用。而目前的科技巨頭在互聯(lián)網(wǎng)時(shí)代都是以面向大眾的通用型產(chǎn)品為主，比如說搜索引擎，或者操作系統(tǒng)，等等。因此，他們在一定程度上缺乏某些具體行業(yè)的積累和經(jīng)驗(yàn)，很難發(fā)掘出特定行業(yè)的潛在需求和人工智能技術(shù)在此領(lǐng)域的具體應(yīng)用。同時(shí)，相較于隱藏在背后的行業(yè)解決方案，將人工智能技術(shù)應(yīng)用在普遍的民用產(chǎn)品能夠起到更好的推廣效果和教育意義。

　　3、圖像識別技術(shù)的引爆點(diǎn)在于具體行業(yè)的解決方案

　　上文提到，大多數(shù)公司對應(yīng)用場景的忽視影響了人工智能技術(shù)在各個(gè)領(lǐng)域的普及，而對于圖像識別技術(shù)來說更是如此，該技術(shù)作為一種認(rèn)知計(jì)算技術(shù)，需要特定的應(yīng)用環(huán)境作為支撐，我們希望機(jī)器像人類一樣看懂外部世界，來代替我們做出決策，這和機(jī)器所處的具體環(huán)境密切相關(guān)，因此，在特定行業(yè)積累了豐富經(jīng)驗(yàn)，深入了解該行業(yè)的需求，然后再利用圖像識別技術(shù)來解決這些需求，將先進(jìn)的技術(shù)作為整體解決方案的一部分，這樣才能真正拓展圖像識別技術(shù)的應(yīng)用范圍，真正解決我們的具體問題，而不是僅作為一個(gè)轉(zhuǎn)瞬即逝的噱頭。

　　不管是在人工智能領(lǐng)域，還是在細(xì)分化的圖像識別領(lǐng)域，在從技術(shù)向?qū)嶋H應(yīng)用的轉(zhuǎn)化過程中有兩個(gè)路徑，第一是走通用化路線，即這項(xiàng)技術(shù)能夠滿足各個(gè)行業(yè)個(gè)各種用戶的需求，比如說，IBM推出的Watson開放計(jì)劃，目前已經(jīng)將這臺智能計(jì)算機(jī)應(yīng)用在了金融、醫(yī)療和客戶管理等方面。許多圖像識別領(lǐng)域的科技巨頭和創(chuàng)業(yè)公司也旨在將圖像識別技術(shù)落地到通用型應(yīng)用中。這是人工智能一種自上而下的應(yīng)用路徑。這樣的趨勢不可更改，未來任何機(jī)器和智能設(shè)備都需要「視覺」，但問題在于，目前的圖像識別技術(shù)可能還沒有達(dá)到這樣一個(gè)「奇點(diǎn)」。這也就是目前大多數(shù)圖像識別技術(shù)公司沒有找到最佳的應(yīng)用方向的原因之一。這就引出來第二條路徑，即根據(jù)現(xiàn)有的圖像識別技術(shù)水平，結(jié)合具體行業(yè)的應(yīng)用場景，從解決行業(yè)的需求出發(fā)，來實(shí)現(xiàn)需求和技術(shù)良好結(jié)合的最佳狀態(tài)。比如說，自動(dòng)駕駛汽車、機(jī)器人廚房、刷臉支付、遠(yuǎn)程人臉認(rèn)證辦理銀行和證券業(yè)務(wù)，等等。

　　從這方面來說，某些在特定行業(yè)有著深厚積累的公司反而具備了一定優(yōu)勢。比如說位于蘇州的科達(dá)公司，該公司自十幾年前進(jìn)入了安防監(jiān)控領(lǐng)域，與面向大眾的互聯(lián)網(wǎng)科技公司相比，其可能不為人熟知，看起來也沒有那么酷。但該公司自2006年就開始了對圖像識別技術(shù)的布局和研發(fā)。而他們切入圖像識別技術(shù)領(lǐng)域的原因是在于他們在安防領(lǐng)域的客戶提出的越發(fā)智能化的需求。正是這種行業(yè)積累和公司基因決定了他們能夠站在特定行業(yè)的最前沿，然后將圖像識別技術(shù)應(yīng)用在用戶的具體需求上。

　　2014年底，科達(dá)推出了一種全新攝像機(jī)品類——感知型攝像機(jī)，通過他們的產(chǎn)品案例，我們可以大體了解到圖像識別技術(shù)和具體行業(yè)需求相結(jié)合的重要性。

　　影像技術(shù)的出現(xiàn)幫我們極大提到了采集信息和存儲信息的效率，但同時(shí)卻嚴(yán)重影響了我們分析信息的效率，當(dāng)無法從海量數(shù)據(jù)中提取出有價(jià)值的東西時(shí)，就失去了我們當(dāng)初采集數(shù)據(jù)的意義。而圖像識別技術(shù)的出現(xiàn)就是要解決這個(gè)矛盾。對于安防監(jiān)控領(lǐng)域來說同樣如此，我們布置了越來越多的攝像頭才采集信息，但最終卻發(fā)現(xiàn)，雖然我們看似獲得了海量數(shù)據(jù)，但是數(shù)據(jù)處理能力，我們從海量數(shù)據(jù)中發(fā)掘出有價(jià)值的信息的能力，卻依然取決于監(jiān)控屏后面的人類視覺，而這種矛盾催生了視頻分析和智能監(jiān)控的出現(xiàn)。而由于成本的原因，對視頻的智能分析技術(shù)也逐漸從服務(wù)器遷移到了攝像頭端，這被稱為智能攝像頭。目前市場上的智能攝像頭主要定位于警戒線、區(qū)域看防等報(bào)警類應(yīng)用不同，而科達(dá)感知型攝像機(jī)(Intelligent IPC)能夠基于視頻的智能分析，識別出監(jiān)控畫面中的內(nèi)容，并對其進(jìn)行語義描述和最佳圖片抓拍，同時(shí)基于后端的大數(shù)據(jù)平臺進(jìn)行更加深入的數(shù)據(jù)挖掘。

　　下面將通過具體的三種智能攝像機(jī)來說明一下應(yīng)用場景：

　　1)特征分析攝像機(jī)

　　主要是針對視野范圍較大場景中人、車、物混行場景的運(yùn)動(dòng)目標(biāo)識別與抓拍。中國國情下的城市道路與路口，是人、機(jī)動(dòng)車、非機(jī)動(dòng)混行的復(fù)雜環(huán)境，同時(shí)又是公共安全的防治重點(diǎn)。特征分析攝像機(jī)正是為這一場景所設(shè)計(jì)，它能綜合性識別人車分類、顏色、方向等基本特征信息，再開展圖像識別的專業(yè)應(yīng)用，最典型的就是將這些信息提供給大數(shù)據(jù)庫平臺進(jìn)行車或人的以圖搜圖與分析判斷，以進(jìn)一步鎖定相似的犯罪嫌疑人與車輛。

　　2)人員卡口攝像機(jī)

　　識別人員及細(xì)節(jié)信息，包括人臉及全身(正面與背面)、性別、年齡、服裝、行走方向、顏色。應(yīng)用場景為：嫌疑犯已被鎖定，并確定藏匿在某小區(qū)。公安傳統(tǒng)的偵查手段是派若干警力在該小區(qū)人工蹲守，對每一個(gè)進(jìn)出人員進(jìn)行辨認(rèn)與判斷是否嫌疑人?，F(xiàn)在，人員卡口攝像機(jī)就可以完全代替警方人工蹲守——它自動(dòng)識別每個(gè)人的臉部與全身信息并抓拍最佳照片提交給平臺，平臺實(shí)時(shí)即可自動(dòng)進(jìn)行比對分析，然后按相似度百分比將嫌疑人排名并發(fā)出警告，嫌疑人信息均實(shí)時(shí)傳送至現(xiàn)場待命警察，現(xiàn)場進(jìn)一步明確后即實(shí)施抓捕。

　　3)車輛卡口攝像機(jī)

　　識別車輛細(xì)節(jié)信息，包括車牌、車型、車標(biāo)、車身顏色、行駛方向、速度。典型應(yīng)用是：30起連環(huán)盜竊案，作案車輛在不同地點(diǎn)使用不同假車牌。車輛卡口攝像機(jī)記錄下每個(gè)案發(fā)地所有車輛細(xì)節(jié)信息并抓拍最佳照片，再向大數(shù)據(jù)平臺分別提供文字描述類的結(jié)構(gòu)化數(shù)據(jù)和視頻、照片類非結(jié)構(gòu)化數(shù)據(jù)。平臺會(huì)對這幾百萬甚至上千萬條結(jié)構(gòu)化數(shù)據(jù)進(jìn)行比對分析，并將碰撞出30個(gè)案發(fā)地外形相似的所有車輛，提供這些車輛的詳細(xì)信息并關(guān)聯(lián)相應(yīng)的照片與視頻。

　　上文提到，人工智能的發(fā)展需要算法、大數(shù)據(jù)和應(yīng)用場景的共同支撐，科達(dá)除了具有圖像識別技術(shù)的感知攝像頭之外，還擁有后端的大數(shù)據(jù)分析平臺。拿和安防監(jiān)控密切相關(guān)的智慧城市來說，在公共安全和智能交通領(lǐng)域，海量的視頻數(shù)據(jù)是最主要的行業(yè)特征，于是，大數(shù)據(jù)，成為這兩大行業(yè)視頻應(yīng)用中最急需引入的技術(shù)。通過與智慧城市大數(shù)據(jù)平臺的結(jié)合，科達(dá)感知型攝像機(jī)(Intelligent IPC)已經(jīng)在智慧城市中取得了眾多的應(yīng)用，主要包括實(shí)時(shí)布控、基于語義的智能搜索、高危人員比對、人臉照片搜索、全身像搜索、人像多點(diǎn)碰撞、車輛以圖搜圖、車輛多點(diǎn)碰撞，等等。

　　擁有感知能力的Intelligent IPC，相當(dāng)于物聯(lián)網(wǎng)中的一個(gè)一個(gè)視覺傳感器，大量攝像機(jī)感知的海量信息，進(jìn)入大數(shù)據(jù)和云計(jì)算平臺，使我們不僅能從單個(gè)攝像機(jī)中識別內(nèi)容作出判斷，還能從海量的監(jiān)控?cái)?shù)據(jù)中，作出深度分析和挖掘，從而對社會(huì)管理產(chǎn)生深遠(yuǎn)的影響?？七_(dá)感知型攝像機(jī)正是配合后端大數(shù)據(jù)平臺開展實(shí)際應(yīng)用：感知型攝像機(jī)在前端采集、分析、識別、提交有效數(shù)據(jù)至后端，大數(shù)據(jù)平臺以云的方式對這些數(shù)據(jù)進(jìn)行存儲、二次深度分析、預(yù)測判斷結(jié)果。至此，形成一個(gè)視頻數(shù)據(jù)采集、識別、感知、思考、行動(dòng)的完整閉環(huán)。

　　就像科達(dá)總經(jīng)理陳衛(wèi)東所說，感知型攝像機(jī)是智慧城市大數(shù)據(jù)應(yīng)用的關(guān)鍵，大數(shù)據(jù)時(shí)代，感知型攝像機(jī)才是視頻監(jiān)控的未來。

　　科達(dá)的感知攝像機(jī)可能離我們普通用戶比較遠(yuǎn)，看起來也沒有那些科技巨頭和創(chuàng)業(yè)公司所做的和圖像識別等人工智能技術(shù)有關(guān)的產(chǎn)品和功能那么炫酷，但這才是圖像識別技術(shù)的最佳應(yīng)用。而科達(dá)公司深耕某個(gè)行業(yè)，再從行業(yè)的具體需求出發(fā)，將圖像識別技術(shù)應(yīng)用于該行業(yè)，并解決該行業(yè)的具體問題的人工智能技術(shù)實(shí)施路徑也為其他人工智能公司提供了一條有價(jià)值的參考路徑。

免責(zé)聲明：本文來源于網(wǎng)絡(luò)收集，本文僅代表作者個(gè)人觀點(diǎn)，本站不作任何保證和承諾，若有任何疑問，請與本文作者聯(lián)系或有侵權(quán)行為聯(lián)系本站刪除。(原創(chuàng)稿件未經(jīng)許可,不可轉(zhuǎn)載,轉(zhuǎn)載請注明來源)

久草久热,国产三级理论片,国产精品欧美日韩视频一区,热热色国产,91av视频网站,日韩国产欧美视频一区二区三区,婷婷五月五

我的位置：

圖像識別技術(shù)的具體行業(yè)應(yīng)用

評論comment

重磅！建碁AOPEN攜ChromeOS OPS電腦BP5130亮相2025年臺北國際電腦展！

光影與文化的交響：奧圖碼投影科技重塑夜游文旅新體驗(yàn)

建碁 AOPEN 邀請函 | 2025年臺北國際電腦展COMPUTEX 2025！

【Infocomm 2025】DAV專訪?？低曇詧鼍盎瘎?chuàng)新引領(lǐng)音視頻新時(shí)代

我的位置：

share

相關(guān)閱讀related

評論comment