Google 推出最新圖像識別工具
來源:數(shù)字音視工程網(wǎng) 編輯:航行150 2015-12-09 10:36:50 加入收藏 咨詢

所在單位: | * |
姓名: | * |
手機(jī): | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢內(nèi)容: | |
驗(yàn)證碼: |
|
搜索是我們很多人發(fā)現(xiàn)信息的主要渠道,但只能搜索文字顯然是不夠的,圖像和視頻肯定是搜索領(lǐng)域的下一個(gè)發(fā)展方向。當(dāng)然,Google Photos 已經(jīng)能夠部分實(shí)現(xiàn)這個(gè)功能了,但很顯然這還遠(yuǎn)遠(yuǎn)不夠。
不過 Google 在周三宣布,他們提供了一個(gè)強(qiáng)大的圖像識別工具,名為 Google Cloud Vision API。對于開發(fā)者們來說,這可能會是一個(gè)非常有用的工具,有了它,開發(fā)者們就可以讓自己的軟件、機(jī)器人知道圖像上的信息了。
功能強(qiáng)大的圖像檢測工具
首先,作為一個(gè)機(jī)器學(xué)習(xí)領(lǐng)域的技術(shù),這個(gè)工具搭載的是我們之前給大家介紹過的智能機(jī)器學(xué)習(xí)系統(tǒng) TensorFlow,Google 在上個(gè)月剛剛將這個(gè)系統(tǒng)免費(fèi)開放給開發(fā)者們。
其次,它的主要功能是去學(xué)習(xí)并識別圖片中的內(nèi)容。
這個(gè)工具的運(yùn)行原理并不復(fù)雜,它能夠迅速將圖片分到數(shù)千種大的類別當(dāng)中去,比如:船、獅子、埃菲爾鐵塔等等;然后偵測臉部相關(guān)的情緒,并識別圖片上相關(guān)的文字。
在他們看來,Google Cloud Vision API 有以下幾個(gè)吸引人的特性:
檢測實(shí)體: Google Cloud Vision API 可以從數(shù)千種圖片分類中檢測出圖片中的實(shí)體。除此之外,更吸引人的是,你還可以根據(jù)你自己的圖片類別建立自己的元數(shù)據(jù),這樣,你就不必受制于 Google 為你設(shè)定的那數(shù)千個(gè)分類,而有了更符合你自己的圖片分類。
字符識別: Google Cloud Vision API 所帶的光學(xué)字符識別技術(shù)可以識別圖片上的文字內(nèi)容。其中支持的語言有很多種。
安全檢測: Google Cloud Vision API 的安全檢測功能可以識別出圖片中不合適的內(nèi)容,此功能搭載于 Google SafeSearch。它可以幫助用戶避開那些令人不適的內(nèi)容。
面部檢測: Google Cloud Vision API 的面部識別技術(shù)可以檢測到圖片中的人像,也能具體識別出眼睛、嘴等具體的器官,而更重要的是,它還能檢測到包括開心、悲傷等在內(nèi)的 8 中情緒。為了保護(hù)用戶的隱私,Google 還承諾不會在任何的 Google 服務(wù)器中儲存有關(guān)面部的任何信息。
地標(biāo)檢測 :Google Cloud Vision API 的地標(biāo)檢測功能可以識別出世界上著名的一些自然和人文建筑與景觀,同時(shí)還會為你標(biāo)出該地點(diǎn)的經(jīng)緯度。
Logo 檢測: Google Cloud Vision API 的 logo 監(jiān)測功能可以檢測出圖片中著名品牌的 logo。
下面是一些范例:
Google 的一次突破
有了這個(gè)工具,機(jī)器識別圖片的能力會大大加強(qiáng)。之前,你不能讓計(jì)算機(jī)自動為你篩選照片;但現(xiàn)在,只需輸入相應(yīng)的「類別」,計(jì)算機(jī)就可以為你挑選出相應(yīng)的圖片。
而開發(fā)者們現(xiàn)在可以好好設(shè)計(jì)一下自己的軟件和機(jī)器人等設(shè)備了。在不久的將來,也許當(dāng)我們走進(jìn)家門的時(shí)候,家中的機(jī)器人可以根據(jù)你臉上的表情選擇它該說的問候語;而你在上網(wǎng)時(shí)也能夠更精確地搜尋到想要的圖片了。
當(dāng)然,對 Google 來說,推出這個(gè)工具也很正常。在這個(gè)領(lǐng)域,亞馬遜和微軟都已經(jīng)走了很遠(yuǎn)了。很多朋友可能還記得微軟在之前推出的識別年齡和情緒的小工具,這些都出自于微軟專注于人工智能領(lǐng)域的牛津計(jì)劃。Google 當(dāng)然也不能落后。在之前,Google 也推出過一些進(jìn)行預(yù)測的 API 產(chǎn)品,但都功能有限,沒有涉及到圖像這方面,因此,這次的這個(gè)舉動對 Google 來說也是一次大的突破。
這個(gè) API 目前在 Google 云平臺上提供一些有限的預(yù)覽,不過在將來,Google 將會把這個(gè)功能添加進(jìn) Google 云儲存中。這樣可以使它的使用范圍更廣。
評論comment