AI之于音視頻應用的三問三答

來源：快思聰Crestron 編輯：ZZZ 2024-07-05 15:16:55 加入收藏

在快思聰，我們的人工智能解決方案集成1 Beyond智能攝像頭和快思聰Automate VX語音激活追蹤技術(shù)等一系列揚聲器解決方案。

　　AI人工智能是當今社會熱門話題。正面報道盛贊它為一位出色的虛擬助手，而負面聲音則擔憂孩子們可能過于依賴它來完成學業(yè)。更令人不安的是，一些悲觀的預言警告說，未來機器人不僅可能取代人類的工作崗位，還可能帶來致命的威脅。

　　盡管這項技術(shù)本身既有巨大可能也有潛在危險，但最好記住，人工智能只是一款可以被用于極好目的的工具。

　　尤其在現(xiàn)代混合辦公環(huán)境中所采用的視聽系統(tǒng)里，這一點顯得極為貼切。

　　“在快思聰，我們的人工智能解決方案集成1 Beyond智能攝像頭和快思聰Automate VX語音激活追蹤技術(shù)等一系列揚聲器解決方案。這些產(chǎn)品利用‘視覺人工智能’技術(shù)，為用戶提供卓越的視頻會議體驗，并能與Microsoft Teams® Rooms和Zoom Rooms®軟件等平臺無縫協(xié)作，充分發(fā)揮各自的人工智能技術(shù)優(yōu)勢。”

　　這究竟意味著什么？讓我們通過回答三個最常見的問題來逐一解析：

　　什么是“視覺人工智能”，它與智能視頻有何不同?

　　我們需要哪些硬件設備?

　　使用系統(tǒng)時，我需要關(guān)注哪些問題?

　　| 什么是“視覺人工智能”，它與智能視頻有何不同？

　　您可能已經(jīng)注意到“智能視頻”與“視覺人工智能”被交替使用。更準確地界定這兩個概念的方法是：視覺人工智能是實現(xiàn)智能視頻體驗所必需的關(guān)鍵技術(shù)。其結(jié)果是，該系統(tǒng)能夠給予面部和動作檢測自動追蹤并定位房間中的演講者——這在包含遠程參與者的會議中極為重要。您希望那些虛擬與會者能看到會議室中人員的手勢和表情。當遠程工作者能夠捕捉到所有這些非語言信號時，他們的參與度會得到增強。

　　快思聰在智能視頻領域的產(chǎn)品管理總監(jiān)Rony Sebok，為在線出版物《AI for All》撰寫的一篇文章可以很好地解釋這項技術(shù)的強大能力：

　　視覺人工智能可用于創(chuàng)造多樣性體驗，包括“團體構(gòu)圖”(調(diào)整畫面以顯示所有參與者)、“自動構(gòu)圖”(當一個人講話時調(diào)整畫面)、以及“演講者追蹤”(隨演講者的動作而在空間中移動)。它還可以進一步在房間中自動切換活躍的發(fā)言者(“發(fā)言者追蹤”)，將房間的多個視角合并為單一視頻流等。

　　就像其它人工智能實例一般，視覺人工智能正在逐漸發(fā)展完善。“人工智能已經(jīng)運用至統(tǒng)一通信中一段時間了，但現(xiàn)在我們正在開發(fā)更加高效的‘智能場景控制盒’解決方案，”快思聰市場高級總監(jiān)Sam Kennedy表示。人工智能也被應用于音頻解決方案中，它能夠屏蔽多余的噪音，甚至可以通過聲音來識別人。

　　不久之后，人工智能將輔助這些系統(tǒng)實現(xiàn)“環(huán)境智能感知”——換言之，對空間進行更深入的信息收集。“這些程序正在學習判斷房間內(nèi)是否配備白板，并調(diào)整系統(tǒng)攝像頭以確保所有遠程參與者都能清晰地看見白板，”Kennedy指出。“未來，人工智能還將能夠識別白板——甚至整個會議室——是否需要為下一場會議進行清潔整理。”

　　系統(tǒng)將能夠收集更多的環(huán)境信息，Kennedy表示：“是否需要在進行演示時降低窗簾?當系統(tǒng)感應到房間內(nèi)滿員時，是否需要調(diào)節(jié)溫度?”最終，人工智能將能對遠程與現(xiàn)場的場地體驗兩者都產(chǎn)生影響。

　　| 我們需要哪些硬件設備？

　　硬件設備的配置選項有很多?；A級解決方案常見于配備多個攝像頭的視頻會議條，這些攝像頭能夠?qū)崿F(xiàn)在發(fā)言者之間自動切換。對于專為高端會議空間設計的大型系統(tǒng)，可以采用搭載智能視頻技術(shù)的攝像頭進行驅(qū)動，或與基于麥克風信號來追蹤發(fā)言人的解決方案相結(jié)合，以便自動跟隨演講者或?qū)υ挕?/p>

　　快思聰可以提供所有選項配置，包括我們的1 Beyond智能PTZ攝像頭，它具備光學變焦功能，能夠清晰捕捉房間內(nèi)每位參與者的影像——即使是那些距離鏡頭60英尺遠的人。光學變焦在攝像頭的光學鏡頭內(nèi)部發(fā)生，而數(shù)字變焦則是通過放大和裁剪圖像來實現(xiàn)特寫效果。后者會降低圖像的像素精度，隨著放大倍數(shù)的增加，清晰度也隨之會降低，削弱了攝像頭捕捉關(guān)鍵非語言信號的能力。

　　另一個選擇是快思聰?shù)腁utomate VX語音激活的發(fā)言人追蹤解決方案。該系統(tǒng)與較大空間的適配性最高，因為您可以同時配置12個攝像頭來處理重要會議空間的需求。

　　我們的目標是通過視覺人工智能技術(shù)實現(xiàn)流暢追蹤與合理構(gòu)圖，提供清晰的特寫畫面和多角度視圖，使遠程參與者得以體驗卓越的廣播級視頻品質(zhì)。Automate VX解決方案能夠自動構(gòu)圖并將發(fā)言人置于畫面中心，即便他們移出最初的位置。這樣，參與者便可自由活動，無需擔心自己是否會離開攝像頭的拍攝范圍。

　　Automate VX解決方案還具有“重構(gòu)圖”功能，可自動將人物置于鏡頭畫面中心。人工智能在此發(fā)揮關(guān)鍵作用，它能夠識別動作幅度的大小。Kennedy解釋道：“例如，如果有人輕微地調(diào)整坐姿，人工智能不會認為需要重新調(diào)整鏡頭畫面構(gòu)圖。”這減少了不必要的攝像頭移動，有助于避免頻繁或持續(xù)性晃動而讓觀看者感到眩暈。

　　| 使用系統(tǒng)時，我需要關(guān)注哪些問題？

　　簡單來說：隱私和安全是需要持續(xù)關(guān)注的動態(tài)目標

　　在隱私保護方面，視覺人工智能(Visual AI)通常不會引發(fā)警覺，直到它開始識別特定個人。這種識別功能涉及的不僅僅是視覺上的追蹤，還包括其他方面。比如，如果人工智能程序識別了您的面容，這是否侵犯了您的隱私?程序分析并報告會議中的“情緒”，其倫理問題又該如何界定?人工智能是否能“領會”諷刺意味——它能否分辨出玩笑與真正具有負面影響的評論之間的區(qū)別?

　　Kennedy表示，所有系統(tǒng)的默認選項應該是允許用戶“選擇退出”。“我認為，只有征詢?nèi)藗兪欠裢獗蛔R別和追蹤才符合倫理道德，特別是對于生成性人工智能或虛擬助手程序，”他指出。“如果用戶同意，他們可以通過點擊按鈕立即選擇加入。”同時，他又提到地方法律也在應對這一問題：“在美國的一些州以及全球的許多地方，都明確禁止使用人工智能程序在環(huán)境中識別個人。”

　　考慮到安全性問題，在某些特定環(huán)境中將數(shù)據(jù)上傳至云端是不被允許的。“在信息被政府或企業(yè)視為機密的情況下，您是不會希望人工智能將任何數(shù)據(jù)發(fā)送至外部的，” Kennedy說。“這正是集成了人工智能的攝像設備——也就是‘邊緣化人工智能技術(shù)’——發(fā)揮作用的的場景了。”

　　然而，在會議進行時收集數(shù)據(jù)有很大的優(yōu)點。“假設有一位參會者是我們常說的沉默類型，”Kennedy解釋。“想象一下，如果系統(tǒng)能夠提示會議主講人注意到某個人一直保持沉默——他們可能比較害羞，需要一點鼓勵來推動他們分享想法。”

　　“我們探討‘會議中的平等’——確保每個人都能看見和被看見——這通常被視為是視覺層面的問題，但是能夠雙向聆聽，或協(xié)助創(chuàng)造和分享能力也同樣重要。”

　　特色產(chǎn)品

　　Automate VX

　　Automate VX采用多個光學變焦攝像頭和語音激活切換技術(shù)，保證遠程參與者能清晰地看清房間中的每個人，并且現(xiàn)場參與者永遠不必考慮應該看向哪里以跟隨對話。

　　全新的1 Beyond攝像頭 — 清晰捕捉房間內(nèi)的每一個人

　　快思聰推出了一系列新款“1 Beyond™”攝像頭，專為清晰捕捉房間內(nèi)每位參與者而設計——甚至包括那些距離鏡頭最遠60英寸的人。

　　快思聰Flex視頻會議與智能視頻技術(shù)

　　視頻會議室是當今現(xiàn)代混合辦公環(huán)境的核心。為了實現(xiàn)真正的協(xié)作，無論是現(xiàn)場或遠程會議人員，都必須能平等且充分參與。這正是快思聰Flex視頻會議與智能視頻技術(shù)被設計出的初衷——為無論身在何處的每個人提供更包容、更具吸引力和更公平的體驗。

免責聲明：本文來源于快思聰Crestron，本文僅代表作者個人觀點，本站不作任何保證和承諾，若有任何疑問，請與本文作者聯(lián)系或有侵權(quán)行為聯(lián)系本站刪除。(原創(chuàng)稿件未經(jīng)許可,不可轉(zhuǎn)載,轉(zhuǎn)載請注明來源)

久草久热,国产三级理论片,国产精品欧美日韩视频一区,热热色国产,91av视频网站,日韩国产欧美视频一区二区三区,婷婷五月五

我的位置：

AI之于音視頻應用的三問三答

評論comment

行業(yè)資訊 | 立足消費者體驗，飛利浦商顯賦能門店精細化管理

邀請函丨勢頭強勁！快來與Relacart·力卡一起解鎖歐洲ISE視聽展新體驗！

案例 | 飛利浦商顯賦能西安地鐵打造“漢唐都城線”，助千年古都煥發(fā)智慧新活力

飛利浦吧臺屏1057QR系列 | 煥新門店形象，引領數(shù)智化新風尚

我的位置：

share

相關(guān)閱讀related

評論comment