久草久热,国产三级理论片,国产精品欧美日韩视频一区,热热色国产,91av视频网站,日韩国产欧美视频一区二区三区,婷婷五月五

DAV首頁
數(shù)字音視工程網(wǎng)

微信公眾號

數(shù)字音視工程網(wǎng)

手機DAV

null
null
null
卓華,
招商,
null
null
null
快捷,
null

我的位置:

share

【成豐主流線】技術分享 |一起來充電視頻相關的基礎知識

來源:成豐主流線        編輯:VI菲    2023-01-06 13:58:59     加入收藏

前言:隨著音視頻技術不斷發(fā)展,新的技術概念不斷涌現(xiàn),比如視頻方面,高清分辨率為什么又叫1080P,帶寬和bps比特率的含義,hevc視頻編碼標準有什么作用?俗...

  前言:隨著音視頻技術不斷發(fā)展,新的技術概念不斷涌現(xiàn),比如視頻方面,高清分辨率為什么又叫1080P,帶寬和bps比特率的含義,hevc視頻編碼標準有什么作用?俗話說萬丈高樓平地起,今天我們和大家分享的文章,非常詳細的解釋了視頻技術相關的基礎知識,大家一起來充充電吧。

  本文將視頻相關的理論知識與基礎概念劃分為 11 個知識點:

  1.視頻

  2.分辨率

  3.比特率

  4.采樣率

  5.幀率

  6.視頻編碼

  7.編碼標準

  8.視頻封裝格式

  9.視頻解碼

  10.視頻播放原理

  11.視頻與流媒體

  1.視頻

  根據(jù)人眼視覺暫留原理,每秒超過 24 幀的圖像變化看上去是平滑連續(xù)的,這樣的連續(xù)畫面配合音頻叫視頻。

  2.分辨率

  分辨率是以橫向和縱向的像素數(shù)量來衡量的,表示平面圖像的精細程度。視頻精細程度并不只取決于視頻分辨率,還取決于屏幕分辨率。

  1080P 的 P 指 Progressive scan(逐行掃描),即垂直方向像素點,也就是 "高",所以 1920X1080 叫 1080P, 不叫 1920P。

  當 720P 的視頻在 1080P 屏幕上播放時,需要將圖像放大,放大操作也叫上采樣。

  「上采樣」 幾乎都是采用內(nèi)插值方法,即在原有圖像的像素點之間采用合適的插值算法插入新的元素,所以圖像放大也稱為圖像插值。

  簡單的記錄一下插值算法:

  (1)鄰插值算法:

  將四個像素(放大一倍)用原圖一個像素的顏色填充,較簡單易實現(xiàn),早期的時候應用比較普遍,但會產(chǎn)生明顯的鋸齒邊緣和馬賽克現(xiàn)象。

  (2)雙線性插值法:

  是對鄰插值法的一種改進,先對兩水平方向進行一階線性插值,再在垂直方向上進行一階線性插值。能有效地彌補鄰插值算法的不足,但還存在鋸齒現(xiàn)象并會導致一些不期望的細節(jié)柔化。

  (3)雙三次插值法:

  是對雙線性插值法的改進,它不僅考慮到周圍四個直接相鄰像素點灰度值的影響,還考慮到它們灰度值變化率的影響,使插值生成的像素灰度值延續(xù)原圖像灰度變化的連續(xù)性,從而使放大圖像濃淡變化自然平滑。

  除此之外還有很多更復雜效果更優(yōu)的算法,比如小波插值、分形等等。

  當 1080P 的視頻在 720P 屏幕上播放時,需要將圖像縮小,縮小操作也叫下采樣。

  「下采樣」 的定義為:對于一個樣值序列,間隔幾個樣值取樣一次,得到新序列。

  對于一幅分辨率為 MxN 的圖像,對其進行 s 倍下采樣,即得到 (M/s)x(N/s) 分辨率的圖像(s 應為 M、N 的公約數(shù)),就是把原始圖像 sxs 窗口內(nèi)的圖像變成一個像素,這個像素點的值就是窗口內(nèi)所有像素的均值。

  最佳體驗為屏幕與視頻分辨率相同且全屏播放,視頻分辨率過高的話屏幕沒有能力去呈現(xiàn),視頻分辨率過低的話無法發(fā)揮屏幕的能力。

  3.比特率

  比特率即碼率,在不同領域有不同的含義,在多媒體領域,指單位時間播放音頻或視頻的比特數(shù),可以理解成吞吐量或帶寬。

  單位為 bps , 即 bits per second,每秒傳輸?shù)臄?shù)據(jù)量,常用單位有:kbps、mbps 等。

  計算公式:碼率(kbps)= 文件大小(kb)/ 時長(s)

  通俗一點理解就是取樣率,取樣率越大,精度就越高,圖像質(zhì)量越好,但數(shù)據(jù)量也越大,所以要找到一個平衡點:用最低的比特率達到最少的失真。

  在一個視頻中,不同時段畫面的復雜程度是不同的,比如高速變化的場景和幾乎靜止的場景,所需的數(shù)據(jù)量也是不同的,若都使用同一種比特率是不太合理的,所以引入了動態(tài)比特率。

  (1)動態(tài)比特率

  簡稱為 VBR,即 Variable Bit Rate,比特率可以隨著圖像復雜程度的不同而隨之變化。

  圖像內(nèi)容簡單的片段采用較小的碼率,圖像內(nèi)容復雜的片段采用較大的碼率,這樣既保證了播放質(zhì)量,又兼顧了數(shù)據(jù)量的限制。

  比如 RMVB 視頻文件,其中的 VB 就是指 VBR,表示采用動態(tài)比特率編碼方式,達到播放質(zhì)量與體積兼得的效果。

  (2)靜態(tài)比特率

  簡稱為 CBR,即 Constant Bit Rate,比特率恒定。

  圖像內(nèi)容復雜的片段質(zhì)量不穩(wěn)定,圖像內(nèi)容簡單的片段質(zhì)量較好。上面列出的計算公式顯然是針對 CBR ,除 VBR 和 CBR 外,還有 CVBR(Constrained VariableBit Rate) 、ABR (Average Bit Rate) 等等。

  4.采樣率

  定義:每秒從連續(xù)信號中提取并組成離散信號的采樣個數(shù),單位為赫茲(Hz)。對于取樣率、采樣率和抽樣率,沒必要糾結(jié)它們的區(qū)別,都是同義詞。

  (1)音頻中的采樣率

  指把音頻信號數(shù)字化后 1 個通道 1 秒鐘采取多少個樣本,如 44.1kHz 的采樣率,就是指 1 個通道 1 秒鐘有 44.1k 個數(shù)據(jù)。

  (2)視頻中的采樣率

  視頻一般不標識采樣率屬性,比如:

  采樣率本身就是一個可泛化的概念,對于視頻來說,若非要用采樣率來描述的話,那就要分為兩個層面:幀頻和場頻。

  從幀頻層面來說,采樣率就是指幀率,指 1 秒鐘顯示多少幀圖像。

  從場頻層面來說,采樣率就是指像素頻率,指 1 秒鐘顯示多少個像素。

  像素頻率是顯示器的一個指標,可以理解成顯示器的最大帶寬,可以起到限制分辨率和刷新率的作用,根據(jù)含義可得出一個公式:

  「像素頻率 = 幀率 X 幀像素數(shù)量」

  對于:

  幀率 = 138.5 x 1024 x 1024 / 1920 / 1080  ≈  70.04 , 得出的 70Hz 為正常的幀率范圍,也可以反向確定對像素頻率的理解是正確的。

  5.幀率

  定義:用于測量顯示幀數(shù)的量度。單位為 FPS(Frames per Second,每秒顯示幀數(shù))或赫茲(Hz)。

  幀率越高,畫面越流暢、逼真,對顯卡的處理能力要求越高,數(shù)據(jù)量越大。

  1 中提到每秒超過 24 幀的圖像變化看上去是平滑連續(xù)的,這是針對電影等視頻而言,對游戲來說 24 幀是不流暢的。

  為什么 24fps 的電影感覺流暢,而 24fps 的游戲就感覺很卡呢?

  第一個原因:兩者圖像生成原理不同

  電影的一幀在一段時間曝光,每一幀都包含一段時間的信息,而游戲的畫面則是由顯卡計算生成的,一幀只包含那一瞬間的信息。

  比如一個圓從左上角移動到右下角:

  前者為電影的一幀,后者為游戲的一幀,可以看到在電影中動作會出現(xiàn)拖影,給人以動感的效果,連貫而不卡。

  第二個原因:電影的FPS是穩(wěn)定的,而游戲則是不穩(wěn)定的

  電影若為 24fps,那就表示每隔 1/24 秒刷新一次畫面,幀間隔是固定的。

  游戲若為 60fps,表示大約每隔 1/60 秒刷新一次畫面,幀間隔是不穩(wěn)定的,即使 1 秒能顯示 60 幀,那也可能是前半秒顯示了 59 幀,后半秒顯示了 1 幀。

  6.視頻編碼

  定義:通過特定的壓縮技術,將某個視頻格式的文件轉(zhuǎn)換成另一種視頻格式。視頻數(shù)據(jù)在時域和空域?qū)用娑加袠O強的相關性,這也表示有大量的「時域冗余信息」「空域冗余信息」 ,壓縮技術就是去掉數(shù)據(jù)中的冗余信息。

  (1)去除時域冗余信息

  運動補償:通過先前的局部圖像來預測、補償當前的局部圖像,可有效減少幀序列冗余信息。

  運動表示:不同區(qū)域的圖像使用不同的運動矢量來描述運動信息,運動矢量通過熵編碼進行壓縮(熵編碼在編碼過程中不會丟失信息)。

  運動估計:從視頻序列中抽取運動信息。

  通用的壓縮標準使用基于塊的運動估計和運動補償。

  (2)去除空域冗余信息

  變換編碼:將空域信號變換到另一正交矢量空間,使其相關性下降,數(shù)據(jù)冗余度減小。

  量化編碼:對變換編碼產(chǎn)生的變換系數(shù)進行量化,控制編碼器的輸出位率。

  熵編碼:對變換、量化后得到的系數(shù)和運動信息,進行進一步的無損壓縮。

  視頻壓縮編碼技術可分為兩大類:無損壓縮和有損壓縮。

  (1)無損壓縮

  無損壓縮也稱為可逆編碼,重構(gòu)后的數(shù)據(jù)與原數(shù)據(jù)完全相同,適用于磁盤文件的壓縮等。無損壓縮主要采用熵編碼方式,包括香農(nóng)編碼、哈夫曼編碼和算術編碼等。

  <1>香農(nóng)編碼

  香農(nóng)編碼采用信源符號的累計概率分布函數(shù)來分配碼字,效率不高,實用性不大,但對其他編碼方法有很好的理論指導意義。

  <2>哈夫曼編碼

  哈夫曼編碼完全依據(jù)出現(xiàn)概率來構(gòu)造異字頭的平均長度最短的碼字。

  基本方法為:先對圖像數(shù)據(jù)掃描一遍,計算出各種像素出現(xiàn)的概率,按概率的大小指定不同長度的唯一碼字,由此得到一張該圖像的霍夫曼碼表。

  編碼后的圖像數(shù)據(jù)記錄的是每個像素的碼字,而碼字與實際像素值的對應關系記錄在碼表中。

  <3>算術編碼

  算術編碼是用符號的概率和編碼間隔兩個基本參數(shù)來描述的,在給定符號集和符號概率的情況下,算術編碼可以給出接近最優(yōu)的編碼結(jié)果。

  使用算術編碼的壓縮算法通常先要對輸入符號的概率進行估計,然后再編碼,估計越準,編碼結(jié)果就越接近最優(yōu)的結(jié)果。

  (2)有損壓縮

  有損壓縮也稱為不可逆編碼,重構(gòu)后的數(shù)據(jù)與原數(shù)據(jù)有差異,適用于任何允許有失真的場景,例如視頻會議、可視電話、視頻廣播、視頻監(jiān)控等。

  編碼方式包括預測編碼、變換編碼、量化編碼、混合編碼等。

  7.編碼標準

  定義:為保證編碼的正確性,編碼要規(guī)范化、標準化,所以就有了編碼標準。

  研制視頻編碼標準的有兩大正式組織:ISO/IEC(國際標準化組織)、ITU-T(國際電信聯(lián)盟通信標準部)。

  ISO/IEC 制定的編碼標準有:MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21 和 MPEG-H 等。

  ITU-T 制定的編碼標準有:H.261、H.262、H.263、H.264 和 H.265 等。

  MPEG-x 和 H.26x 標準的視頻編碼都是采用有損壓縮的混合編碼方式,主要區(qū)別在于處理圖像的分辨率、預測精度、搜索范圍、量化步長等參數(shù)的不同,所以其應用場合也不同。

  MPEG-x 系列:

  (1)MPEG-1

  MPEG-1 共 5 部分。

  第 2 部分視頻編碼方案,規(guī)定了逐行掃描視頻的編碼方案。

  第 3 部分音頻編碼方案,將音頻流的壓縮分為 3 層并依次增大壓縮比,廣為流傳的 MP3(MPEG-1 Layer 3)就是按照此部分編碼方案壓縮之后的文件格式。

  (2)MPEG-2

  MPEG-2 共 11 個部分,在 MPEG-1 的基礎上提高了碼率和質(zhì)量。

  第 2 部分視頻編碼方案,規(guī)定了隔行掃描視頻的編碼方案,是和 ITU-T 共同開發(fā)的,ITU-T 稱其為 H.262。

  第 3 部分音頻編碼方案,延續(xù)了 MPEG-1 的 3 層壓縮方案,壓縮后文件格式仍為 MP3,但在壓縮算法上有所改進。

  第 7 部分首次提出 AAC(MPEG Advanced Audio Coding)編碼,目的以更小的容量和更好的音質(zhì)取代 MP3 格式。

  (3)MPEG-4

  MPEG-4 共 27 個部分,更加注重多媒體系統(tǒng)的交互性和靈活性。

  第 3 部分音頻編碼方案,優(yōu)化了 AAC 編碼算法,并在推出后逐漸取代 MP3,比如和視頻封裝在一起的音頻優(yōu)先考慮 AAC 格式,但就民用而言大部分還是使用 MP3 格式。

  第 10 部分提出 AVC(Advanced Video Coding)編碼,是和 ITU-T 共同開發(fā)的,ITU-T 稱其為 H.264。

  第 14 部分提出了 MP4 格式封裝,官方文件后綴名是 ".mp4",還有其他的以 mp4 為基礎進行的擴展或縮水版本的格式,包括:M4V,  3GP, F4V 等。

  (4)MPEG-7

  MPEG-7 不同于 MPEG-1、MPEG-2、MPEG-4,它不是音視頻壓縮標準。

  MPEG-7 被稱為 "多媒體內(nèi)容描述接口",目的就是產(chǎn)生一種描述多媒體信息的標準,并將該描述與所描述的內(nèi)容相聯(lián)系,以實現(xiàn)快速有效的檢索。

  (5)MPEG-12

  MPEG-12 其實就是一些關鍵技術的集成,通過這種集成環(huán)境對全球數(shù)字媒體資源進行管理,實現(xiàn)內(nèi)容描述、創(chuàng)建、發(fā)布、使用、識別、收費管理、版權保護等功能。

  (6)MPEG-H

  MPEG-H 包含了 1 個數(shù)字容器標準、1 個視頻壓縮標準、1 個音頻壓縮標準和 2 個一致性測試標準。

  其中視頻壓縮標準為高效率視頻編碼(HEVC),和 ITU-T 聯(lián)合開發(fā),相比 H.264/MPEG-4 AVC 數(shù)據(jù)壓縮率增加了 1 倍。

  H.26x 系列:

  (1)H.261

  H.261 是第一個實用的數(shù)字視頻編碼標準,使用了混合編碼框架,包括了基于運動補償?shù)膸g預測,基于離散余弦變換的空域變換編碼,量化,zig-zag 掃描和熵編碼。

  H.261 的設計相當成功,之后的視頻編碼國際標準基本上都是基于 H.261 的設計框架,包括 MPEG-1,MPEG-2/H.262,H.263,甚至 H.264。

  (2)H.262

  H.262 由 MPEG-1 擴充而來,支持隔行掃描,在技術內(nèi)容上和 MPEG-2 視頻標準一致,DVD 就是采用了該技術。

  (3)H.263

  H.263 是一種用于視頻會議的低碼率視頻編碼標準,在 H.261 基礎上發(fā)展而來。

  與 H.261 相比采用了半象素的運動補償,并增加了 4 種有效的壓縮編碼模式,在低碼率下能夠提供比 H.261 更好的圖像效果。

  H.263 于 1995 年推出第一版,后續(xù)在 1998 年和 2000 年還推出了第二版 H.263+、第三版 H.263++ 。

  (4)H.264

  H.264 又稱為 MPEG-4 第 10 部分,即 MPEG-4 AVC,它是一種面向塊,基于運動補償?shù)囊曨l編碼標準。

  于 2003 年正式發(fā)布,現(xiàn)在已經(jīng)成為高精度視頻錄制、壓縮和發(fā)布的最常用格式之一。

  H.264 可以在低碼率情況下提供高質(zhì)量的視頻圖像,相比 H.263 可節(jié)省 50% 的碼率。

  相比 H.263,H.264 不需設置較多的編碼選項,降低了編碼的復雜度。

  H.264 可以根據(jù)不同的環(huán)境使用不同的傳輸和播放速率,并且提供了豐富的錯誤處理工具,可以很好的控制或消除丟包和誤碼。

  H.264 性能的改進是以增加復雜性為代價而獲得的,H.264 編碼的計算復雜度大約相當于 H.263 的 3 倍,解碼復雜度大約相當于 H.263 的 2 倍。

  H.264 協(xié)議中定義了三種幀,分別為 I 幀、P 幀以及 B 幀。

  <1>I 幀

  I幀即幀內(nèi)編碼幀、關鍵幀,可以理解為一幀畫面的完整保留,解碼時只需要本幀數(shù)據(jù)就可以完成,不需要參考其他畫面,數(shù)據(jù)量比較大。

  <2>P 幀

  P幀即前向預測編碼幀,記錄當前幀跟上一關鍵幀(或P幀)的差別,解碼時依賴之前緩存的畫面,疊加上本幀定義的差別,才能生成最終畫面,數(shù)據(jù)量較 I 幀小很多。

  <3>B 幀

  B幀即雙向預測編碼幀,記錄當前幀跟前后幀的差別,解碼時依賴前面的I幀(或P幀)和后面的P幀,數(shù)據(jù)量比I幀和P幀小很多。

  數(shù)據(jù)壓縮比大約為:I幀:P幀:B幀  =  7:20:50,可見 P 幀和 B 幀極大的節(jié)省了數(shù)據(jù)量,節(jié)省出來的空間可以用來多保存一些 I 幀,以實現(xiàn)在相同碼率下,提供更好的畫質(zhì)。

  (5)H.265

  H.265 即高效視頻編碼(High Efficiency Video Coding ,簡稱 HEVC),于 2013 年正式推出。

  H.265 編碼架構(gòu)和 H.264 相似,主要也包含,幀內(nèi)預測、幀間預測、轉(zhuǎn)換、量化、去區(qū)塊濾波器、熵編碼等模塊。

  H.265 編碼架構(gòu)整體被分為編碼單位、預測單位和轉(zhuǎn)換單位。

  H.265 在 H.264 的基礎之上,使用先進的技術用以改善碼流、編碼質(zhì)量、延時和算法復雜度之間的關系,達到最優(yōu)化設置。

  在碼率減少 51-74% 的情況下,H.265 編碼視頻的質(zhì)量還能與 H.264 編碼視頻近似甚至更好。

  H.265 可以在有限帶寬下傳輸更高質(zhì)量的網(wǎng)絡視頻,智能手機、平板機等移動設備將能直接在線播放 1080p 的全高清視頻,讓網(wǎng)絡視頻跟上了顯示屏 “高分辨率化” 的腳步。

  來張圖感受一下吧:

  除 MPEG-x 和 H.26x 系列標準外,還有其他的編碼標準,如谷歌的 VP 系列,對視頻編碼標準歸納一下,如圖:

  8.視頻封裝格式

  視頻封裝格式如 mp4、mkv,用來存儲或傳輸編碼數(shù)據(jù),可以理解成一個容器。

  封裝就是按照一定規(guī)則把音視頻、字幕等數(shù)據(jù)組織起來,包含編碼類型等公共信息,播放器可以按照這些信息來匹配解碼器、同步音視頻。

  不同的封裝格式支持的視音頻編碼格式是不一樣的,比如 MKV 格式支持比較多,RMVB 則主要支持 Real 公司的視音頻編碼格式。

  https://en.wikipedia.org/wiki/Comparison_of_video_container_formats 列出了常見的視頻封裝格式,可以查看各封裝格式支持的音視頻編碼格式等信息。

  9.視頻解碼

  定義:將視頻壓縮編碼過的數(shù)據(jù),解壓縮成為視頻原始數(shù)據(jù),即視頻編碼的反過程。

  對于一個播放器來說,很重要的一個指標就是能支持多少種視頻解碼。

  10.視頻播放原理

  播放一個本地視頻文件,需要經(jīng)過解封裝,解碼音視頻,音視頻同步等步驟。

  「解封裝」 :就是將輸入的封裝格式的數(shù)據(jù),分離成為音頻壓縮編碼數(shù)據(jù)和視頻壓縮編碼數(shù)據(jù)。例如,F(xiàn)LV 格式的數(shù)據(jù),經(jīng)過解封裝操作后,輸出 H.264 編碼的視頻碼流和 AAC 編碼的音頻碼流。

  「解碼」 :將視頻/音頻壓縮編碼數(shù)據(jù),解碼成為非壓縮的視頻/音頻原始數(shù)據(jù)。

  音頻的壓縮編碼標準包含 AAC,MP3,AC-3 等等,視頻的壓縮編碼標準則包含 H.264,MPEG2,VC-1 等等。

  解碼是整個系統(tǒng)中最重要也是最復雜的一個環(huán)節(jié)。

  通過解碼,壓縮編碼的視頻數(shù)據(jù)輸出成為非壓縮的顏色數(shù)據(jù),例如 YUV420P,RGB 等等;壓縮編碼的音頻數(shù)據(jù)輸出成為非壓縮的音頻抽樣數(shù)據(jù),例如 PCM 數(shù)據(jù)。

  「音視頻同步」 :根據(jù)解封裝模塊處理過程中獲取到的參數(shù)信息,同步解碼出來的視頻和音頻數(shù)據(jù),并將視頻音頻數(shù)據(jù)送至系統(tǒng)的顯卡和聲卡播放出來。

  11.視頻與流媒體

  上面播放原理中分析的是本地視頻文件,如果播放的是互聯(lián)網(wǎng)上的視頻,步驟則為:解協(xié)議,解封裝,解碼音視頻,音視頻同步,多了一個解協(xié)議的步驟。

  「解協(xié)議」 :將流媒體協(xié)議的數(shù)據(jù),解析為標準的相應的封裝格式數(shù)據(jù)。

  視音頻在網(wǎng)絡上傳播的時候,常常采用各種流媒體協(xié)議,例如 HTTP,RTMP, MMS 等等。這些協(xié)議在傳輸視音頻數(shù)據(jù)的同時,也會傳輸一些信令數(shù)據(jù)。

  這些信令數(shù)據(jù)包括對播放的控制(播放,暫停,停止),或者對網(wǎng)絡狀態(tài)的描述等。

  解協(xié)議的過程中會去除掉信令數(shù)據(jù)而只保留視音頻數(shù)據(jù)。例如,采用 RTMP 協(xié)議傳輸?shù)臄?shù)據(jù),經(jīng)過解協(xié)議操作后,輸出 FLV 格式的數(shù)據(jù)。

 

  作者:JackJiang
  鏈接:https://juejin.cn/post/6894138629380112397
  ————————————————
  版權聲明:本文為CSDN博主「【零聲教育】音視頻開發(fā)進階」的原創(chuàng)文章,遵循CC 4.0 BY-SA版權協(xié)議,轉(zhuǎn)載請附上原文出處鏈接及本聲明。
  原文鏈接:https://blog.csdn.net/irainsa/article/details/128315979
 
免責聲明:本文來源于成豐主流線,本文僅代表作者個人觀點,本站不作任何保證和承諾,若有任何疑問,請與本文作者聯(lián)系或有侵權行為聯(lián)系本站刪除。(原創(chuàng)稿件未經(jīng)許可,不可轉(zhuǎn)載,轉(zhuǎn)載請注明來源)
掃一掃關注數(shù)字音視工程網(wǎng)公眾號

相關閱讀related

評論comment

 
驗證碼:
您還能輸入500