+852 3900 1928

Opus Codec (音訊格式)

VOIP AUDIO Codec :

OPUS CODEC (音訊格式)

 

Opus是一個有損聲音編碼的格式,由Xiph.Org基金會開發,之後由網際網路工程任務組(IETF)進行標準化,目標用希望用單一格式包含聲音和語音,取代Speex和Vorbis,且適用於網路上低延遲的即時聲音傳輸,標準格式定義於RFC 6716檔案。Opus格式是一個開放格式,使用上沒有任何專利或限制。

Opus整合了兩種聲音編碼的技術:以語音編碼為導向的SILK和低延遲的CELT。Opus可以無縫調節高低位元率。在編碼器內部它在較低位元率時使用線性預測編碼在高位元率時候使用變換編碼(在高低位元率交界處也使用兩者結合的編碼方式)。Opus具有非常低的演算法延遲(預設為22.5 ms),非常適合用於低延遲語音通話的編碼,像是網路上的即時聲音串流、即時同步聲音旁白等等,此外Opus也可以透過降低編碼位元速率,達成更低的演算法延遲,最低可以到5 ms。在多個聽覺盲測中,Opus都比MP3、AAC、HE-AAC等常見格式,有更低的延遲和更好的聲音壓縮率。

 

 

副檔名 .opus, .ogg, .webm, .weba, .mka
網路媒體型式 audio/ogg,audio/opus

http://opus-codec.org/

技術特性

  1. 6 kb/秒到510 kb/秒的位元率;單一頻道最高256 kb/秒
  2. 取樣頻率從8 kHz(窄帶)到48 kHz(全頻)
  3. 影格大小從2.5毫秒到60毫秒
  4. 支援恆定位元率(CBR)、受約束位元率(CVBR)和可變位元率(VBR)
  5. 支援語音(SILK層)和音樂(CELT層)的單獨或混合模式
  6. 支援單聲道和立體聲;支援多達255個音軌(多資料流的影格)
  7. 可動態調節位元率,音訊頻寬和影格大小
  8. 良好的魯棒性遺失率和封包遺失隱藏(PLC)
  9. 浮點和定點實現

音質和低延遲比較

Opus已被證明具有優異的音質,而在更高的位元率下,它的音訊格式比AAC、HE-AAC和Vorbis更具有競爭力。

在64kbit / s的聽力測試中,與HE-AAC編解碼器相比,Opus顯示出優異的音質,HE-AAC由於使用了專利的頻譜帶複製(SBR)技術,這些編解碼器在以前占主導地位。在96 kbit / s的聽力測試中,Opus顯示出比Vorbis略高的音質,與AAC和MP3相比音質明顯更好。

Opus具有非常低的演算法延遲,作為低音訊延遲通訊鏈路的一部分的必要性,可以在現場活動中允許自然對話,網路音樂表演或對嘴表演。音訊格式的總演算法延遲是無論處理速度和傳輸速度如編碼器和實況音訊流的解碼器必須承擔的延遲的總和,例如將音訊樣本緩衝到塊或影格中,允許窗口重疊和可能允許對噪聲整形在解碼器中先行和任何其他形式的先行的,或用於將MP3編碼器,使用的位元儲存器。

150毫秒以下的單向延遲是大多數VoIP系統的首選目標,使自然對話與轉向受到延遲的影響很小。音樂家通常會感覺到高達約30毫秒音訊延遲的時間,大致符合Haas效果的融合時間,儘管將每個用戶自己的樂器的播放延遲與往返延遲相符合也可以有所幫助。音訊/視頻同步,約45-100毫秒的音訊延遲可能是可以接受的。

Opus允許減少品質或提高位元率以實現更小的演算法延遲(最小5.0 ms)。雖然參考實現的默認Opus影格為20.0 ms長,但SILK層需要進一步5.0 ms的前瞻加1.5 ms進行重採樣,默認延遲為26.5 ms。當CELT層處於活動狀態時,默認情況下,為了與SILK層同步,窗口重疊需要2.5 ms的前視,其中添加了4.0 ms的符合延遲。如果編碼器在特殊限制低延遲模式下實例化,則刪除4.0 ms符合延遲,並禁用SILK層,允許5.0 ms的最小演算法延遲。

 

 

Opus Interactive Audio Codec

Overview

Opus is a totally open, royalty-free, highly versatile audio codec. Opus is unmatched for interactive speech and music transmission over the Internet, but is also intended for storage and streaming applications. It is standardized by the Internet Engineering Task Force (IETF) as RFC 6716 which incorporated technology from Skype’s SILK codec and Xiph.Org’s CELT codec.

Technology

Opus can handle a wide range of audio applications, including Voice over IP, videoconferencing, in-game chat, and even remote live music performances. It can scale from low bitrate narrowband speech to very high quality stereo music. Supported features are:

  • Bitrates from 6 kb/s to 510 kb/s
  • Sampling rates from 8 kHz (narrowband) to 48 kHz (fullband)
  • Frame sizes from 2.5 ms to 60 ms
  • Support for both constant bitrate (CBR) and variable bitrate (VBR)
  • Audio bandwidth from narrowband to fullband
  • Support for speech and music
  • Support for mono and stereo
  • Support for up to 255 channels (multistream frames)
  • Dynamically adjustable bitrate, audio bandwidth, and frame size
  • Good loss robustness and packet loss concealment (PLC)
  • Floating point and fixed-point implementation