率失真理論

維基百科，自由的百科全書

數據率失真理論（Rate distortion theory）或稱資訊率-失真理論（information rate-distortion theory）是資訊理論的主要分支，其的基本問題可以歸結如下：對於一個給定的信號源（source, input signal）分佈與失真度量，在特定的位元速率下能達到的最小期望值失真；或者為了滿足一定的失真限制，可允許的最大位元速率為何，D 定義為失真的符號。

要完全避免失真幾乎不可能。處理訊號時必須允許有限度的失真﹐可減小所必需的資訊率。1959年﹐Claude Shannon 首先發表《逼真度準則下的離散信號源編碼定理》一文，提出了率失真函數的概念。

失真函數

失真函數能量化輸入與輸出的差異，以便進行數學分析。令輸入訊號為 $\chi$ ，輸出訊號為 ${\hat {\chi }}$ ，定義失真函數為 $d(\chi ,{\hat {\chi }})$ ，失真函數可以有多種定義，其與對應域為非負實數：

$d:\chi \times {\hat {\chi }}\rightarrow R_{+}$ 。

漢明失真

漢明失真函數能描述錯誤率，定義為：

$d(x,{\hat {x}})={\begin{cases}0,&{\text{if }}x={\hat {x}}\\1,&{\text{if }}x\neq {\hat {x}}\end{cases}}$ ，

對漢明失真函數取期望值即為傳輸錯誤率。

平方誤差失真

最常用於量測連續字元傳輸的失真，定義為：

$d(x,{\hat {x}})=(x-{\hat {x}})^{2}$ ，

平方誤差失真函數不適用於語音或影像方面，因為人類感官對於語音或影像的平方誤差失真並不敏感。

率失真函數

下列是率與失真（rate and distortion）的最小化關係函數:

\inf _{Q_{Y|X}(y|x)}I_{Q}(Y;X)\ {\mbox{subject to}}\ D_{Q}\leq D^{*}.

這裏 Q_{Y | X}(y | x), 有時被稱為一個測試頻道（test channel）, 係一種條件概率之概率密度函數 (PDF)，其中頻道輸出 (compressed signal) Y 相對於來源 (original signal) X, 以及 I_Q(Y ; X) 是一種相互資訊（Mutual Information），在 Y 與 X 之間被定義為

I(Y;X)=H(Y)-H(Y|X)\,

此處的 H(Y) 與 H(Y | X) 是指信宿（output signal） Y 的熵（entropy）以及基於信號源（source signal）和信宿（output signal）相關的條件熵（conditional entropy）, 分別為:

H(Y)=-\int _{-\infty }^{\infty }P_{Y}(y)\log _{2}(P_{Y}(y))\,dy

H(Y|X)=-\int _{-\infty }^{\infty }\int _{-\infty }^{\infty }Q_{Y|X}(y|x)P_{X}(x)\log _{2}(Q_{Y|X}(y|x))\,dx\,dy.

這一樣來便可推導出率失真的公式, 相關表示如下:

\inf _{Q_{Y|X}(y|x)}E[D_{Q}[X,Y]]{\mbox{subject to}}\ I_{Q}(Y;X)\leq R.

這兩個公式之間互為可逆推。

無記憶（獨立）高斯訊號來源

如果我們假設 P_X(x) 服從正態分佈且方差為σ², 並且假設 X 是連續時間獨立訊號（或等同於來源無記憶或訊號不相關），我們可以發現下列的率失真公式的「公式解」（analytical expression）:

R(D)=\left\{{\begin{matrix}{\frac {1}{2}}\log _{2}(\sigma _{x}^{2}/D),&{\mbox{if }}0\leq D\leq \sigma _{x}^{2}\\\\0,&{\mbox{if }}D>\sigma _{x}^{2}.\end{matrix}}\right.

^[1]

下圖是本公式的幾何面貌:

率失真理論告訴我們「沒有壓縮系統存在於灰色區塊之外」。可以說越是接近紅色邊界，執行效率越好。一般而言，想要接近邊界就必須透過增加碼塊（coding block）的長度參數。然而，塊長度（blocklengths）的取得則來自率失真公式的量化（quantizers）有關。^[1]

這樣的率失真理論（rate–distortion function）僅適用於高斯無記憶信號源（Gaussian memoryless sources）。

二元信號源

伯努利信號源 $X$ ， $X\thicksim Bernoulli(p)$ ，以漢明失真描述的率失真函數為：

$R(D)={\begin{cases}H(p)-H(D),&0\leq D\leq min\{p,1-p\}\\0,&D\geq min\{p,1-p\}\end{cases}}$

平行高斯信號源

平行高斯信號源的率失真函數為一經典的反注水演算法(Reverse water-filling algorithm)，我們可以找出一閾值 $\lambda$ ，只有方差大於 $\lambda$ 的信號源才有必要組態位元來描述，其他信號源則可直接傳送與接收，不會超過最大可容許的失真範圍。

我們可以使用平方誤差失真函數，計算平行高斯信號源的率失真函數。注意，此處信號源不一定同分佈：

$X_{1},X_{2}...,X_{m}$ 且 $X_{i}\thicksim N(0,\sigma _{i}^{2})$ ，此時率失真函數為，

$R(D)=\sum _{i=1}^{m}{1 \over 2}log{{\sigma _{i}^{2}} \over {D_{i}}}$

其中，

$D_{i}={\begin{cases}\lambda ,&{\text{if }}{\lambda }<{\sigma _{i}^{2}}\\\sigma _{i}^{2},&{\text{if }}{\lambda }\geq {\sigma _{i}^{2}}\end{cases}}$

且 $\lambda$ 必須滿足限制：

$\sum _{i=1}^{m}D_{i}=D$ 。

註釋

^ ^1.0 ^1.1 Thomas M. Cover, Joy A. Thomas. Elements of Information Theory. John Wiley & Sons, New York. 2006.

取自 "https://zh.wikipedia.org/w/index.php?title=率失真理论&oldid=61385036"

分類：

信號處理