在数学分析 及应用中,“多维度变换”是用来分析讯号的二维或是多维的频率成分。
多维度傅立叶变换
其中一个常用的多维度变换就是傅立叶变换 ,是将一个讯号的表示式从时域/空域转换到频域。[ 1] 离散域的多维度傅立叶变换可表示成下列式子:
F
(
w
1
,
w
2
,
…
,
w
m
)
=
∑
n
1
=
−
∞
∞
∑
n
2
=
−
∞
∞
⋯
∑
n
m
=
−
∞
∞
f
(
n
1
,
n
2
,
…
,
n
m
)
e
−
j
w
1
n
1
−
j
w
2
n
2
⋯
−
j
w
m
n
m
{\displaystyle F(w_{1},w_{2},\dots ,w_{m})=\sum _{n_{1}=-\infty }^{\infty }\sum _{n_{2}=-\infty }^{\infty }\cdots \sum _{n_{m}=-\infty }^{\infty }f(n_{1},n_{2},\dots ,n_{m})e^{-jw_{1}n_{1}-jw_{2}n_{2}\cdots -jw_{m}n_{m}}}
其中F 代表多维度傅立叶变换,m 代表维度。将f 定义成多维度的离散域讯号,则逆多维度傅立叶变换为:
f
(
n
1
,
n
2
,
…
,
n
m
)
=
(
1
2
π
)
m
∫
−
π
π
⋯
∫
−
π
π
F
(
w
1
,
w
2
,
…
,
w
m
)
e
j
w
1
n
1
+
j
w
2
n
2
+
⋯
+
j
w
m
n
m
d
w
1
⋯
d
w
m
{\displaystyle f(n_{1},n_{2},\dots ,n_{m})=\left({\frac {1}{2\pi }}\right)^{m}\int _{-\pi }^{\pi }\cdots \int _{-\pi }^{\pi }F(w_{1},w_{2},\ldots ,w_{m})e^{jw_{1}n_{1}+jw_{2}n_{2}+\cdots +jw_{m}n_{m}}\,dw_{1}\cdots \,dw_{m}}
连续域的多维度傅立叶变换可表示成下列式子:[ 1]
F
(
Ω
1
,
Ω
2
,
…
,
Ω
m
)
=
∫
−
∞
∞
⋯
∫
−
∞
∞
f
(
t
1
,
t
2
,
…
,
t
m
)
e
−
j
Ω
1
t
1
−
j
Ω
2
t
2
⋯
−
j
Ω
m
t
m
d
t
1
⋯
d
t
m
{\displaystyle F(\Omega _{1},\Omega _{2},\ldots ,\Omega _{m})=\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }f(t_{1},t_{2},\ldots ,t_{m})e^{-j\Omega _{1}t_{1}-j\Omega _{2}t_{2}\cdots -j\Omega _{m}t_{m}}\,dt_{1}\cdots \,dt_{m}}
快速傅立叶变换 (FFT)是一种用来计算离散傅立叶变换(DFT)和其逆变换的快速算法,快速傅立叶变换所得到的结果跟按照定义去算离散傅立叶变换的结果是一样的,但唯一的差别是快速傅立叶变换的速度快很多。(在舍入误差的存在下,很多快速傅立叶变换还比直接照定义算还更精准。)有很多种快速傅立叶变换,他们包含很广泛的数学运算,从简单的复数运算到数论和群论,详情可以看快速傅立叶变换 。
多维度的离散傅立叶变换 是离散域傅立叶变换的简单版本,其方法是在均匀间隔下的样本频率去估计其值。[ 2] N 1 × N 2 × ... N M 离散傅立叶变换如下式:
F
x
(
K
1
,
K
2
,
…
,
K
n
)
=
∑
n
1
=
0
N
1
−
1
⋯
∑
n
m
N
m
−
1
f
x
(
n
1
,
n
2
,
…
,
n
N
)
e
−
j
2
π
N
1
n
1
K
1
−
j
2
π
N
2
n
2
K
2
⋯
−
j
2
π
N
m
n
m
K
m
{\displaystyle Fx(K_{1},K_{2},\ldots ,K_{n})=\sum _{n_{1}=0}^{N_{1}-1}\cdots \sum _{n_{m}}^{N_{m}-1}fx(n_{1},n_{2},\ldots ,n_{N})e^{-j{\frac {2\pi }{N_{1}}}n_{1}K_{1}-j{\frac {2\pi }{N_{2}}}n_{2}K_{2}\cdots -j{\frac {2\pi }{N_{m}}}n_{m}K_{m}}}
其中0 ≤ Ki ≤ Ni − 1 , i = 1, 2, ..., m 。
多维度离散傅里叶变换对应的逆变换是:
f
x
(
n
1
,
n
2
,
…
,
n
m
)
=
1
N
1
⋯
N
m
∑
K
1
=
0
N
1
−
1
⋯
∑
K
m
N
m
−
1
F
x
(
K
1
,
K
2
,
…
,
K
m
)
e
j
2
π
N
1
n
1
K
1
+
j
2
π
N
2
n
2
K
2
⋯
+
j
2
π
N
m
n
m
K
m
{\displaystyle fx(n_{1},n_{2},\ldots ,n_{m})={\frac {1}{N_{1}\cdots N_{m}}}\sum _{K_{1}=0}^{N_{1}-1}\cdots \sum _{K_{m}}^{N_{m}-1}Fx(K_{1},K_{2},\ldots ,K_{m})e^{j{\frac {2\pi }{N_{1}}}n_{1}K_{1}+j{\frac {2\pi }{N_{2}}}n_{2}K_{2}\cdots +j{\frac {2\pi }{N_{m}}}n_{m}K_{m}}}
其中0 ≤ n 1 , n 2 , ... , n m ≤ N (1, 2, ... , m ) – 1 。
多维度离散余弦变换
离散余弦变换被广泛的应用,像是资料压缩 、特征萃取、影像重建等等。多维度离散余弦变换为:
F
x
(
K
1
,
K
2
,
…
,
K
r
)
=
∑
n
1
=
0
N
1
−
1
∑
n
2
=
0
N
2
−
1
⋯
∑
n
r
=
0
N
r
−
1
f
x
(
n
1
,
n
2
,
…
,
n
r
)
cos
π
(
2
n
1
+
1
)
K
1
2
N
1
⋯
cos
π
(
2
n
r
+
1
)
K
r
2
N
r
{\displaystyle Fx(K_{1},K_{2},\ldots ,K_{r})=\sum _{n_{1}=0}^{N_{1}-1}\sum _{n_{2}=0}^{N_{2}-1}\cdots \sum _{n_{r}=0}^{N_{r}-1}fx(n_{1},n_{2},\ldots ,n_{r})\cos {\frac {\pi (2n_{1}+1)K_{1}}{2N_{1}}}\cdots \cos {\frac {\pi (2n_{r}+1)K_{r}}{2N_{r}}}}
其中 ki = 0, 1, ..., Ni − 1 , i = 1, 2, ..., r .
多维度拉普拉斯变换
多维度拉普拉斯变换在边值问题的求解中具有重要作用。由偏微分方程描述的二元或多元边值问题直接使用拉普拉斯变换求解[ 3] 。 M维的拉普拉斯变换定义为:
F
(
s
1
,
s
2
,
…
,
s
n
)
=
∫
0
∞
⋯
∫
0
∞
f
(
t
1
,
t
2
,
…
,
t
n
)
e
−
s
n
t
n
−
s
n
−
1
t
n
−
1
⋯
⋯
s
1
t
1
d
t
1
⋯
d
t
n
{\displaystyle F(s_{1},s_{2},\ldots ,s_{n})=\int _{0}^{\infty }\cdots \int _{0}^{\infty }f(t_{1},t_{2},\ldots ,t_{n})e^{-s_{n}t_{n}-s_{n-1}t_{n-1}\cdots \cdots s_{1}t_{1}}\,dt_{1}\cdots \,dt_{n}}
其中,
F
{\displaystyle F}
代表信号
f
(
t
1
,
t
2
,
⋯
,
t
n
)
{\displaystyle f(t_{1},t_{2},\cdots ,t_{n})}
在 s-域的表示。
对于二维情况,函数
f
(
x
,
y
)
{\displaystyle f(x,y)}
的拉普拉斯变换定义为:
F
(
s
1
,
s
2
)
=
∫
0
∞
∫
0
∞
f
(
x
,
y
)
e
−
s
1
x
−
s
2
y
d
x
d
y
{\displaystyle F(s_{1},s_{2})=\int \limits _{0}^{\infty }\int \limits _{0}^{\infty }\ f(x,y)e^{-s_{1}x-s_{2}y}\,dxdy}
多维度 Z 变换将离散时间域中的高维信号映射到 Z 域,这在滤波器稳定性分析中非常有用。多维度 Z 变换定义为:
F
(
z
1
,
z
2
,
…
,
z
m
)
=
∑
n
1
=
−
∞
∞
⋯
∑
n
m
=
−
∞
∞
f
(
n
1
,
n
2
,
…
,
n
m
)
z
1
−
n
1
z
2
−
n
2
…
z
m
−
n
m
{\displaystyle F(z_{1},z_{2},\ldots ,z_{m})=\sum _{n_{1}=-\infty }^{\infty }\cdots \sum _{n_{m}=-\infty }^{\infty }f(n_{1},n_{2},\ldots ,n_{m})z_{1}^{-n_{1}}z_{2}^{-n_{2}}\ldots z_{m}^{-n_{m}}}
其中,
F
{\displaystyle F}
代表信号
f
(
n
1
,
n
2
,
⋯
,
n
m
)
{\displaystyle f(n_{1},n_{2},\cdots ,n_{m})}
在 Z-域的表示。
对于二维情况,Z 变换定义为:
F
(
z
1
,
z
2
)
=
∑
n
1
=
−
∞
∞
∑
n
2
=
−
∞
∞
f
(
n
1
,
n
2
)
z
1
−
n
1
z
2
−
n
2
{\displaystyle F(z_{1},z_{2})=\sum _{n_{1}=-\infty }^{\infty }\sum _{n_{2}=-\infty }^{\infty }f(n_{1},n_{2})z_{1}^{-n_{1}}z_{2}^{-n_{2}}}
傅里叶变换是 Z 变换的特例,在单位圆(一维)和单位双圆(二维)上得到。即取:
z
=
e
i
w
{\textstyle z=e^{iw}}
其中
z
{\textstyle z}
和
w
{\textstyle w}
是向量。
收敛域
当满足
F
(
z
1
,
z
2
)
=
∑
n
1
=
−
∞
∞
∑
n
2
=
−
∞
∞
|
f
(
n
1
,
n
2
)
|
|
z
1
|
−
n
1
|
z
2
|
−
n
2
<
∞
{\displaystyle F(z_{1},z_{2})=\sum _{n_{1}=-\infty }^{\infty }\sum _{n_{2}=-\infty }^{\infty }|f(n_{1},n_{2})||z_{1}|^{-n_{1}}|z_{2}|^{-n_{2}}<\infty }
时,点
(
z
1
,
z
2
)
{\displaystyle (z_{1},z_{2})}
位于收敛域内。
应用
离散傅立叶变换和离散余弦变换常常被使用在讯号处理[ 5] 和影像处理,也常被用来当作解偏微分方程式时更有效率的方法。离散傅立叶变换也可用在运算折积或是乘上很大的整数。下列只列出一些例子。
影像处理
在JPEG DCT 中的二维度离散余弦变换频率
离散余弦变换被用在 JPEG 影像压缩、MJPEG 、MPEG 、DV 和 Theora 影片压缩上。压缩时使用N xN'格的二维的离散余弦变换(DCT-II)然后再被量化 且用熵编码法 编码,通常 N为8,而DCT-II的运算就用在该格的每一行和每一排,结果会生成8x8的变换系数矩阵,其中(0,0)(左上角)的值是直流分量(频率为0),随着水平或垂直的编号增加,代表水平或垂直的空间频率增加,如右图所示。
在影像处理方面,利用二维的离散余弦变换可以分析并且描述非常规的图形加密方法,像是在二维图像平面中插入非可见的二进位制水印。[ 6] 利用不同的方向,DCT-DWT混杂的转换也可以用来去除超声波影像的噪声。[ 7] 三维的离散余弦变换可以被用来转换在使用水印影像迁入的影片资料或是三维影像资料。[ 8] [ 9]
频谱分析
当使用离散傅立叶变换来做频谱分析 时,{xn }的数列通常代表着从讯号 x (t )中在均匀的时间点做取样所得到的有限集合,这样将连续时间点经取样离散化后,也将原本的傅立叶变换 转变成离散时间傅立叶变换 (DTFT),通常也因此产生了混叠 的失真。为了要最小化这种失真,选择适当的取样频率是重点(详情请看取样定理 )。同样的,将一个非常长(或无限)的数列转变成一个容易处理的大小,会因此造成失真(Spectral leakage),选取一个适当的子数列长度是最小化这个问题的关键点。当资料量大于达到理想频率分辨率所需的适量时,标准的作法是使用多个DFT,例如产生频谱图 的时候。如果所期望的结果是功率频谱而且有噪声或随机讯号出现在资料内的话,多个DFT的振幅平均值可以用来减少频谱的变异性,Welch方法 和Bartlett方法 就是这种技术。一般处理这种用来估计有噪声的讯号的功率频谱的方法就称为频谱估计。
其实会造成失真的主要源头就是DFT本身,因为DFT是将DTFT这种连续性的频域做离散取样的结果,可以利用提高DFT的频率分辨率来减缓这问题。
这种方法有时候也被认为是零填充,这是一种被用在快速傅立叶变换 的一种特别应用。这种因为值为零的取样点而产生的乘法与加法比原本的FFT产生偏移还要没有效率。
如上面所言,失真(leakage)的问题对DTFT的频率分辨率造成了限制,因此会对透过提高频率分辨率的效益造成限制。
偏微分方程式
离散傅立叶变换时常被用来解偏微分方程式 ,其中DFT是被用来近似傅立叶级数 ,其优点在于将讯号延伸为复数指数函数e inx ,而这微分方程式的特征函数为:d /dx e inx = in e inx ,因此,微分在傅立叶变换后的表示式下变得很简单,只要乘上i n (但是因为混叠 的影响,n 的选择不一定是唯一的,为了让这样的方法达到收敛,需要使用三角插值去选择这个值)。一个线性微分方程式 且其系数为常数经由离散傅立叶变换后会变换成很容易解的代数等式,将解完等式的结果用逆离散傅立叶变换就能回到原来的时/空域表示式。
用快速傅立叶变换处理影像艺术面的分析
我们必须使用没有损害的方法去得到一些关于艺术稀有的资讯(从HVS的观点是着重于色度法以及空间资讯)。我们可以透过观察色彩变化或是测量表面一制性的变化来了解艺术,因为整个影像是非常大的,所以我们会使用一个双生的余弦窗去撷取影像:[ 10]
w
(
x
,
y
)
=
1
4
(
1
+
cos
x
π
N
)
(
1
+
cos
y
π
N
)
{\displaystyle w(x,y)={\frac {1}{4}}\left(1+\cos {\frac {x\pi }{N}}\right)\left(1+\cos {\frac {y\pi }{N}}\right)}
其中N 是影像的维度, x , y 是从影像中心(0,0)所扩展的座标(从0到N /2),可将空间频率表示成下式:[ 10]
A
m
(
f
)
2
=
[
∑
i
=
−
f
f
FFT
(
−
f
,
i
)
2
+
∑
i
=
−
f
f
FFT
(
f
,
i
)
2
+
∑
i
=
−
f
+
1
f
−
1
FFT
(
i
,
−
f
)
2
+
∑
i
=
−
f
+
1
f
−
1
FFT
(
i
,
f
)
2
]
{\displaystyle A_{m}{(f)}^{2}=\left[\sum _{i=-f}^{f}\operatorname {FFT} (-f,i)^{2}+\sum _{i=-f}^{f}\operatorname {FFT} (f,i)^{2}+\sum _{i=-f+1}^{f-1}\operatorname {FFT} (i,-f)^{2}+\sum _{i=-f+1}^{f-1}\operatorname {FFT} (i,f)^{2}\right]}
“FFT”为快速傅立叶变换, f 是空间频率。这种基于FFT的成像方法是一种诊断技术,用以确保文化艺术的长寿及稳定。这是一种简单、成本低且可用于博物馆又不影响日常使用的方法,但这种方法没办法定量的量测腐蚀速率。
参见
参考资料
^ 1.0 1.1 Smith,W. Handbook of Real-Time Fast Fourier Transforms:Algorithms to Product Testing, Wiley_IEEE Press, edition 1, pages 73–80, 1995
^ Dudgeon and Mersereau, Multidimensional Digital Signal Processing,2nd edition,1995
^ Debnath, Joyati; Dahiya, R. S. Theorems on multidimensional laplace transform for solution of boundary value problems. Computers & Mathematics with Applications. 1989-01-01, 18 (12): 1033–1056. doi:10.1016/0898-1221(89)90031-X .
^ Narod Book (PDF) .
^ Tan Xiao, Shao-hai Hu, Yang Xiao. 2-D DFT-DWT Application to Multidimensional Signal Processing. ICSP2006 Proceedings, 2006 IEEE
^ Peter KULLAI, Pavol SABAKAI, JozefHUSKAI. Simple Possibilities of 2D DCT Application in Digital
Monochrome Image Cryptography. Radioelektronika, 17th International Conference, IEEE, 2007, pp. 1–6
^ Xin-ling Wen, Yang Xiao. The 2-D Directional DCT-DWT Hybrid Transform and Its Application in Denoising Ultrasound Image. Signal Processing. ICSP 2008. 9th International Conference, Page(s): 946–949
^ Jinwei Wang, Shiguo Lian, Zhongxuan Liu, Zhen Ren, Yuewei Dai, Haila Wang. Image Watermarking Scheme Based on 3-D DCT.Industrial Electronics and Applications, 2006 1ST IEEE Conference, pp. 1–6
^ Jin Li, Moncef Gabbouj, Jarmo Takala, Hexin Chen. Direct 3-D DCT-to-DCT Resizing Algorithm for Video Coding. Image and Signal Processing and Analysis, 2009. ISPA 2009. Proceedings of 6th International Symposium
pp. 105–110
^ 10.0 10.1 Angelini, E., Grassin, S. ; Piantanida, M. ; Corbellini, S. ; Ferraris, F. ; Neri, A. ; Parvis, M. FFT-based imaging processing for cultural heritage monitoring Instrumentation and Measurement Technology Conference (I2MTC), 2010 IEEE