不再更新的 Maple

曼妙光阴,一缕繁华

Nyquist、音频与影像采样

,

-------------------------------------------------------------------------------------------------------------------------------------------------
In the 1920s, while working at Bell Labs, Nyquist developed a theorem concerning the digital sampling of electrical signals. The theorem states simply that to accurately reproduce an analog signal, the digital sampling rate must be twice the frequency of the original signal. In plain English, if you have an audio signal, for example, which repeats 10,000 times per second, you can accurately reproduce that signal if you digitally sample it twice as often (20,000 times per second). (starizona
-------------------------------------------------------------------------------------------------------------------------------------------------

奈奎斯特采样定律:如果对某一模拟信号进行采样,则采样后可还原的最高信号频率只有采样频率的一半,或者说只要采样频率高于输入信号最高频率的两倍,就能从采样信号系列重构原始信号。

音频采样方面,人耳的听阈一般在20-20000赫兹范围内,那么这样需要数字化的时候我们需要大约40k赫兹的采样率。事实上我们如果仅从这方面看,数字音频的质量与采样率的关系如下:


质量的差别不用一定的设备有时很难听出来(用外放一般很难听出来,因为在相同价位上头戴式耳机可以比音箱好很多),对发烧友来说,耳朵的训练也是不可或缺的因素
eg: 试听 Beautiful Day - U2···16k| 64k|128k

另外一个重要的概念就是量化位数,类似影像采样中色深的概念,它决定了数字音频的动态范围,通常取2的n次方——8位和16位最为常用,如果计算成每分钟音频所占空间大小,有这样一个关系(单声道):

一般网上下载的MP3很少能提供16位量化位数,而CD一般能达到这一指标:我们以双声道计,一张CD碟标准大小700M,播放时间70分钟(据说是正好播放贝多芬第九交响曲的时间,因为开发这玩意的工程师很喜欢贝多芬),那么每分钟大概10M,每声道5M,采用16位量化位数的话,正好符合40kHz左右的采样率。

影像采样较音平稍微复杂一些,因为是二维采样,而又没有直接的频率阈值的概念——动态图像,也就是视频在这里跟好理解。在这里一般采用的方法就是傅立叶变换得到一定的频域。在直接获取数字影像的时候starizona提供了较为全面的考量和决策。

一般实际处理中我们的采样如下:
汉字:32*32~64*64(像素,下同)
显微镜像:256*256~512*512
卫星影像(LandSat 单波段):3240*2340
SAR(合成孔径雷达):8000*8000
采样是影像影像质量很重要的因素,eg:

600*400

180*80


类似音频,影像采样中量化位数称为色深,一般也是2的n次方,真彩色的影像一般要求是三原色每种颜色8位共24位颜色
,我们平时在显示器上看到的32位自然是更好的影像质量,但是这是说我们的显示器提供了这样的能力,而我们处理的数字影像不一定达到这样的要求,和音频不同的是,影像质量的好坏一般人很容易区分开来,eg:

32位

4位


均匀的三原色采样有时并不能复原真实效果,starizona同样提供了这方面的考量和决策

Pattern Recognition in Remote Sensing《老男孩》