SERVER HEALTH CHECK: OK
ID/PW 찾기 회원가입

[오디오]  [리시버] 96KHz, 192KHz 가 거의 의미 없는 이유

 
9
  16060
2009-11-30 11:58:22
전문적으로 공부한 사항이 아니라 틀린부분이 있을수도 있습니다만 개략적인 개념은 아마 정확할 겁니다.

혹시나 틀린부분 있으면 지적해주시면 감사하겠습니다.



우리가 듣는 소리는 아날로그 신호 입니다.

이걸 디지털화 시킬려면 샘플링을 하게 되는데 이 샘플링의 빈도수가 높을수록 원음에 가까워 지게 되는거지요.

여기서 Nyquist 이론 이란게 나옵니다.
(정확히는 Nyquist - Shannon sampling theorem)

이 이론에 의하면

"the theorem shows that a bandlimited analog signal
that has been sampled can be perfectly reconstructed from an infinite sequence of samples if the sampling rate exceeds 2B samples per second, where B is the highest frequency in the original signal."

샘플링레이트가 원래신호의 최고 주파수의 2배 이상이면 원래신호가 완벽하게 복원 가능하다는건데...

다시 말하면 CD 의 경우 44.1KHz의 샘플링 레이트를 가지고 있기 때문에 22.05 KHz 까지는

아날로그 신호 복원이 왜곡없이 완벽하게 가능하다는 말입니다.

이미 원 신호가 완벽하게 복원 가능한 상태이기 때문에 거기서 샘플링 레이트가 더 늘어난다고 해서

22.05KHz 미만의 신호가 더 음질이 좋아지거나 하지는 않습니다.


같은 원리로 48KHz, 96KHz, 192KHz 로 샘플링 레이트가 늘어나면 왜곡없이 복원 가능한 신호의 범위가

늘어나는것일 뿐이지 음질이 좋아지는건 아닙니다.


현재 시판되고 있는 대부분의 스피커의 출력 범위는 25KHz 미만입니다.

그말인 즉슨 48Khz 샘플링레이트 면 충분하고 (여기서 추출되는 아날로그 신호가 24Khz 니까요) 96Khz 신호

처리해서 입력해봐야 스피커가 처리 못하는 범위라는 거죠.

일반인들은 구경조차 힘드는 수천만원 짜리 JBL 에베레스트급 이라고 해도 50KHz 미만,

즉 96KHz 샘플링레이트 신호는 소화해 낼수 있지만 여전히 192KHz 신호는 능력 밖입니다.

192Khz 샘플링 레이트에서 나오는 신호는 96Khz 까지 실려 있는데 이걸 처리할려면 소위 말하는

슈퍼트위터란 놈을 달아야 합니다만 사실 이거 달려 있는 스피커는 별로 없죠.
(가격 문제가 아니라 실용성 문제라서요)


그럼 50Khz정도 까지 출력 가능한 스피커를 가지고 있으면 96Khz 신호가, 슈퍼트위터가 달린 스피커가 있으면

192Khz 신호가 절대적으로 의미가 있게 될까요?

그렇지도 않습니다.


대부분의 사람들은 20Khz 넘어가는 소리는 인식하지 못합니다.

보통사람들은 대부분 10Khz 후반대 정도 기록하고 귀 좋다는 사람들 (사운드 엔지니어, 음악가) 정도 되어야

20Khz 대 초반 찍습니다.

25Khz 정도만 되어도 슈퍼휴먼이지요.
(보통 인간은 못듣고 개만 듣는다는 개피리 주파수가 10Khz 후반대에서 20Khz 초반 정도입니다.)


그렇기 때문에 순수 가청주파수로만 따지면 48Khz 샘플링레이트면 충분합니다.

대부분의 사람들은 96Khz 신호를 제대로 출력할 환경도 안되어 있고 출력해도 그걸 제대로 들을수 있는

인간은 없습니다.

개의 가청 주파수가 45Khz 정도 됩니다.

96Khz샘플링레이트를 가진 신호에서 추출되는 48 Khz 소리는 개의 능력조차 넘어선 소리입니다.

한술 더 떠서 192Khz에서 나오는 96KHz 소리는 박쥐 초음파 레벨이구요.


정리하면 소유하고 있는 스피커 스펙이 받쳐주지 않으면 96KHz나 192KHz는 의미가 전혀 없구요.

스피커 스펙이 받쳐 준다고 해도 본인의 귀가 거의 초능력이라 할 정도로 발달해 있지 않으면 현실적으로

별 의미가 없습니다.

님의 서명
Gentlemen, You Can't Fight In Here! This is The War Room!
70
Comments
2009-11-30 12:09:51

이 밑의 글에서 무손실압축과 MP3로 인코딩된 차이를 느끼기는 한다고 댓글을 쓰긴 했지만, 주관적인 것일 뿐이고, 다르다는 걸 넘어서 무손실압축 사운드가 음질상 나은 것이라는 말은 죽어도 못하겠더군요.

좋은 정보 감사드립니다.

물론, 그래도 저는 지금까지처럼 최대한 무손실압축을 추구한다는 데 변함은 없습니다. 어차피 제 MP3용량이 부족한 건 아니니,,, 구태여 손실압축을 선택할 절박한 이유가 없으니까요. 고민할 이유가 없는 거죠. ^^

마찬가지로, 지금 가지고 있는 리시버가 192kHz 샘플링을 지원하는 데, 구태여 낮은 샘플링을 선택할 이유도 없겠죠.

2009-11-30 12:14:25

이 밑의 글에서 -> 차한잔의 글에서

WR
2009-11-30 12:22:10

그쵸.
있는거 쓴다고 손해 볼 일은 전혀 없으니까요.
저만해도 스피커는 전혀 받쳐주지도 않지만 96KHz 지원하는 소프트는 96KHz 선택해서 듣습니다.

다만 본인의 리시버가 96KHz나 192KHz 지원 안한다고 해도 별로 신경쓰실 필요가 없다거나, 리시버를 새로 들일려고 하는데 모든 조건이 똑같고 96Hz, 192KHz 지원 부분만 다르면서 가격이 비싸면 굳이 비싼 물건 살 필요는 없다는 뜻 정도로 쓴 글이였습니다. ^^

2009-11-30 12:28:12

잘 정리해서 올려주셨네요
그런데 첨언 하자면 44.1KHz의 샘플링 레이트를 가지고 있기 때문에 22.05 KHz 까지는 왜곡없이 완벽하게 가능하다고 쓰셨는데
실제적으로는 20khz까지가 정확합니다
실제 dsp처리에서 ideal한 analog/digital filter를 만들수 없기때문에
2khz정도는 여유분으로 가져가는 겁니다
하지만 이론적으로 얘기하면 22.05 KHz 가 맞긴하죠

그리고 고 샘플링이 등장하면서
20khz이상은 듣지 못하지만 곡의 분위기를 조성해준다는
이론이 전파되고 있더군요 ㄷㄷㄷ

여기에 대해서는 정말 노코맨트입니다.;;

WR
2009-11-30 12:42:14

지적 감사합니다.

역시나 어깨넘어로 배운 지식엔 한계가 있을수 밖에 없죠. ^^;;

2
2009-11-30 12:35:29

아 가청 주파수와 비트레잇은 전혀 별개의 문제입니다. 물론 비트레잇이 44.1이나 192나 사람귀에 똑같다 아니다는 저도 맞을수도있고 틀릴수도 있다고 봅니다.
하지만 스피커에 표시된 스펙은 그 스피커가 소리를 낼수있는 저음역, 고음역을 나타내는겁니다.
비트래잇은 그 소리의 저,고역에 관계없이 일정시간동안 몇회만큼 쪼개서 샘플링했냐를 나타낸 수치이고요.
그렇기 때문에 비트레잇을 가청주파수에 비교해서 설명하시는건 비교대상이 잘못됬다는걸 말씀드리는겁니다. ^^;;;

WR
2009-11-30 12:40:46

밑에 글에 덧글 달았습니다만 음의 저고역은 파형이 얼마나 밀집되냐에 따라 나타나는거지 Y축으로 올라간다고 고음이 되는게 아닙니다.
극단적으로 밀집되어있는 파형을 왜곡없이 샘플링 할려면 샘플링레이트가 높아야 하는겁니다.

그렇기 때문에 고음을 처리할려면 높은 샘플링 레이트가 필요하게 되는것이고 샘플링레이트와 스피커의 고역처리능력이 밀접하게 연관되게 되는것입니다.

2009-11-30 12:41:25

비트레이트와 48khz는 전혀 상관없는 용어입니다
비트레이트는 bit x sampling 주파수 이구요
48khz는 샘플링 주파수 입니다
그리고 샘플링 주파수는 소리를 낼수있는 고음역을 표현합니다

2009-11-30 12:51:22

http://www.reportnet.co.kr/knowledge/pop_preview.html?dn=1140463
이글에서 비트레잇하고 샘플링주파수에 대해 잘써있으니 참고하시면 좋을듯합니다.

WR
2009-11-30 12:58:44

자바워크 님은 Sampling rate, Bit depth, Bit rate 등의 개념을 한번 제대로 공부해보시기를 권해드립니다.

링크된 글은 그저 대략적인 개념일 뿐이고 그다지 자세한 설명은 나와있지 않은 글입니다.

엄밀히 말하면 샘플링레이트가 높아질수록 음질이 좋아지는게 아니라 표현할수 있는 음의 영역이 넓어지는겁니다.

Bit Depth 가 클수록 얼마나 섬세한 소리변화를 표현할수 있냐가 결정되는거구요.

둘이 합쳐져서 최종 음질이 결정되는겁니다.

고로 링크된 글에서 처럼 단순히 샘플링레이트가 올라간다고 음질이 올라간다 라는 표현은 잘못되도 한참 잘못된 표현이구요.

1
2009-11-30 12:40:29

추가로 말씀드리자면 높은 비트레이트를 선호하는 이유는 소리는 아날로그파이기 때문입니다. 디지털로 변환하자면 당연히 같은 시간동안 쪼개는 횟수가 많을수록 원래의 음와 유사해지기 때문이죠.
어느 정도의 한계에서 사람귀로 구분하느냐는 별개의 논의가 필요한거고요.
단지 소리는 고음이냐 저음이냐를 주파수로 표시할수있는거고 그 소리를 단위시간동안 몇번을 쪼갰느냐도 주파수로 표시가 가능하기 때문에 단위가 Hz로 같을 뿐인겁니다. 단위는 같으나 그것이 어떤값을 나타내는것인지는 전혀 다른거인거고요 ^^;;

2009-11-30 12:43:46

어느 정도의 한계에서 사람귀로 구분하느냐는 별개의 논의가 필요한거고요.
->논의가 끝난 얘기입니다 44.1khz이상 쪼개면 더이상 들을수 없습니다
(차이를 느낄수 없습니다)
이유는 저와 핫토리한조님이 아래글에 정리했습니다

2009-11-30 13:15:20

아 저도 덕분에 비트레이트와 샘플링 주파수의 개념을 바로 잡을수있었습니다. ^^;
전 비트레잇이 높으면 무조건 좋다 그런게 아닙니다 단지 스피커의 스펙으로 비트레이트에 대해 설명하시는건 잘못이라는거죠. 소리의 차이가 나냐 안나냐는 결국 그 음원이 아날로그 신호로 변화된 후의 문제 아니나는게 제 의견입니다.

2009-11-30 13:17:35

아날로그로 잘뽑아봤자 스피커에서 말짱꽝이 된다는게 제의견입니다
사람이 그차이를 느낄수 없다는것
효용성이 전혀 없다는 얘기죠

2009-11-30 14:03:42

그게 말짱꽝이냐 아니냐에 대한 얘기가 아닙니다. 거기에 대해서는 저는 판단할 생각이 별로 없고요.
단지 전혀 관계없는 스펙으로 설명할 일이 아니라는겁니다. 샘플링 주파수가 높은거하고 그 스피커의 스팩과는 전혀 무관한데 그걸로 설명을 하시니까 드리는 말씀이죠.
그냥 여기까지만 쓰겠습니다.

2009-11-30 14:20:30

샘플링 주파수가 높은거랑 스피커의 스펙이 밀접한 관계가 있다고 말하고 있는데 자꾸 무관하다고 하시니까 빙빙 도네요

http://dvdprime.dreamwiz.com/hardware/ReviewDetail.asp?hw_id=746086&master_id=100
다른 스피커들과 어떤 스펙이 다른지 보세요
FREQ range가 50khz입니다
이정도 되면 96khz가 의미가 있습니다
사람이 들을수 있던 없던
스펙에 나와있는 FREQ range 와
샘플링 주파수가 왜 자꾸 관계가 있냐고 의심이 들으시면
신호및 시스템이라는 책에서 sampling theory와 nyquist 이론을
다보시면 됩니다
제가 여기에 주절주절 쓸 능력이 안되서요
샘플링을 많이 하면 원신호에 더 가까워지는건 사실이지만
이미 스피커에서 소리가 나올때는 44.1khz와 다를게 없다는겁니다
들을수 있고를 떠나서

2009-11-30 14:25:47

일반적인 스피커에 96,192khz의 신호를 집어넣는건
배불뚝이 TV에서 블루레이보는거랑 마찬가지입니다

2009-11-30 14:36:16

Hz는 단지 주파수의 단위일뿐입니다. 1/S(주기)의 역수일 뿐이죠. 그리고 스피커 스펙을 표현하는 Hz와 샘플링주파수를 표현하는 Hz는 단위만 같을 뿐이고 나타내는값이 다른거라는게 제 얘기입니다. 그냥 글을 하나 올려보겠습니다. ^^;;

2009-11-30 14:39:33

44.1KHz, 96KHz, 192KHz 같은 샘플링주파수라는 것은 스피커로 출력되는 아나로그 주파수가 아닙니다. 아나로그 원신호를 디지틀신호로 샘플링할 때 쓰는 클럭주파수입니다. 따라서 디지틀화되기 이전의 아나로그 음원이 20-20000Hz 였다면 스피커로 가는 신호는 20-20000Hz가 가는거죠.

2009-11-30 15:07:18

좀 헷갈릴 리가 써놨네요
96khz의 신호이란건 96khz의 샘플링 주파수를 갖는 데이터가 dac을 통해서 출력되는 아날로그 신호를 얘기한겁니다

2009-11-30 13:26:05

좋은 정보 감사합니다.. ^^ 좋은게 좋은거긴 하지만, 역시 차세대 풀 192Khz된다고 아주비싸게 리시버 살필요는 없었나 싶네요.. *^^* 그냥 차세대 96khz지원 리시버에 만족해야겠습니다..

2009-11-30 13:34:24

저는 이런 이론적인 글보다도...실제 192khz로 업샘플링되는 cdp에서 업샘플링 on/off시에 정말 차이가
하나도 없었는지..청음에 대한 의견이 더 궁금하네요...

2009-11-30 21:01:28

cdt를 메리디안G08을 앰프에 붙였더니 상상할수 없을 만큼 탄력있고 맑은 음이 나오더군요.....
이전 DV9600, HD2000, 8300등의 복합장비와는 비교할수도 없을 정도더군요....
이차이가 아마도 24비트 업스케일링의 위력이 아닐까 합니다....

2009-11-30 14:11:54

오랜만에 살짝 공부가 됐네요...

그냥 머리 속에서 생각해 봤는데...(전 음향 전공자 아닙니다....^^;;)

소리라는 게 수 많은 배음(Harmonics)가 합쳐져서 하나의 소리가 되는 건데...
그럼 그 중에서 가청 주파수 범위를 넘어가는 주파수가 가청 주파수 내의 다른 범위에 영향을
주게 된다면...결국 Sampling rate가 더 켜져야 하는 거 아닌가까지 생각이 갔다가...

음을 "재현"하는 것과 "재생"하는 것에는 차이가 있다고까지 가게ㅤㄷㅚㅆ네요...
(음향하시는 분들은 당연히 아시겠지만서도..^^)

결국 '녹음'과 '재생'은 수 많은 배음을 고려해서 되는 것이 아니라,
단순히 시간축을 기준으로한 그래프상에서 움직이는 거니까, (녹음장비, 앰프, 스피커)
단순하게 가청주파수 대에서 Nyquest 이론을 적용해도 되겠다는 생각이드네요...

하지만, Synthesizer등을 통한 동일음의 '재현'이라는 측면을 생각하면....
위에서 말한대로 가청 주파수 대역 이상의 주파수가 배음으로 다른 낮은 주파수에 영향을
미치고 있을 수 있으므로 더 높은 주파수대역의 sampling이 필요하겠구나....

라고...스스로 결론을 내렸습니다..

이렇게 생각하는게 맞겠죠? 어떠세요?

2009-11-30 14:29:09

비가청 주파수의 배음에 의한 가청주파수 내의 증폭을 말씀하신다면 맞습니다
녹음과 재생은 이미 영향을 받은 결과를 가지고 녹음과 재생을 하기때문에 사람이 듣는 상황에서의 재현이 완벽하다고 할수 있지만
'재현'에서는 실제 미디어에서 들었던 상황과 다른 상황이 연출되겠네요
근데 요즘에는 그런것 까지 계산해서 '재현'하지 않을까요? ㅎㅎ

WR
2009-11-30 14:34:55

음...일단 저보다 내공이 훨씬 높으신듯 하네요. ^^

여기저기서 줏어들은 지식, 어깨너머로 배운 지식들이라 자세히는 모르지만 사운드엔지니어링 분들 말로는 단순한 재생이 아닌 음원을 섞는다던가 하는 과정에서는 좀 여유있는 샘플링레이트를 가지는것이 유리하다라는걸 들은적이 있는데 그게 아마 maple 님이 말씀 하시는 단순재생과 그렇지 않은것과의 차이 인거 같습니다. ^^;;

2
2009-11-30 14:30:23

아나로그 음원에 대해서 이를 디지틀화할 때 사용되는 샘플링주파수는 음질과 관련이 있다고 봅니다. 샘플링주파수는 샤논의 정리에 의해서 디지틀화하고자 하는 음원의 최대주파수의 2배의 주파수로 샘플링하면 복원하는데는 문제 없습니다. 그런데 디지틀화하는 과정을 보면 샘플링->양자화->부호화 과정이 있는데 양자화 과정을 거칠때 계단현상이 나타납니다. 복원시에는 양자화 계단을 없애기 위한 보간화 과정을 거쳐서 원래 음원에 가깝게 복원하게 됩니다. 일반적으로 디지틀 신호의 특성을 말할 때 기본적으로 양자화잡음이 있다고 말합니다. 양자화잡음은 간단히 예를 들어 보자면 1Hz를 샤논의 정리에 말한 2배의 주파수인 2Hz로 샘플링 한다면 1Hz는 정방향으로 1번, 부방향으로 1번 하여 +/- 부호만 다른 2개의 진폭을 양자화하여 배열하게 되는데 이때 계단식으로 배열된다는거죠. 그래서 샘플링주파수를 높여 주면 이 양자화 계단이 조밀해져 복원시 원음에 가깝게 복원하기가 더 용이해진다는 겁니다. 샘플링주파수를 96KHz, 192KHz를 사용하는 목적이 a/d, d/a시 원음에 충실하기 위한것이지 출력되는 아나로그 주파수 대역폭을 넓어 주는 것이 목적이 아니라고 생각합니다.

WR
2009-11-30 14:51:03

일단 제가 Nyquist-Shannon Sampling Theorem 을 내용까지 전부 이해하고 있지는 못한다는걸 먼저 밝힙니다.

하지만 분명 저 정리에 의하면

아날로그 신호가 그 신호내 최대 주파수의 2배 이상의 빈도로 샘플링되면

"can be perfectly reconstructed"

된다고 밝히고 있습니다.

1Hz 신호를 2Hz로 샘플링했다가 다시 아날로그 화 하는 과정에서 계단때문에 완벽복원이 안된다면 저 정리가 틀린게 되죠.

샘플링레이트가 대역폭 이외에 음질에 영향이 없다라고 생각하는 또다른 이유는 이쪽에 관심이 있어서 대학시절에 여기저기서 자료를 찾아본적이 있는데 디지털 음원의 샘플링레이트 관련해서 나오는건 죄다 주파수 대역폭 관련 뿐이고 실질적 음질에 관한 자료나 논문은 찾질 못했습니다. (이건 제가 검색능력이 부족해서 그런걸수도 있습니다만)

암튼 블루버드님이 말씀하신 양자화계단 관련 문제를 완벽하게 해결할수 있는 방법이 있기에 나이퀴스트-샤론 정리가 유효한게 아닐까 하고 생각하고, 만약 그 방법이 없다면 저 정리 자체가 틀린것이라고 봅니다.

2009-11-30 14:51:48

맞습니다 digital->analog로 변환시 계단현상이 문제되죠
그 계단현상을 없애는게 dac고 뒷단의 아날로그 필터입니다
따라서 dac에 의해 음질이 영향이 받죠
아무리 상향 평준화되어도 dac간의 차이는 있을거라고 봅니다

그런데 블루버드님이 말씀하신 방향으로 디지털부에서도 계단현상을 줄이려는건
주로 oversampling이라는 기법으로 구현되죠
20khz이상의 data는 싹 밀어버리고 시작합니다
이경우 비가청 주파수의 data가 살아서 들어오는 경우 이 성분또한 계단현상의 주요원인이 됩니다
만일 96khz나 192khz가 20khz이상의 데이터를 갖고 있지 않다면 블루버드님이 설명한 이론이 맞아떨어집니다

2009-12-08 10:54:50

어찌어찌하다가 로그인하게 되었네요... ^^
블루버드님 말씀이 정답이라고 생각합니다.
음질이 좋아진다기 보다 "녹음되었던 원음재현" 에 가까워지는 것이죠.
더 높은 비트, 더 높은 샘플링레이트는 거기에 의미가 있습니다.

양자화된 디지털신호에서 아날로그파형으로 복원하려면 샘플링레이트가 높을수록 본래 파형에 더 가까워지겠죠.(x축 y축 모두 더 세밀하게 쪼개어진 디지털샘플링 데이터라면 본래의 파형에 더 가까워질수밖에 없습니다. 이건 이미지프로세싱도 마찬가지입니다. HD 를 넘어 UD, 그리고 그 이상까지 가는 이유는 오직 한가지뿐입니다. 본래의 아날로그신호의 완벽재현이죠.)

2009-12-08 11:00:00

아, 핫토리 한조님이 말씀해주신 실제 파형을 실현하는 부분에서의 192KHz 무효론은 저도 인정합니다. 위에 얘기는 본래의 44.1KHz 파형을 디지털데이터로부터 복구할때의 샘플링레이트에 대한 이야기였습니다.

2009-11-30 16:57:47

좋은글 감사합니다.
소리가 같아도 항상 사람의 심리상태가 변하기 마련이니 청각의 전달 체계상 같은 소리로 들리기는 힘들지요. 개인적인 청음기나 리뷰는 그런것 감안하여 걸러서 들어야 되고요. 시적인 표현이 많을때는 특히나 그렇고요.
정립된 이론은 변하기 힘드니 시적인 표현은 없더래도 오히려 아름답습니다.

2009-11-30 20:29:36

구별할수 없는것과 들을수 없는것은 다른 문제 아닐까요. 개가 들을수 있다면 혹은 훈련된 사람이 들을수 있다면 그건 없는것이 아니라 구별하지 못하는것일뿐. 아날로그 좋아하는 사람은 결국 이상한 사람되는건가요?

2009-11-30 21:22:14

너무 민감하게 생각 안해주셨으면 좋겠습니다. ^^;
사람마다 청취할수있는 영역도 다르고 나이에 따라서도 달라지는게 청취영역이니 당연히 다른건 다르죠. 그리고 제가 쓴 윗글에서 이해를 한건 이론상으로 어떤 맥락에서 말씀하신거라는걸 알았다는겁니다. 한조님께서 왜 음원의 샘플링 주파수와 스피커의 성능을 연계해서 말씀하신건지 이해를 했다는거고 그게 이론적으로 납득이 간다는 얘기입니다. 그것과 별개로 전 같은 소리로 만든 음원이라면 당연히 고용량의 음원을 선택할겁니다. 제가 제대로된 청각테스트를 한적도 없고 평균적인 소리만 들을수있는지 남들하고 들을수있는 영역이 같은지 아닌지는 저도 모르는데요 뭘 ^^;

2009-11-30 21:30:16

아무리 생각해도 완벽히 재현한다는것은 아닌것 같습니다.
20Khz를 위이론대로 저장한다면 40khz로 저장하면 완벽히 재생된다는것인데..
20khz의 1사이클 사인파를 40khz로 저장한다면 2번 저장하는것인데.(40KHz / 20KHz = 2)
그럼 가장높은점과 가장낮은점 딱2개의 포인트만 저장한다는것이고 딱 나누어 떨어지는
가청주파수가 아닐경우(예를들어 17KHz)에는 가장 높은점도 가장낮은점도 아닌 어중간한 점을
저장한다는것인데..이딱 2점(혹은 2.x)만 가지고 완벽히 재생한다는게 이해가 안됩니다..

아무래도 잘개 쪼개는것이 원본에 가깝다고 할수 있을것 같습니다.
위 이론의 배경을 설명해 주시면 이해할수 있겠으나,
위에 3줄로는 이해가 되지 않습니다..

WR
2009-11-30 22:45:41

http://www.lavryengineering.com/documents/Sampling_Theory.pdf

좀 전문적인 글이라 저도 세부적으로는 전혀 이해를 못하고 있는 글이긴 합니다만...(좀 길어요.)

흔히들 코묻은손님 처럼 파형을 재건축하는데 샘플링 된 부분이 많으면 많을수록 유리할것 같다고 생각하지만 결론은 Nyquist - Shannon 정리 대로 최대주파수의 2배 샘플링이면 원본복원에 필요한 모든 정보가 전부 들어있기 때문에 더 많은 샘플링을 한다고 더 정확해지는 일은 전혀 없다고 합니다.

이유는 수학적 증명으로 설명이 되고 있으며 덧붙여 실제적으로 변환과정이 어떻게 되는지 샘플링 레이트가 최대 주파수의 2배, 8배의 경우의 예를 들어서 양쪽의 결과가 같다는 것도 보여주고 있습니다.
(8배라고 더 정확한게 아니라는거죠)

2009-11-30 23:02:42

실제적으로 코묻은손님이 지적하신 부분이 직관적으로는 절대로 이해가 가지 않는 부분입니다
저걸 제대로 이해하려면
fourier transform, taylor series, sampling therory ,aliasing등을 통달해야 합니다
이쪽에서 계속 일하고 있지만
위내용중 하나도 제대로 모르는 사람이 수두룩 합니다
물론 저도 모르는 부분이 아직도 많구요
세줄로 이해가 가는게 이상한겁니다^^
관심이 있으시면 이쪽 계통 공부해보는것도 재미있는경험이 될겁니다

2009-12-01 00:18:34

아..오늘 공부는 여기까지 입니다...ㅡ.ㅡ;; (오랜만에 정말 머리 굴리네요...)
"신호와 시스템" 과목 배운지도 10년이 넘었고...그나마 그 때는 시험에 급급하느라
그렇게 재미있게 공부하지도 않았습니다...^^. 그 때 이렇게 음향에 관심 있었음
더 열심히 공부하는 건데....

핫토리한조님이 링크하신 내용이 딱 정답이네요...
저도 공부한지 오래되어서 코묻은 손님이 말씀하신 내용을 보고 잠시 또 고민에 빠졌습니다....사실 저도 그냥 윗부분은 잘라내고 귀가 듣지 못하는 영역이니까 상관 없는 건가? 이렇게 이해하고 넘어가려고 했는데....

링크의 내용을 다 이해하지는 못했지만, 결국 Sampling이라는 것이 우리가
직관적으로 생각하는 내용과 차이가 있다고 생각하시면 쉬울 것 같습니다.

직관적으로는 Sampling이 어느 한 시점에서의 Amplitude를 기록하고 기억하는
것이지만, 실제로는 수학적 Modeling을 통하게 되면 제가 잠깐 언급한 "Harmonics"로 구현하게 됩니다.

제 기억으로는 아주 옛날에 머리 좋고 심심했던 어떤 분이 모든 신호는 Sine파의 합
이나, Cos파의 합으로 나타낼수 있다고 정리한 수학적 이론이 결국 실제 System에
반영이 된 거죠...(아...Bulletproof님이 적어 주셨네요...모든 공대생의 공적이신 그 분들...ㅋㅋ)

그리고 실제 시스템에서 AD converter를 통과할 때, 단지 그 시점에서의
Amplitude만 기록이 된다 하더라도, 수학적 model로는 수많은 harmonics성분이
더해진 것으로 볼 수 있기 때문에 Original음에 가까와 지는 것이네요.

즉, 직관적으로는 한 지점에서 한 번의 Sampling입니다만,
수학적으로 볼 때는 각 Harmonics 성분을 모두 꺼네게 되기 때문에 이 신호들을
모두 더했을 때, Original 신호에 가까와 지는 내용이네요...(약간 잘못 이해한 부분도
있는 것 같고...ㅡ.ㅡ;;)

어쨌든 핫토리한조님이 링크하신 자료를 보면 추가적인 Sampling이 Original 신호를
재현하는데 도움이 되지 않는 다는 것도 증명이 되어 있는 것 같습니다.

2009-12-01 00:30:20

음... 아까보다는 좀더 그럴수도 있겠다는쪽으로 생각해보고 있습니다.
어쩌면 파형 복원이 가능할지도...라는
저는 우선 이렇게 이해하겠습니다.
2배수면 완벽한재생이 이론적으로 가능하다..

하지만 실제로 96KHz의 녹음파일이 들어보면 좋습니다.
예가 될수있을지는 모르겠지만 하나의 sacd 하이브리드 음반에 들어있는 cd음원과 sacd의 음질은 같은 녹음이겠지만 제 시스템에서 분명히 sacd가 좋게 들립니다.
그렇다면 sacd가 더 원음에 가깝다는것인데..44.1KHz로 가청주파수의 음원이 완벽히 재생된다면 cd 음질이 나쁠이유는 이론적으로 없습니다..

제가 좋게 듣는이유는, 가정하면
1. 20KHz이상의 소리가 음질에 영향을 미친다
2. 재생시에 음원의 손실이 일어난다
정도가 가장큰 원인이겠군요..
어쨌든 이런 이론이 있다는것도 알게되고 좀더 깊게 생각할수 있는 기회가 되었습니다.

2009-12-01 00:47:55

결국은 녹음-재생(AMP)-스피커 이 모든 장비가 높은 주파수의 재생이 가능하도록 되어 있다면, 약간은 그 차이가 발생하거나 느껴질 수도 있지 않나 싶습니다. 이렇게 생각이 가능 한 것은 두 가지 정도인데요.

하나는 위에서 제가 잠깐 생각한 대로

1. 가청 주파수 대보다 높은 주파수의 "배음에 의한 가청 주파수 대의 증폭"이 있다면

일 것 같구요, 다른 하나는,

2. 심리적인 영향력 (심리학 연구 결과에 따르면 가청 주파수를 넘는 대역에 어떤 의미를 담은 메시지를 넣으면 인간이 무의식적으로 반응한다는 내용이 있었죠...이 부분은 사람마다 감응력의 차이가 있을 수 있겠고...)

하지만 어떤 경우에든 Speaker가 재현하지 못한다면...2번은 불가,
1번은 녹음시에 그런 부분이 Capture되지 않는다면 불가...가 될 것 같습니다.

2009-12-01 09:12:52

CD가 물론 sacd보다 음질이 않좋습니다;;
그런데 지금 나온 관점하고는 약간 다릅니다
CD는 16bit, sacd는 24bit입니다
bit수가 많아지면 일단은
소리측면에서 dynamic range가 넓어지는 효과가 있습니다
신호측면에서는 양자화 에러가 감소하구요

2009-12-08 02:56:26

SACD는 1bit DSD 방식으로 알고 있는데요...

http://en.wikipedia.org/wiki/Super_Audio_CD

WR
2009-12-08 03:00:40

실제로 SACD와 일반 CD의 음질 차이는 단순한 플라시보 효과일 확률이 무척 높습니다.

http://mixonline.com/recording/mixing/audio_emperors_new_sampling/

2009-12-01 16:01:25

DR이 넓어지지는 않지 않나요?
양자화 에러는 감소합니다만.
16bit하고 24bit가 양자화 하는 양의 구간이 달라진다면 몰라도

2009-12-02 09:17:59

dynamic range란 처리할수 있는 최소치와 최대치의 비율입니다 단순히 큰신호를 처리할수 있다고 dynamic range가 커지지는 않습니다

2009-12-08 02:11:44

제가 알고 있는 방법으로 설명 드리겠습니다.
일단 아나로그 신호와 디지털 신호의 차이점 부터 말씀드리겠습니다.
아나로그 신호는 연속적인 신호입니다. 소리의 시간 간격을 아무리 좁게 쪼개 보아도
그 값이 존재합니다. 그러니 해상도는 무한대라고 할 수 있죠.
그러나 디지털 신호는 일정한 간격으로 각 시각의 소리를 수치화 합니다. 이를 전문용어로
양자화 한다고 합니다. (일정한 간격으로 수치화 하는 이유는 디지털신호로 변환 하기 위해서는
일정간격으로 각 순간의 소리를 수치화 하는 과정이 필요하기 때문입니다. )그런데 이 일정한
시간 간격을 예들들어서 1초 단위로 수치화하는것과 0.1초 단위로 수치화 하는것의 차이를 보면
조밀한 간격으로 수치화 한것이 원래의 아나로그 신호에 근접하게 되는 것입니다.
샘플링 레이트란 이와같은 일정한 시간 간격을 얘기하는 겁니다.
우리가 흔히 알고 있는 샘플링 레이트인 44.1KHz, 48KHz, 96KHz, 192KHz 등이 되는 것이지요.
위에서 나이퀘스트 이론을 거론하신것처럼 일반적으로는 아나로그 신호 주파수의 2배 이상으로
샘플링을 하게 되면 다시 아나로그로 복원했을 때 원 신호와 별 차이를 못 느낀다는 얘기입니다.
일반적으로 인간의 최고 가청 주파수가 20Khz라고 하므로 그 두배인 40Khz 이상이면 된다는 거지요.
이 샘플링 레이트는 스피커에서 소리를 낼 수 있는 아나로그 신호성분의 주파수 대역과는 별개의
문제입니다. (엄밀하게는 전혀 상관 없지는 않구요, 개념상으로는 다른 개념이라는 겁니다.)
이러한 이유로 샘플링 레이트가 높을 수록 원음에 가깝게 되어 이상적으로 되지만 샘플링 레이트가
높아지면 데이터량이 그만큼 늘어나게 됩니다. 데이터량이 늘어나게 되면 이 신호를 처리하는 모든
하드웨어 비용이 상승하게 되는 문제점도 생기게 된답니다.
또다른 용어로 비트수와 다이나믹 레인지라는 용어가 등장했는데 우선 비트수가 음질에 미치는
영향을 설명 드리면, 16비트규격의 소리와 24비트규격의 소리는 어떻게 다를까요? 16비트는 65,536단계로
최저 소리와 최대 소리구간을 나눌 수 있습니다. 24비트는 같은 크기의 소리를 1,677,216단계로 나눌 수
있습니다. 그렇다면 동일한 음악을 16비트로 녹음한 소리와 24비트로 녹음한 소리는 어떤게 자연음에
가까울까요? 당연히 24비트처리한 음악이 원음에 가깝습니다. 위에서 아나로그 신호를 디지털화 할때
일정한 시간 간격으로 샘플링 한다고 했는데, 각 샘플링 주기에 몇 비트로 신호를 처리하느냐에 따라서
16비트로 처리 할수도 있고 24비트로 처리 할 수도 있습니다. 비트수가 높을수록 섬세한 소리의 구분이
가능하게 되는것이지요.
다음으로 다이나믹 레인지를 설명 드리면 (이건 설명이 가능할 지 모르겠습니다만....) 동일한 음악을
디지털로 변환하는 데 있어서 최소 소리와 최대 소리구간을 어떻게 처리하는냐의 문제입니다.
위에서 비트수가 16비트냐 24비트냐에 따라서 세밀함의 차이를 구분할 수 있다고 했는데 일단 16비트
규격으로 녹음 한다고 했을 때 최저소리와 최대 소리의 구간은 이론적으로 0~65,536단계로 나눌 수 있는데
동일한 음악에 대해서 녹음하는 소리의 구간을 0~65,536단계로 처리하느냐 아니면 0~50,000단계로
하느냐에 따라서 표현의 범위가 달라질 수 있습니다.(100~55,000단계, 1,000~30,000단계 등 여러가지
방법으로 최대 최소 구간을 정할 수 있습니다.) 이것을 다른 표현으로는 스케일링이라고도 합니다.
그러면 동일한 음악을 0~65,536단계로 녹음한 것과 1,000~30,000단계로 녹음한 소리는 어떻게 다를까요?
당연히 0~65,536단계로 녹음한 소리가 훨씬 원음에 가깝다고 할 수 있겠죠. 이와 같은 개념을 다이나믹
레인지라고 합니다.
이상 제가 알고 있는 개념으로 설명을 드렸는데 이해가 되셨으면 좋겠습니다.

WR
2009-12-08 02:38:51

위에 코묻은손님 덧글에 달았던 링크 다시한번 답니다.

http://www.lavryengineering.com/documents/Sampling_Theory.pdf

샘플링레이트가 2배 이상이 되면 별 차이를 못느낀다는 뜻이 아닙니다.

똑같은 신호를 최고주파수의 2배로 샘플링하나 8배로 샘플링 하나 결과가 100% 같습니다.

2배로 샘플링한것과 8배로 샘플링 한것이 차이는 있지만 인간이 못느끼는게 아니라, 아예 차이 자체가 없는거구요.
(샘플링 및 복원 과정까지 설명되어 있습니다)

결국 고샘플링 레이트의 장점은 더 높은 고음(높은 주파수)을 처리할수 있다는것이고 이건 스피커의 아날로그 주파수 대역과 직접적인 연관이 있는거죠.

2009-12-08 12:03:04

흐르는 강물처럼님이 정말 자세하고 정확하게 말씀하셨네요..^^

2009-12-08 09:44:12

dp 대문에 걸려있어 뭔가하고 들어와 봤는데
'흐르는 강물처럼'님과 '자바워크'님의 댓글처럼 샘플링레이트와 가청주파수는
별개의 문제로 같이 연계하여 제고할 만한 대상이 아닙니다.
본문 '핫토리한조'님의 글은 17행의 '~ 좋아지는건 아닙니다'까지를 말씀하고 싶은것인데,
이후 초고역 얘기가 나오면서 조금 다른 방향으로 흘러간 것 같군요.
영상으로 비유하자면...
Upsampling의 샤프니스, 그레인 얘기하다가
갑자지 Above White, Below Black이 재현되면 눈이 시원해지는
느낌인가를 묻고 있다는 느낌입니다.
뼈속까지 오디오파일인 사람으로서 물리적 스펙도 중요하지만
취미의 영역에서의 오디오는 기기 자체가 가지는 존재감도 중요하다고 생각합니다.

WR
2009-12-08 10:02:11

샘플링레이트와 가청주파수는 밀접한 관계가 있다고 생각합니다.
실제로 고샘플링레이트 관련 자료들 찾아 보면 가청주파수를 언급하고 있는 글들이 많구요.

본문을 영상으로 비유해서 정리해보면
1. 해상도가 올라간다고 명암비나 색상표현력이 좋아지는건 아니다.
2. 해상도가 올라가도 디스플레이에서 그 해상도를 지원안하면 의미없다.
3. 디스플레이에서 지원해도 시청시 구별 못하면 의미없다. (20인치 화면을 10미터 떨어져서 보면 1080p 나 720p나 전혀 의미 없듯이 말이죠)

정도가 되겠습니다.

1,2번은 팩트이고 3번에서 구별/비구별을 어느선으로 잡느냐는 논의할 가치가 있는 부분이겠구요.

2009-12-08 22:44:58

1. 해상도 올라가면 암부계조, 색재현력 모두 좋아집니다.
2. 동일 디스플레이에서도 소스기기 업그레드하면 화질 좋아진다고 생각하는게
일반적인이겠죠.
3. 20인치 모니터를 10m 거리에서 구별이라... 비유가 좀 적절치 않네요~

WR
2009-12-09 01:24:00

해상도와 암부계조, 색재현력은 상관이 없습니다.

일반적으로 고해상도 디스플레이는 저해상도 디스플레이보다 고급이라 그만큼 암부계조, 색재현 부분도 고성능이기 때문에 덩달아 좋아지는거지 해상도 때문에 좋아지는건 아니죠.

극단적으로 1080p 흑백 모니터도 가능합니다. (단색모니터)
흑백이기 때문에 암부계조나 색재현력 부분은 구형 배불뚝이 TV 보다도 못하겠지요.

2009-12-08 10:21:53

Sampling (A/D 변환) 전에 그리고 복원 때 (D/A 변환후) LPF (Low Pass Filter)를 통과시키게 되는데 이 아날로그 Low Pass Filter가 가청주파수 0~20kHz 구간 동안 평탄한 주파수 응답 특성을 갖고 22.05kHz에서 마이너스 무한대로 감쇄시키는 ideal한 특성을 갖는다면 44.1kHz 이상되는 sampling은 필요가 없게 됩니다. 그러나 아날로그 소자가 이러한 이상적인 performance를 낼 수 없기에 A/D, D/A 과정에서 작게나마 오류가 생기게 됩니다. 샘플링 주파수를 96kHz, 192kHz로 늘리게 되면 샘플링 및 복원 과정에서 생기게 되는 오류를 분명히 줄일 수 있습니다. (DSP 전공했습니다.)

WR
2009-12-08 11:12:55

오...전공자 이시군요....ㅇ.ㅇ

비틀즈&아바 님이 지적하신 부분이 위에 Bulletproof 님이 말씀하신 오버샘플링 기법이랑 연관된 부분인거 같습니다.

덧글중에 제가 링크건 자료글에서도 중간에 현실적인 시스템 하에서 오차발생 부분을 지적하고 있구요.
하지만 그자료에서는 역시나 고샘플링레이트로 가면 얻는것보다 잃는것이 많다고...
더 높은 샘플링레이트 = 더 높은 정확도, 디테일 이라고 생각하는것이 오류라는걸 분명히 밝히고 있습니다.

2004년에 쓰여진 글이기 때문에 5년동안 바뀐게 있을지는 모르겠습니다.
워낙 기술이 급격히 발전하는 세상이다 보니...

2009-12-08 11:51:10

대문에서 보고 한참 흥미롭게 읽다가 오디오 문외한이지만 전자공학 박사과정에 있는 사람으로써 댓글을 달까말까 고민하다가 비틀즈&아바님께서 다 적어 주셔서 그저 한 숟가락 얹으며 동의를 표합니다.

2009-12-08 12:06:02

그렇죠.. 이론적으론 문제 없으나 물질적 한계로 인하여 필요한거죠

2009-12-08 12:15:40

링크해 주신 자료가 영문자료였네요.. 제게는 무척 쉽게 쓰여진 자료이긴 한데요.. 이걸 쉽게 이해할 수 있도록 설명해 드려야 제가 제대로 아는건데.. 능력부족이니 가능한 데까지만 말씀드릴께요.. (사실 일반적인 Digital Signal Processing 텍스트북이랑은 조금 표기가 달라서 약간 어색해 보이네요.)

20페이지 그림에서.. 45도로 기울어져서 내려가는 현실적인 LPF에서는 aliasing이 발생하게 됩니다. aliasing은.. 예전 아날로그 TV에서 윤곽선이 겹쳐지는 현상 (ghost)이랑 비슷하다고 생각하시면 됩니다. 오디오 데이터의 고주파 부분이 복제되어 겹쳐지는 현상이지요. 이상적인 필터라면 45도로 내려가는게 아니고 90도로 내려가서 20kHz 이상 되는 부분을 완전히 제거해 내야 하는거고요. 그런데 이런 이상적인 필터는 있을 수 없지요.

2009-12-08 12:27:40

90도는 좀 극단적으로 말씀드린 값인데요..
핫토리한조님이 말씀하셨던
"원래신호의 최고 주파수의 2배 이상이면 원래신호가 완벽하게 복원 가능하다"
여기서 완벽하게 복원한다는 것의 의미가 20kHz에서 90도로 꺾여서 20kHz 이상 되는 부분을 100% 제거한다는 뜻입니다.. 실제로는 불가능하지요..
20페이지 그림에서 빨간 색 부분이 aliasing을 일으키는 부분입니다. 44.1kHz 지점에 검은색 신호가 복제되어 나타나고 있는데요.. 96kHz, 192kHz로 샘플링한다면 44.1kHz 지점에서 나타나는 복제 신호가 그만큼 더 멀리 떨어져서 나타나게 되니깐 aliasing이 줄어들게 되는거지요..

WR
2009-12-08 12:45:04

전공하신 회원님에 박사과정에 계신 분까지...
역시나 글이 대문에 걸리니 내공 깊으신 분들이 많이 오시는 군요...^^;

제 얄팍한 지식에 조금이나마 살을 보탤 흔치 않은 기회라 생각하고 열심히 가르침을 받아보렵니다...ㅎㅎㅎ

이상적인 필터가 존재하지 않음으로 해서 이론대로 되지 않는다는 것은 알것 같습니다.
그런데 링크글에서 지적된 고샘플링의 단점중에 정확도가 떨어진다 라는 부분이 있습니다.
이건 단순히 고용량의 데이터를 처리 하다보니 하드웨어 파워가 딸려서 발생하는 현상(고로 하드웨어 스펙이 발전하면 자연히 해결될 문제)인 건지 아니면 어떤 다른 이유가 있는 건지 궁금합니다.

2009-12-08 11:28:21

저 이론은 그냥 옛날 '이론'일 뿐입니다. 귀를 믿으세요.

2009-12-08 11:51:05

흠... 제가 예전에 작업했던 기억을 떠올려 보면 일단 44.1KHz와 96KHz 는 분명 음질 차이가 있었습니다. 물론 16bit 와 24bit 의 차이도 있었습니다. 물론 아날로글를 디지털로 녹음해서 바로 들어볼때의 얘기이긴합니다.
제가 녹음실에서 일할때(약 7~8년전) 하드디스크 레코딩이 급속히 보급되면서 과연 192로 녹음하는게 음질이 구분이 갈만큼 더 좋냐 라는 문제로 친구들과 실험을 했었는데요 결론은 '하드디스크가 여유가 있고 하드웨어가 따라준다면 더 높은 비트, Hz 가 음질이 더 좋다.' 였습니다.
문제는 192에 24비트 녹음은 당시 믹스할때 동시 발음 채널을 너무 많이 제한했기 때문에 타협안으로 96을 사용했었습니다. 물론 최종 결과물인 CD는 44.1에 16비트이지만 처음부터 44.1에 16비트로 녹음하고 믹스하여 마스터링한 결과물보다 96에 24비트로 녹음하고 믹스한후 최종 마스터링에서 44.1에16비트로 낮추는 것이 음질의 열화에 더 강하고 청취시 확실히 더 나은 소리를 들려주었습니다.
지금의 녹음실에서는 어찌하는지 잘 모르겠습니다만 엔지니어의 입장에서 고비트 고Hz 녹음을 선호하는것이 당연했었습니다.

2009-12-08 11:56:42

샘플레이트와 비트레이트를 설명할때 저는 디지탈 카메라 예를 듭니다.
화소와 촬영소자(CCD,CMOS)와 비슷한 것으로 이해하면 쉽다고 생각합니다. 우리는 일반적으로 화소가 높고, CCD가 크면 화질이 좋다고 생각들을 합니다. 하지만 이건 일반적이지만 절대적이지는 않습니다. 화소가 높으면 더 큰 이미지를 출력할 수 있지만 디테일이 뭉게지는 현상이 일어날 수 있고, 화소가 작으면 원하는 출력량을 맞출 수 없는 경우가 생깁니다. 또 당연하게도 기기들 마다 차이도 크고요.

음향도 마찬가지 입니다. 샘플레이트가 높다고 무조건 음질(혹은 음의 재현능력)이 좋다고 볼 수는 없습니다. 기기마다 음을 재현해 내는 방식의 특성, 능력 차가 크기 때문입니다. 실제로 어떤 컨버터의 44.1K가 같은 컨버터의 96K보다 음의 재현력이 좋은 경우가 있습니다. 하지만 평균적으로 봤을때 44.1K만을 재현해 내는 기기보다 96K를 재현해 내는 기기들이 평균적으로 더 좋은 재현력을 보여주는 건 사실입니다. 이는 음향기기의 특성상 디지털변환에서 가장 필요한 것이자 중요한 것이 디지털 필터인데 아날로그 신호를 변환할때 20K 이상은 필터로 걸려내기 때문입니다. 그런데 44.1K 에서 동작하는 필터의 성능과 96K에서 동작하는 필터의 성능이 차이가 있기때문에 결과적으로 주파수 특성을 떠나서 더 좋은 음질을 얻을 수 있습니다. 그리고 샘플링 레이트가 올라가면 오버샘플링의 비율도 올라가기 때문에 결과적으로 가청주파수대역대에서 일어나는 엘리어싱으로 인한 음질열화를 줄일 수 있습니다.

나이키스트 이론은 가청대역에서 일어나는 엘리어싱(계단화현상)을 줄일수 있는 기본 이론이지 절대적이론은 아닙니다. 오히려 최소한의 지켜야할 이론 즉 마지노선 같은 것 입니다. 여기에 디지털 필터 방식의 차이 등 여러가지 변수가 있기 때문에 나이키스트 이론을 적용하여 96K 등이 의미가 없다고 단정짓는건 오류가 있다고 생각합니다.

결론을 얘기하자면,
샘플레이트 수치가 절대적인 음 재현력의 기준이 될 수는 없지만 참고사항이 될 수 있고, 일반적으로 고 샘플레이트의 기기들이 더 우수한 재현력을 보여주고있다.
나이키스트 이론은 디지탈 컨버팅의 에러(엘리어싱)현상을 보정할 수 있는 최소한의 이론이지 음 재현력 혹은 가청주파수 대역 보존을 위한 이론은 아니다 입니다.

2
2009-12-08 12:25:07

우선 Nyquist-Shannon Sampling Theorem의 정의의 해석부터 잘못되었습니다.
샘플링 주파수가 원래 신호의 주파수의 2배 이상이어야지 왜곡없이 샘플링이 가능하고 그래야 복원할 수 있다는 의미이지 아날로그 신호를 완벽하게 복원한다는 말 자체가 불가능한 것입니다.
신호처리에서 아날로그 신호는 유일한 것으로 봅니다. 즉, 완벽하게 동일한 또다른 아날로그 신호는 존재할 수 없는 것입니다.
그러므로 여기에서 완벽하게란 말은 왜곡이 없다는 뜻이지 원래의 아날로그 신호와 동일하다란 뜻이 아닙니다.

2009-12-08 13:51:00

bigbuddy 님의 의견과 유사합니다만..

200만 유효화소 디카로 찍은 사진 1600x1200과
1000만 유효화소 디카로 찍은 사진을 1600x1200 으로 리사이징한 차이는 엄청나지요. 그런 차원에서 항상 이해해왔습니다..

2009-12-08 16:48:32

뒤늦게 한마디 보탭니다. 지금 논점과는 다른 이야기인데요. 제 지인 중 유명작곡가인 분이 저와 또다른 지인 간의 스피커 이야기를 조용히 듣더니 '실제 작업하는 사람은 일반 대중이 들을 수 있는 청음 환경을 감안하기 때문에 매우 평범한 환경에서 작업을 한다. 한짝에 20~30만원짜리 스피커다. 이런 환경에서 만든 음악에 수천만원 짜리 스피커를 붙였더니 소리가 좋아졌다고 하는 것 자체가 넌센스다'라고 한방에 정리하시더군요. 물론 이건 클래식 처럼 어쿠스틱하게 연주된 음악을 녹음하는 경우는 제외입니다.

2009-12-09 00:45:54

가입한지 오래됐지만 눈팅만 하는 회원입니다.

전혀 전공자도 아니고 관심만 있는 영역이지만 제가 아는 한 몇가지만 언급하려 합니다.
물론 이것이 다 맞는 내용이란 건 아니고, 과학적 근거와 논리를 바탕으로 제 글의 잘못을
지적해주시면 감사히 배우는 기회로 삼고자 합니다.


1. Nyquist–Shannon sampling theorem

많은 분들이 알고 있다고 생각하시지만 결정적으로 간과하는 것이 있습니다.
이것은 'theory'가 아니라 'theorem'이란 사실입니다.
우리말로 옮기면... '이론'이 아니라 '정리'입니다. 무슨 알리아싱이 어쩌고 하는 최소한의
이론이 아니라 그냥 맞는 것입니다. 피타고라스의 정리에 대해 토를 달지 않는 것과 같이
이 정리에 대해 토를 달 수 없습니다. 즉, 어떤 아날로그 신호든 간에 '일정 진동수
(x라고 하죠) 미만'에 대해서 1/2x초 단위로 샘플링을 했다면, 원래 아날로그 신호의
'x 진동수 미만의 부분'에 대해서 완벽히 복원할 수 있습니다.

그렇기 때문에 sampling rate는 아날로그 신호 복원의 진동수 범위(즉, 재생 주파수)와
밀접한 관련이 있습니다. 96kHz로 샘플링을 했다면 48kHz이하의 아날로그 신호는 완벽히
복원할 수 있습니다. 이 신호를 재생할 수 있는지 여부는 결국 앰프/스피커에 달려 있겠죠.


2. 디지털 - 양자화

디지털 신호를 이용할 경우, 나이퀴스트 정리에 따라 완벽한 복원을 방해하는 요소는 바로
'양자화 오류'입니다. 양자화 오류(Quantization error)는 샘플링을 할때 정확한 값을 기록하지
못하고 근사치를 기록하기 때문에 생기는 거죠. 양자화 오류 때문에 녹음하고자 했던
아날로그 원음(편의상 x 진동수 이상은 존재하지 않았다고 가정하죠)과 실제 최종 복원/재생
되는 소리와는 아주 미세한 차이가 지속적으로 발생합니다. 흔히들 이것을
소리가 '변형'되었다고 하는데 이 변형이 주는 영향을 한번 생각해보죠.

원음을 f(x), 재생되는 음을 f'(x)라고 하면 이 두음 사이에는 f(x)-f'(x)만큼의 차이가 존재하죠.
g(x) = f'(x)-f(x) 라고 정의하면... 재생되는 f'(x) = f(x) + g(x) 죠.
즉, 소리의 '변형'은 실제로는 원음f(x)에 g(x)라는 소리(잡음)가 '추가'된 것입니다.

g(x)가 어떤 잡음인지는 중요하지 않습니다. g(x)가 f(x)에 비해 얼마나 크냐가 중요한 것이죠.
f(x)와 g(x)의 비... S/N비입니다. 양자화 오류에 의해 추가된 이 소리는 양자화 '잡음'인 거죠.
16bit로 양자화한 것에 비해 24bit로 양자화하면 g(x)가 작아지겠죠.

이 S/N비는 다이나믹 레인지와 직접 연관되어 있습니다. 16bit로 녹음을 할 경우 이론적인
'최고' S/N비는 96dB이지만 좀더 복잡한 이유로 dithering noise를 같이 활용하기 때문에
실질적인 다이나믹 레인지는 90dB에는 미치지 못하는 것으로 알고 있습니다.
(실질적으로 대충 80dB이라고 생각하셔도 될 듯 합니다.)

여기서 잠깐... 꼭지...
지터(jitter)를 아시는 분들 많죠? 조금만 생각해보면 위의 설명이 지터에도 그대로 적용되는
것을 알 수 있습니다. 즉, 지터도 실제 신호 대 지터 잡음의 S/N비가 중요한 거죠.
결국 지터의 측정 단위도... dB입니다.


3. 이 모든 것들의 실질적인 영향

다이나믹 레인지가 어떻고를 따지기 전에 먼저 알아두면 좋은 것들이 몇가지 있습니다.
혹시 100dB의 소리가 얼마나 큰지 아십니까?
그렇다면 90, 80dB는 얼마나 클까요? 50, 40, 30dB 이런 소리는요?

일반적으로 아주 (적막함이 오히려 부담이 될 정도의) 조용한 방이어도 30dB 정도입니다.
20, 10, 0 dB 이런 곳은 그 느낌이 장난 아니라고 하던데, 가보질 못했습니다. (완전 무음실)
보통 조용하다 싶은 곳이면 40dB 정도고요.
우리가 음악을 듣다가 아내의 잔소리를 듣기 시작하는 음량이 대략 80dB 정도일 겁니다.
아파트 사시는 분들이라면 감히 90dB은 엄두도 내지 못하는 수준이고 실제로 많은 사람들이
소리가 너무 크다고 생각하실 음량입니다.
120dB은 인간이 감당할 수 있는 한계 음량입니다. 실제로 100dB도 미칩니다.

그렇다면 CD로 음악을 들을때 아주 조용한 방(30dB)에서 인간의 한계 음량에 가깝게
(110dB 이상) 소리를 높여서 들어야 CD의 다이나믹 레인지(대략 80)에 가리워진 양자화
잡음을 겨우 들을까 말까 한 겁니다.

혹시 자신이 CD에 녹음된 20kHz의 (혹은 다른 매체에 기록된 더 고주파수의) 소리를
잘 듣는다고 생각되십니까? 20kHz의 소리는 20세 가량의 여성이 가장 잘 듣는다고 알려져
있는데, 이때 이 20kHz의 소리를 인지하기 위해서는 대략 100dB 이상이 되어야 한다고 합니다.
즉, 20kHz(혹은 그 이상)의 소리를 통해 44.1kHz의 매체와 96kHz의 매체 간의 차이를
느끼기 위해서는 아주 조용한 방에서 100dB 이상의 크기로 음악을 감상하는 것이
전제가 되야 하고, 듣는 자신이 20세의 여성이 아니라면 그래도 차이를 못 느끼는 거고요.


꼭지의 꼭지...
그렇다면 지터의 영향은 얼마나 될까요? 많은 오디오파일들이 코웃음치는
아이팟의 예를 들겠습니다. 오디오파일들의 경전 스테레오파일의 리뷰 중 측정치 부분입니다.

http://stereophile.com/mediaservers/934/index5.html

Fig. 10을 보면 아이팟(3세대)의 지터는 -112dB 입니다. 즉, 원래 신호의 크기에 비해 지터에
의해 생기는 잡음은 112dB이나 작다는 뜻이죠. 이걸 들으려면... 듣기전에 귀가 고장나겠죠.

2009-12-10 00:14:37

1. 위에 제 댓글을 안읽어 보셨나보군요.
아날로그 신호는 절대로 완벽히 똑같을 수 없습니다. 나이퀴스트 정리에서 완벽히 복원 = 복제로 오해하시는 분이 계시는데 여기서 완벽히란 원래의 신호를 다른 신호로 오해할 여지가 없도록(왜곡되지 않도록) 복원한다는 의미이지 원래의 신호와 똑같은 신호를 복제해낼 수 있다는 의미가 아닙니다.
상식적으로 생각해보면 샘플링에서 샘플링 주기 사이에 어떤 값이 있었는지 알 수 없는데 어떻게 똑같은 신호를 만들어내겠습니까?
나이퀴스트 정리를 만족한다고 해서 원래의 아날로그 신호와 똑같은 신호가 만들어지는 것이 아니라는 점을 알아주시기 바랍니다.

WR
2009-12-10 06:24:24

아날로그 신호가 뭐 특별한건 아닙니다.
오히려 디지털 신호가 특별하죠.

"상식적으로 생각해보면 샘플링에서 샘플링 주기 사이에 어떤 값이 있었는지 알 수 없는데 어떻게 똑같은 신호를 만들어내겠습니까?"

라고 하셨는데 덧글중 링크된 자료를 보시면 아시겠지만 (그부분을 콕 찝어서 언급하고 있습니다) 샘플링 복원 과정을 잘못 이해함으로 해서 생기는 오해라고 합니다.

아날로그는 연속이라 점으로 따지면 무한개 입니다.
단순한 점 잇기로 생각하면 점이 많아야 정확도가 높아 질것 같지만 수학적 변환과정을 통해서 원 신호를 복원하는것이기 때문에 최대 주파수의 2배 샘플링 수치를 가지면 원신호가 "완벽히" 복원되는게 맞습니다.

다만 위에서 Bulletproof 님이 언급하신 부분이나 비틀즈&아바님이 언급하신 것처럼 현실에선 이상적인 필터가 없기 때문에 의도치 않은 고음부 신호 (의도하는 최대주파수를 넘어서는)가 들어감으로 해서 정확도가 떨어진다는 거지 나이퀴스트 정리가 틀려서 원신호와 달라지는건 아닌거죠.

어떤 소리신호에 20Khz 를 넘는 신호가 전혀 없고 처리 과정에서 그 상태가 유지된다면 이론적으로는 40Khz 샘플링레이트면 원래 신호가 100% "똑같이" 복원 가능합니다.

2009-12-09 01:06:48

좋은 정보 감사합니다

2009-12-09 11:00:36

DR 자체는 SNR에 영향을 받기도 합니다만 출력이나 수용할수 있는 최대값의 영향도 받습니다.
DR은 최대 - 최소값의 비로 표시되니까요.

 
글쓰기
SERVER HEALTH CHECK: OK