환영합니다!

Download Report

Transcript 환영합니다!

사운드
진동으로부터의 소리의 발생은 근대에 들어서 아날로그의 신
호인 라디오, 전축으로 발달되었고 현대에는 디지털의 기술에
힘입어 컴퓨터에 의한 조작이 가능하게 되었다.
소리의 기본
 소리란 어떤 물질이 진동함으로써 발생되는 물리적인 현
상
 소리를 만드는 음원이 공기 분자를 진동시키고 진동파가
귀에 인식
 소리 신호의 요소와 사람의 청각 사이에 존재하는 상호
관계를 파악 함으로써 소리 매체를 효율적으로 처리할
수 있는 방법을 익힘
 소리가 발생하는 기본 원리와 발생 된 소리중 인간이 들
을 수 있는 가청 영역과 소리의 응용에 대하여 설명
2
소리의 기본
 S는 신호(Signal)를 말하며 각속도는로 표현하며 f는 주
파수(Frequency)
 균일한 소리의 파형은 일정한 간격으로 같은 모양을 반
복하며, 같은 모양이 한번 나타나는데 소요되는 시간을
주기라고 하고 1 초당 주기 수를 주파수라고 함
 * 소리의 파형은 자연적으로 발생하기 때문에 주기적인
모양을 하지는 않으나 악기에서 발생하는 소리나 사람의
음성, 중모음과 같은 소리는 주기적인 형태를 띄게 되며,
물이 흐르는 소리나 재채기와 같은 음향과 사람의 음성
등의 중자음은 비 주기적인 형태임
3
소리의 기본
파장
진
폭
시간
주기
균일한 소리의 파형
4
주파수
 전파나 음파가 반사, 굴절하여 파동의 방향을 주기적으
로 바꾸는 현상이 1초 동안에 반복되는 횟수를 주파수라
고 하며 단위로 헤르츠(Hertz)를 사용
 일반적으로 주파수의 단위는 Hz, KHz, MHz를 사용
 1KHz는 1초에 천 개의 파동이 발생
 1MHz 는 1초에 백만 개의 파동이 발생
 주파수가 높을수록 고음이 발생하며, 낮을수록 저음이 발
생
5
주파수
서로 다른 두 소리의 합성
6
소리의 주파수
7
소리의 합성
8
라인 스펙트럼
9
소리의 기본 주파수
10
라인 스펙트럼에서의 기본 빈도수
11
성도의 변환 함수

포만트(formant)
조음기관의 모양
과 크기와 밀접한
관계를 가지고 있
으며, 화자의 음성
특성을 보여주는
중요한 파라미터
 인간의 청각 인식
에 있어서는 첫 3
개의 포만트가 중
요

12
음성의 기본 피치
13
음성생성의 디지털 모형
피치주기
필터 계수
(성 도 파 라 미 터 계 수 )
임펄스 열 생성기
(impulse train
geberator)
유성음의 음원
시변 여파기
(time-varying filter)
amplitude
random number
generator
14
성도
(vocal tract)
음성
진폭
 진폭은 파동의 최고점에서 최저점까지의 거리로서 소리
의 크기를 결정
 진폭이 클수록 소리가 커지며, 반대로 진폭이 작으면 소리
도 작음
 주파수가 같은 두 소리가 합쳐질 때는 더욱 큰 소리가 발
생하며 완전히 상반된 두 소리 가 합쳐질 때는 소리가 상
쇄
15
소리의 표현
 가청주파수 대역폭은 작게는 20Hz에서 크게는 20KHz
정도의 범위
 박쥐는 사람이 들을 수 있는 대역폭을 훨씬 넘는 초음파를
사용
 소리 신호를 발생시키거나 외부 소리 신호를 받아들이는
하드웨어의 설계 시에 인간의 가청 주파수만을 처리할
수 있게 하면 하드웨어의 구조를 보다 단순화시킴
 사람 귀의 구조에 대하여 보여주며 신호는 고막을 거치
고 달팽이관을 거쳐서 뇌에 전달하는 과정을 표현
16
소리의 표현
달팽이관
소리
고막(귀청)
신호의 전달과정이 귀의 구조
17
사운드 소리신호의 변환
 컴퓨터의 기본 신호체계는 디지털이며, 자연에서 발생하는
소리는 아날로그 신호임
 컴퓨터에서 소리신호를 처리하기 위해서는 아날로그 신호
를 디지털 신호로 변조하는 일이 필요하며 이를 위하여 샘
플링(sampling) 기법이 널리 사용
18
아날로그와 디지털
 아날로그는 소리와 빛, 전류, 전압 등과 같이 선형적인 값
을 갖는 연속된 형태의 신호
 신호의 처리 속도가 빠른 장점
 잡음에 의해 신호가 변하는 단점
 디지털(digital)은 불연속적인 단계의 값을 갖는 신호로서
0과 1의 조합에 의하여 경우를 표현
 오디오 시스템에서 LP음반을 사용하여 음악을 듣는다면
아날로그 신호를 듣는 것이고 CD을 사용하여 음악을 듣
는다면 디지털 신호를 들음
19
샘플링 기법
 자연의 소리를 컴퓨터나 디지털음악 장비에서 사용하기 위
해서는 샘플링(sampling)이라는 작업이 필요
 아날로그 신호를 이산신호(discrete signal)로 변환하려면
Nyquist 규정을 따라야 하며 이는 아날로그 주파수보다 샘
플링의 주파수는 최소한 2배 이상이 되어야만 다시 이산신
호를 아날로그신호의 역변환이 가능
 오디오 경우의 샘플링의 속도는 44.1 KHz이며 16비트의
선형 정량화를 사용
20
샘플링 기법
아날로그 신호를 이산신호로 변환하기 위한 샘플링
21
파일저장방식
 사운드는 파형을 그대로 표현하는 웨이브(wave)형식과 악
기의 음표와 연주시간을 표시하는 미디(MIDI: Musical
Instrument Digital Interface) 방식의 두 가지가 사용
 웨이브 방식을 사용하는 파일로는 WAV, VOC, AU,
AIFF(Audio Interchange File Format) 등의 파일이 있으며
미디 방식의 파일은 MID, RMI, MOD 등이 있음
22
WAV
 PC 에 있어 가장 대표적인 사운드 저장용 포맷으로 웨이
브 방식을 사용하는 모든 사운드에 적용 가능
 마이크로소프트에서 사용하는 RIFF 방식을 사용하고 있
어 압축 방식 및 실제 데이터를 함께 저장할 수 있는 다
양한 형식
 PC에서 웨이브 파일을 생성하기 위해서는 사운드 카드
가 필요
 사운드 카드를 PC의 확장 슬롯에 부착시킨 후, 마이크로
폰을 사운드 카드에 연결하여 음성 정보를 입력하면 입
력된 음성에 대한 디지털 정보를 포함하는 웨이브 파일
을 생성
23
WAV
 마이크로 폰 대신 음악 소리를 내는 장치를 연결할 경우
음악 정보의 저장도 가능
 사운드 카드는 아날로그 신호를 디지털 신호로 바꾸는
ADC(Analog-to-digital converter)의 역할
 현재 PC 상에서 쓰이고 있는 웨이브 파일의 이용은 짧은
시간 동안의 음성 정보를 저장해 두고 이를 반복적으로 재
생시키거나 편집하는데 이용하는 것이 주된 응용 방법
 마이크로소프트 윈도우즈에서 웨이브 파일은 확장자로서
*.wav를 가지며, 웨이브 파일의 생성과 재생을 위한 기본
적인 소프트웨어가 윈도우즈의 기본적인 프로그램으로 제
공
24
WAV
 1) PCM방식과 ADPCM방식
 아날로그 사운드는 기본적으로 PCM 방식으로 표본화
(sampling)되어 디지털 사운드로 변환되지만 PCM 방식
은 용량이 크기 때문에 ADPCM 방식을 주로 사용
 PCM 방식
PCM 방식은 그림 9.5와 같이 입력된 값을 그대로 저장하
는 방법으로 압축하는 과정을 거치지 않기 때문에 용량이
큼
 PCM방식은 CD나 DAT(Digital Audio Tape) 등에서 사용

25
WAV
아날로그 신호
표본화(sampling)
양자화(quantization)
인코딩(encoding)
PCM 방식
26
WAV
 ADPCM 방식
 제 멀티미디어 협회(IMA)에서 제안한 방식으로 디지털화
한 결과를 PCM 방식처럼 그대로 저장하는 것이 아니라,
그림 9.6과 같이 바로 앞 신호와의 차이를 저장하는 방식
 차이를 그대로 저장하는 방법은 DPCM이며 그 차이만을
이용하므로 용량이 작음
 그러나 차이가 클 경우에는 DPCM의 효율도 떨어지므로
이런 문제를 해결하기 위한 방법으로 ADPCM 기법 생김

27
변화폭이 클 때는 신호 차이 값을 표현하는 단위를 크게하고
그렇지 않은 경우는 반대로 작게하여 정밀한 신호 표현과 함
께 신호의 변화폭이 클 때도 잘 적응할 수 있도록 하는 방법
WAV
ADPCM 방식
28
WAV
 2) 8 비트모노(Mono)
 8비트 모노 샘플에서 모든 바이트는 연속적으로 저장
 왼쪽, 오른쪽 모두 채널 구분 없이 0번 채널 하나만 사용
 3) 8비트 스테레오(Stereo)
 스테레오 샘플에서는 채널 0은 왼쪽 채널로 채널 1은 오른
쪽 채널로 사용
 8 비트 스테레오 샘플에서는 데이터 포맷 - 채널 0에서 8
비트, 채널 1에서 8 비트, 채널 0에서 8 비트, 채널 1에서 8
비트등에 의해서 저장
29
WAV
 4) 16비트 모노
 메모리에서 16비트 모노 단일 샘플을 표현하는 경우 하나
의 단일 샘플을 기록 할 때 2바이트가 필요
 바이트의 순서는 8비트 모노 샘플과 동일
 5) 16비트 스테레오
 채널 저장방법은 8비트 스테레오와 동일하며 각 채널은 2
바이트를 사용
 그림 9.8에서 나타난 것은 이 파일의 재생시간은 0.451초
이고 8비트 모노 형식이며, PCM 방법을 사용하여 초당
22,050Hz로 인코딩 되었음
 그림 9.9와 그림 9.10은 각각 Wav 파일의 편집과 재생을
표현
30
WAV
오디오의 종류와 데이터률
31
종류
샘플링률
비트수
모노/스테
레오
데이터률
(kB/S)
전화
8
8
모노
8
AM
11.025
8
모노
11.025
FM
22.050
16
스테레오
88.2
CD
44.1
16
스테레오
176.4
WAV
웨이브 파일 등록 정보
32
WAV
웨이브 파일 재생
33
AU
 AU Audio의 약자로 유닉스 시스템에서 사용되는 표준 오
디오 파일이다. 썬마이크로시스템즈에서 만든 사운드 포
맷으로 웨이브 파일과 비슷하다. AU 파일은 자바 프로그
램에서 오디오 파일로 사용되기도 한다. 윈도우즈 환경에
서 AU파일을 편집하는 모습을 나타낸 것이다.
 같은 노래를 WAV 파일과 AU 파일로 들었을 때 샘플링
비율(sampling rate)이 위의 표 9.2와 같이 차이가 나기
때문에 음질의 차이를 느낄 수 있다. 파일을 재생시켜보
면 WAV 파일보다 AU 파일의 음질이 떨어지는 것을 알 수
있다.
34
AU
AU 파일 편집
35
VOC
 Creative Lab.사의 Sound Blaster 제품에 사용되는
웨이브 방식을 기록하는데 사용
 초기에는 8비트 샘플만을 지원하였으나 16비트 샘플 지원
기능이 추가
 윈도우 환경에는 사용되지 않으나 초창기의 게임에 일부
사용
36
AIF/AIFF
 오디오 파일로 Audio Inter change File Format의 약자이
다. WAV처럼 샘플링된 디지털 오디오 파일이다. 처음 애
플컴퓨터사에서 개발되어 매킨토시 컴퓨터에서 사용됐으
며, 실리콘 그래픽스 시스템에서도 사용되고 있다.
 AIFF 포맷은 8비트 스테레오로 모노로 저장되지만 압축
되지 않아 파일 크기가 크다는 것이 단점이다. IEF라는 확
장자로도 사용된다. 역시 Cool Edit 등에서 작업할 수 있
다.
37
MP3
 MP3은 일종의 파일 포맷으로 MPEG Audio Layer 3의
준말이다. 여기서 MPEG는 동영상전문가단체(Motion
Pictures Experts Group)를 뜻하는 말로 동영상과 관련
된 표준규격을 협의하는 국제협회의 이름인 동시에 그들
이 만들어낸 표준규격을 뜻한다.
 레이어(Layer)1이 1:4 정도의 압축률을 갖고 레이어2는
1:6에서 1:8 정도, 레이어3은 1:10에서 1:12의 가장 뛰
어난 압축률을 가지고 있다. 따라서 가능한 파일의 용량
을 줄이기 위해 레이어3이 가장 많이 사용되는데 바로
이 파일 포맷이 MP3이다. MP3의 손실 압축방식을 사용
하는데 이것은 인간의 귀로 들을 수 없거나 듣지 않아도
되는 부분을 버리고 가청 영역만을 디지털화함으로써 전
체적인 데이터 양을 줄이는 것이다.
38
MID
 미디 파일의 대표적인 포맷이며 파일은 하나의 헤더 정보와
여러 개의 트랙 정보로 구성
 헤더에는 트랙의 수에 관한 정보가 기록되고 트랙에는 연주
에 따라 발생하는 이벤트의 시간 정보와 이벤트 자체에 대
한 정보가 차례로 기록
 MID 파일은 곡목과 같이 당연히 표현되어야 할 정보를 기록
할 별도의 필드가 없다는 문제점을 갖고 있으나 모든 미디
편집 소프트웨어에서 사용할 수 있는 대표적인 포맷
39
MID
미디 시스템에서 음이 입력되어 처리되고 출력되는 과정
40
MIDI Message Format
41
MID
 1) 미디음악을 위한 필수장비

Windows와 미디 소프트웨어


미디 인터페이스 카드

42
컴퓨터에서 미디 음악을 하려면 최소한 PentiumMMX이상
의 컴 퓨 터 와 Windows95 이 상 의 운 영 체 제 그 리 고
Cakewalk 등과 같은 미디 소프트웨어가 필요
컴퓨터와 미디 악기는 서로 다른 디지털 신호를 사용하기
때문에 그 사이에 하나의 통역장치가 필요하며, 이것을 미
디 인터페이스 카드라고 하는데 ATARI나 NEC같은 컴퓨터
에는 그러한 장치가 내장되어 있지만 IBM호환 컴퓨터에는
이것을 따로 장착해 줘야만 함
MID
 신디사이저와 마스터키보드
 신디사이저(synthesizer)란 여러 가지 파형의 음을 합성하
여 원하는 음을 만들어 연주할 수 있는 장치이며, 파형을
발생시키는 음원과 그것을 제어 할 수 있는 건반이 함께 결
합되어 있음
 작곡과 연주를 위한 여러 기능들을 하나의 신디사이저로
결합시킨 것을 워크스테이션이라고 하며 즉, 워크스테이션
에는 일반 신디사이저의 기능뿐만 아니라 시퀀서, 드럼 머
신, 디지털 이펙터등의 기능들이 모두 갖추어져 있으며 사
운드 모듈과 같은 외부 장비를 미디 라인을 통해서 추가/
연결 할 수도 있음
 마스터 키보드는 음원을 제외한 컨트롤러서의 건반만 있는
것을 말함
43
MID

미디 케이블
 각 미디 장비 사이의 연결에는 전용 미디 케이블을 사용
 이 케이블은 가능한 한 길이가 짧은 것을 사용하는 것이
좋음

미디 신호의 전송불량과 지체현상을 방지할 수 있음
 스피커와 앰프
개인적인 미디 작업을 위한 음향 모니터 장비로서 가장 쉽
게 준비할 수 있는 것은 가정용 오디오 시스템임
 컴포넌트 오디오의 뒷면을 보면 외부 오디오 신호를 입력
할 수 있는 'AUX'나 Audio In' 등과 같은 입력 단자가 있으
므로 신디사이저의 오디오 출력라인을 이 곳에 접속
 신디사이저는 자체 내에 낮은 출력의 앰프를 갖고 있기 때
문에 헤드폰으로도 들을 수 있지만 장시간 작업할 경우 귀
에 무리를 줄 수도 있음

44
MID
 2) 미디 음악을 위한 부수 장비
 드럼 머신과 드럼 모듈
45

드럼 머신(drum machine)은 드럼과 타악기 음색들만을
내장하고 있으며, 리듬 패턴을 쉽게 만들어 낼 수 있도록
리듬 전용 시퀀서를 내장하고 있음

드럼 머신은 전면부에 있는 몇 개의 조작 패드들을 사용하
여 간편하게 리듬 패턴을 만듬

드럼 모듈(drum module)은 드럼과 타악기의 음색을 담고
있으며 이것을 외부 미디 시퀀서에 의해 연주
MID
 샘플러
 오실레이터(oscillator)라는 장치에 의해서 소리를 만들
어 내는 신디사이저와는 달리 샘플러(sampler)는 실제
의 소리를 디지털 방식으로 직접 녹음한 후 그것을 원
하는 형태로 가공하여 악기나 효과음 등으로 사용
 샘플러에는 녹음된 샘플을 저장하기 위해서 보통 하드
디스크와 같은 대용량의 저장 매체가 장착되어야 하며
샘플을 연주하거나 편집하기 위해서 많은 메모리(RAM)
가 필요

46
전문 음악인들에게는 필수적인 장비
MID
 믹서
 하나의 스테레오 녹음기에 여러 악기의 출력 신호를 녹
음하기 위해서는 그 신호들을 적절하게 섞어야 하므로
이것을 위해서 믹서(mixer)라는 장비를 사용
47

믹서는 각 입력 및 출력 신호의 양과 스테레오 밸런스를
조절

대부분의 믹서에는 이퀄라이저(equalizer)가 연결되어
있어서 입력 신호의 베이스(base)와 트레블(treble)을 조
절이 가능

믹서의 기능 중 주목할 만한 것은 외부 이펙터효과를
Effect Send'나 Auxiliary Send' 단자에 연결하여 각 채
널마다 이펙터 용량을 서로 다르게 설정할 수가 있음
MID
 멀티트랙 테이프 레코더
 멀티트랙 테이프 레코더(MTR; Multi Track Recorder)를
이용하면 녹음 테이프의 한 면을 여러 트랙으로 나누어
녹음이 가능
 일반 카세트 테이프를 사용하는 MTR일 경우에는 보통 4
개의 트랙을 얻을 수가 있고, 릴 테이프를 사용하는 경우
에는 8, 16트랙까지도 얻을 수가 있음
 MTR장비를 사용하면 컴퓨터 음악뿐만 아니라 보컬, 코러
스, 기타연주 등을 각기 다른 트랙에 녹음하기 때문에 믹
싱 작업이 한결 수월
 어느 한 트랙을 실수했다해도 다른 트랙에는 아무 영향도
주지 않고, 그 트랙만을 다시 녹음할 수가 있는 것이 MTR
의 장점
48
MID
 디지털 멀티트랙 레코더
 최근에 등장한 것으로 앞에서 설명한 멀티트랙 테이프 레코
더를 디지털화한 것으로 즉, 테이프를 사용하는 아날로그 방
식이 아닌 하드디스크 드라이브나 고유한 매체에 디지털 방
식으로 녹음
 자체내에 편집기능이나 이펙터 등을 내장하고 있으며 음성신
호의 디지털 인/아웃이 가능하므로 편집작업에 따르는 음질
손실이 거의 없음
 디지털 멀티 이펙터
 이펙터는 신디사이저의 음색을 새롭게 가공/처리하여 출력
 연주된 음에 특수한 효과를 부여하는 것으로서 에코, 리버브,
딜레이 등이 모두 이펙터의 일종
 믹서와 이펙터를 연결하여 사용하면 보다 효과적으로 이펙터
를 적용
49
RMI
 RMI는 MID 파일의 단점을 해결하기 위한 포맷으로 MID
파일 내용과 함께 곡에 대한 추가 정보를 기록할 수 있도
록 한 포맷을 사용한다. Microsoft에서 지원하고 있어서
MID와 함께 널리 사용된다.
50
MOD
 샘플링된 소리 데이터들을 소프트웨어적인 방법으로 변
형, 합성해 음악으로 출력
 아미가(AMIGA) 시스템에서 시작된 형식인데, Modules의
약자로 음원을 내장한 사운드 파일
 WAV나 AU 등은 사운드 자체를 디지털화하는 방식이며,
MID는 악보처럼 음악의 높낮이, 길이 등의 정보만을 소유
 MOD 파일은 MID처럼 악보 정보와 함께 WAV 같은 음원
도 함께 내장
51
MOD
 4가지 악기가 사용된 음악이라면 4트랙을 사용하는 것이
며, 보통 4~8가지 트랙을 사용하며 최대 32트랙을 지원
하는 포맷도 사용가능
 단점이라면 작업이 어렵고 MIDI보다 음질이 좀 떨어짐
 MOD 파일을 만드는 프로그램을 트래커라고 하는데,
StarTracker, Scream Tracker, Fast Tracker, Digi
Tracker 등 다양하며 프로그램마다 고유의 파일 포맷이
존재
 모든 파일을 들어볼 수 있는 프로그램으로는 Cubic
Player가 있는데 도스용, 물론 윈도우95, 98에서도 실행
가능
52
사운드 편집
 전문적인 사운드 편집작업은 고가의 장비를 갖춘 스튜디오
에서 이루어지지만, 간단한 작업, 예를 들어 wav파일의 복
사, 자르기, 이어 붙이기 등은 Windows에서 기본으로 제
공하는 녹음기에서도 가능
 통신이나 인터넷상에서 쉽게 구할 수 있는 사운드 편집 소
프트웨어를 이용하면 여러 가지 다양한 효과들을 구현가능
53
사운드 편집
윈도우즈에서 제공하는 녹음기
54
사운드 편집 소프트웨어
1)
케이크워크
 케익크워크(CakeWalk)는 미국 Cakewalk Music Software
사에서 만든 IBM 호환 컴퓨터용 컴퓨터 음악 작곡 프로그램
으로서 총 256개의 미디/오디오 트랙을 지원하며 미디 악기
나 사운드 카드를 사용하여 미디/오디오 데이터를 녹음, 편
집, 인쇄할 수 있는 강력한 시퀀서이다.
 초기의 케익크워크는 도스용에서 시작되었는데 작은 크기
에도 불구하고 강력한 편집 기능과 빠른 수행 속도를 지니
고 있었고, 또한 손쉽게 구할 수 있다는 장점들로 인하여 미
디인 들에게 가장 인기 있는 시퀀서였다.
55
케이크워크
케이크워크 프로그램의 작업화면
56
사운드포지
 사운드 포지(Sound Forge)는 Sonic Foundry사에 의해 만
들어진 윈도우 베이스의 음성 편집 프로그램이다.
 사운드 포지 6.0에는 음성편집을 하기 위한 강력한 오디오
처리, 툴, 효과 기능이 탑재되어 있어 음성 편집 및 녹음,
처리로부터 미디어 인코딩까지 어플리케이션 하나로 완성
된다.
 사운드 포지 5.0에는 CD 립핑, 쓰기 기능도 있어 비디오와
음향의 싱크 및 음향파일을 사용한 다른 작업까지 고려한
포맷 변환으로 디지털 오디오 작업에 위력을 발휘하고 있
다. 아래 그림 사운드 포지를 이용한 에디팅 작업화면을 보
여주고 있다.
57
사운드포지
사운드 포지를 이용한 에디팅 작업화면
58
쿨에디트
 WAV 편집 프로그램하면 떠오르는 것이 쿨에디트(Cool
Edit)라고 할 수 있을 만큼 널리 알려진 프로그램이며 쿨에
디트 2000의 경우 멀티 트랙 레코딩이 지원된다.
 멀티 트랙 레코딩이란 전문가들이 사용하는 기법으로 보통
녹음 스튜디오에서 여러 개의 트랙에 녹음, 편집을 하는 것
을 말한다.
 WAV, IFF, SVX, AIF, SND, VOX, DWD, AU, SND, VOC,
PCM 등의 포맷을 지원하며 MP3을 바로 불러서 편집 저장
도 가능하다. 아래 그림 9.18 Cool Edit 2000 프로그램의
작업 화면을 보여준다.
59
쿨에디트
쿨에디트2000 프로그램의 작업화면
60
골드웨이브
 디지털 오디오는 크게 시퀀싱 오디오 포맷과 샘플링 오디
오 포맷으로 나눌 수 있는데, 전자는 MIDI로 대표되며, 후
자는 WAVE, MP3가 대표적이다. 그래서 두 포맷을 별도로
다루는 것이 오디오 프로그램의 일반적인 특징인데, 골드
웨이브(GoldWave)는 그 중에서도 후자(샘플링 오디오)의
데이터를 편집하는 프로그램이다.
 골드웨이브는 쿨에디트와 같은 시기에 출발하여 꾸준히
버전업되고 많은 사용자들이 이용하고 있는 사운드 편집
소프트웨어로, 최근 발표된 쿨에디트 2000의 용량은 8MB
의 고용량이지만 골드웨이브의 크기는 726 kB로 약 1/10
정도다. 하지만 그 성능은 상당히 뛰어나다.
61
골드웨이브
골드웨이브 프로그램의 작업화면
62
웨이브랩
 웨이브랩(WaveLab) 3.0은 윈도우즈 95, 윈도우즈 98, 윈
도우즈 NT, 그리고 윈도우즈 2000에 사용되는 오디오 편
집·마스터링 소프트웨어이다.
 대부분의 사용자에게 편리한 스테레오 편집기와 함께, 프
로세싱의 전체 영역, 이펙트, CD burning 소프트웨어와 호
환이 가능한 Red-book, 오디오 분석, 오디오 파일 데이터
베이스, 배치 프로세싱(batch processing) 그리고 샘플러
지원(sampler support)을 결합시키는 기능을 제공하며 비
파괴 편집이 가능한 특징을 가지고 있다.
63
사운드 편집하기
 편집 소프트웨어마다 편집과정이 조금 다를 수 있으나 기
본적인 작업과정은 비슷함
 1) 사운드 입력하기
 입력할 때 좋은 사운드를 얻어야 최종적인 사운드도 좋게
나올 수 있음
64
사운드 입력하기
데이터 포맷 대화상자
65
사운드 입력하기
 ① 자기가 사용할 사운드가 어떤 용도인지 파악하여 데이터
포맷을 정한다. 즉, 표본율(sample rate), 해상도를 정한다.
 ② 작업할 파일이 채널 수 즉, 스테레오인지 모노인지 선택
후 갣K" 버튼을 누른다.
 ③ "Record"버튼을 누르면 녹음이 시작된다. 갨top" 버튼을
누르면 녹음이 끝나며, Wav파일이 하나 만들어진다. 16 비트
의 스테레오로 녹음이 되어있다.기
66
사운드 입력하기
녹음이 끝난 Wav파일의 완성
67
사운드 입력하기
 음악 CD의 경우에는 44.1KHz의 주파수에 16비트 스
테레오로 녹음이 되어있는데, 이런 음질의 웨이브(wav)
파일은 40MB 이상의 크기를 가지고 있음
 대중가요나 클래식 음악 등의 CD는 좋은 음질을 가지
고 있는 반면 파일이 큰 단점이 있어서 홈페이지의 배
경음악 같이 압축된 포맷을 요구하는 곳에서는 사용하
기가 힘이 든다.
68
음악CD에서 웨이브파일 입력받기
 음악 CD로부터 특정한 부분이나 필요한 크기나 시간만큼
의 사운드를 추출하면 사용자가 원하는 형식으로 자기만의
배경음악이나 샘플 음악 등을 생성
 MP3 Grabber Extreme이라는 프로그램은 MP3 파일을 웨
이브 파일로 변환할 수도 있고, 오디오 CD를 웨이브 파일
로 바꾸어 줄 수 있음
※ 트랙에 표시가 없을 경우
 음악 CD에서 트랙을 추출하려면 먼저 CD-ROM 드라이버
와 사운드 카드가 연결이 되어 있어야 한다. CD-ROM 드
라이버 뒤쪽의 Audio Out 단자와 사운드 카드의 CD-IN 단
자를 연결해주면 된다.
69
사운드 클립의 연결
클립 할 부분을 마우스로 지정
70
사운드 클립의 연결
 ① 먼저 그림 9.22에서와 같이 사용하고자 하는 부분을 마우
스로 지정한다.
 ② 지정한 부분을 [Edit] [Copy]명령을 사용하여 복사한다.
 ③ 워드프로세서에서 복사하고 끼워 넣는 것과 같은 사용법
으로, 삽입될 부분을 지정하고 [Edit] [Paste]를 사용하여 붙
여 넣는다. 그림 9.23에 결과가 나타나있다.
71
사운드 클립의 연결
복사한 부분을 삽입
72
사운드 믹싱
 사운드 믹싱이란 두 개 이상의 사운드 파일을 하나로 합하
여 동시에 재생
 믹싱은 특수한 유형의 복사 기능인데 복사 시에 원본 파일
에 복사할 파일의 웨이브 값을 더하는 방식
① 먼저 두 개의 파일을 믹싱하기 위해서는 파일의 포맷이
같아야 한다.
② 메인 사운드를 연 상태에서 믹싱할 부분을 마우스로 선택
한다.
③ [Edit] [Mix paste..]를 누르면 그림 9.24와 같은 Mix
Paste 대화상자가 나온다.
④ 여기서 사운드 클립을 믹싱 하려면 From Clipboard를 선
택하고 파일을 선택하려면 From File을 선택하고 파일의
위치를 지정해 준다.
⑤ OK?버튼을 누르면 그림 9.25에서와 같이 믹싱이 완료된
다.
73
사운드 믹싱
Mix Paste 대화상자
74
사운드 믹싱
사운드 믹싱
75
웨이브파일 용량 줄이기
 [Edit] 메뉴에서 [Convert Sample Type]을 선택하여
[Sample Rate]를 22050으로 하고 [Channel]을 Mono로
하고 [Resolution]을 8-bit로 선택하면 용량을 1/8로 줄일
수 있음
 모노를 선택하였기 때문에 채널이 하나로 합쳐져서 하나로
나타나고 음질은 떨어지게 되나 용량을 줄여야 할 경우 사
용
76
음성의 이해
 음성 이해는 컴퓨터가 음향 음성 신호(acoustic speech
signal)를 듣고서 음성의 의미(abstract meaning)로 매핑
시키는 과정이다.
 단지 한마디 한마디를 정확히 인식하는 것만이 아니라,
발음되는 문장 전체의 의미를 이해하려는 시도를 음성이
해라 부른다.
 즉, 예를 들어 어떤 음성이 입력되었을 때 "내일의 날씨는
어떻게 되지?" 하는 문자열로 바꾸는 과정은 음성인식이
며, 그 문자열의 구문구조 등을 파악하여 사용자가 내일
의 날씨를 문의하는 내용이라는 것을 파악하는 단계까지
는 음성이해이다.
77
음성이해의 정의
 연속 음성 인식(continuous speech recognition)의 한
형태로, 연속 음성에 포함된 의미의 내용을 정확하게 추
출하는 것이다.
 1971년에 시작된 미국 국방부 고등 연구 계획국(DARPA)
의 음성 이해 연구 계획으로 음성 이해에 관한 연구가 본
격화되었다.
 음성 이해는 단지 음성적으로 단어나 단어열을 인식할 뿐
만 아니라 구문 정보, 의미 정보, 작업에 의존된 지식과
정보를 이용하여 문장의 의미 내용을 이해하는 것을 말한
다.
 음성 인식의 궁극적 목표는 자연스러운 발성에 의한 음성
을 이해하여 컴퓨터에 정보를 입력하는 음성 이해 시스템
을 실현하는 것이다.
78
음성이해의 순서
음성이해의 과정
79
음성이해 시스템
음성이해 시스템의 국제적 동향
80
시스템명
기 능
어휘수
이해도
화자수
개 발
HWIN
여객관리
1097
44
3
BBN사
HAPPY
뉴스정보검색
1011
95
5
카네기메론
HEARSAY II
뉴스정보검색
1011
90
1
카네기메론
VC은
잠수함 정보검색
1000
24
1
SDC사
CSAP
레저 특허문
1000
91.1
IBM
KEAL
전화번호 안내
60
91
CNET
LITHAN
질문에 대한응답
101
66
10
교토대
VOICE QA
좌석예약
112
96.5
9
NTT
음성인식
 음성은 인간이 사용하고 있는 통신매체 중 가장 자연스러
운 형태로 자신의 의사표명 혹은 정보의 생성에 있어서
음성을 이용하는 비중이 매우 높다.
 음성을 매체로 한 사람과 기계간의 의사소통(man-
machine interface)의 필요성이 크게 대두되었으며,
1970년대 중반 이후 음성인식에 대한 연구가 활발히 전
개되어 오고 있다.
 \초기(1980년대 초반까지) 음성인식 시스템은 주로 인
공지능 기법에 기반을 두고 개발되었는데, 이는 실제 사
람이 음성을 인식하는데 적용하는 지식을 컴퓨터에 구현
한 것이었습니다.
81
음성인식의 개요
 자동적 수단에 의하여 음성으로부터 언어적 의미 내용을
식별하는 것이다. 구체적으로 음성 파형을 입력하여 단어
나 단어열을 식별하고 의미를 추출하는 처리 과정이며,
크게 음성 분석, 음소 인식, 단어 인식, 문장 해석, 의미
추출의 5가지로 분류된다.
 좁은 의미로는 음성 분석에서 단어 인식까지를 말하는 경
우가 많다. 인간-기계 인터페이스 개선의 하나로 음성으
로 정보를 입력하는 음성 인식과 음성으로 정보를 출력하
는 음성 합성 기술의 연구 개발이 오랫동안 진행되어 왔
다.
 대형 장치를 필요로 하였던 음성 인식 장치와 음성 합성
장치를 대규모 집적 회로(LSI)의 발달에 따라 가로 세로가
몇 mm 크기 집적 회로 위에 실현할 수 있게 됨으로써 음
성 입출력 장치가 실용화되었다.
82
음성인식 기술
 음성인식 기술은 그 분류기준에 따라 여러 가지로 분류할
수 있다. 우선 인식의 대상으로 삼는 화자에 따라 화자독
립과 화자종속 인식기술로 분류됩니다.
 화자종속 시스템은 특정 화자의 음성을 인식하기 위한 시
스템으로 현재 휴대폰에 탑재되어 사용되는 음성다이얼
링(voice dialing) 시스템이 대표적이다.
 화자독립 시스템은 불특정 다수 화자의 음성을 인식하기
위한 것으로, 다수화자의 음성을 수집하여 통계적인 모델
을 학습시키고, 학습된 모델을 이용하여 인식을 수행하게
된다.
83
음성인식 기술의 현황
 ① 미국
미국의 음성인식 연구는 국방성의 주도로 연구되고 있다. 1971년에
서 1976년까지 SUR(Speech Understanding Research)이라는 음성
이해 연구 프로젝트가 수행되었으며 최근에는 1984년부터 5 년에서
10 년 기간으로 음성 및 자연언어처리에 관한 새로운 프로젝트가 수
행되고 있다.
 ② 일본
일본에서의 음성인식 기술은 1982년부터 추진한 제 5 세대 컴퓨터
프로젝트의 일부인 "음성과 자연언어를 통한 컴퓨터 입출력"이라는
제목으로 연구가 진행되었으나 연구결과의 대외발표는 거의 없었다.
최근에서의 음성인식 관련 프로젝트는 ATR(Advanced
Telecommunications Research Institute) 산하 자동통역 연구소에
서 1986년부터 수행하고 있는 자동통역 전화(automatic telephone
interpretation) 프로젝트와 1987년부터 교육, 과학, 문화성의 자금지
원을 받고 있는 "Advanced Man-machine Interface Through
Spoken Language"이라는 국가 프로젝트가 있다.
84
음성인식 기술의 현황
 ③ 유럽
유럽에서의 음성인식 기술연구는 유럽국가들이 모여서 공동으로 수
행하는 연구와 각 나라에서 자체적으로 수행하는 연구로 나누어진다.
범 유럽국가들이 연구수행을 하고 있으며, 이 프로젝트의 연구결과
는 실시간으로 음성의 자동통역 을 실현하는 VERBMOBIL이라는 야
심에 찬 프로젝트에 사용될 것이다. VERBMOBIL은 1991년부터 시작
되어 20 년간 지속될 대형 프로젝트이다.
 ④ 국내
국내에서의 음성인식 연구는 1980년 초부터 일부대학을 중심으로 연
구가 수행되었으며 최근에는 많은 대학과 연구소를 중심으로 활발히
진행되고 있다. 그러나 연구내용은 아직 수십 단어 혹은 수백 단어를
인식하는 고립단어 음성인식 시스템 개발의 수준에 머물러 있다.
1991년부터는 한국통신과 전자통신연구소가 공동으로 자동통역전
화 요소기술연구를 수행하고 있으며 이 연구결과는 향후 한·일간 자
동통역전화 시스템 개발에 이용될 것이다. 최근에는 기업체에서도
음성인식 기술을 이용한 여러 가지 제품개발을 시도하고 있다.
85
음성인식 기술의 응용분야
①
②
③
④
⑤
사무자동화에 이용될 수 있다.
공장자동화 분야에 응용할 수 있다.
전화망을 이용한 응용이 가능하다.
의료분야에 이용된다.
멀티미디어 시스템의 조작을 위한 인터페이스로써 사용이
가능하다.
⑥ 서로 다른 언어간을 통역하는데 이용될 수 있다.
86
음성인식의 최근 연구동향
 현재 음성인식 기술은 미국을 비롯한 선진국을 필두로 매
우 활발하게 전개되고 있다. 미국의 경우, IBM, AT&T,
Lucent Technologies, Microsoft 등의 컴퓨터 및 통신관
련 기업체들은 독자적인 대용량 음성인식 시스템을 개발
하고, 자사의 관련 제품에 응용하고 있으며, 그 추세는 더
욱 확장되고 있다.
87