Title: Multimedie- och kommunikationssystem, lektion 4
1Multimedie- och kommunikationssystem, lektion 4
- Forts. Kap 2 Signaler och KvalitetsmÄtt
- Kap 3-4 Ljud- och videokompression
2Sampling och DA-omvandling
2500 Hz 2,5kHz.
10000 sampels/sek 10kHz
.
Kvantisering (avrundning) till 8 vÀrden.
Digitalisering ger 3 bit per vÀrde 101 000 010
110 000.
3PCM Pulse Code Modulation Digitalisering av
analoga signaler och seriell överföring
Sifferexempel frÄn PSTN publika telefonnÀtet
011011010001...
1
0
Högtalare
Mikrofon
8000 sampels per sek
300-3400Hz bandpass-filter. SpÀrrarallt över
4000Hz.
4Exempel
En 6 sekunder lÄng ljudinspelning digitaliseras.
Hur stor Àr inspelningens informationsmÀngd? a)
22000 sampels/sekund, 256 kvantiseringsnivÄer. b
) 22000 sampels/sekund, 16 kvantiseringsnivÄer.
c) 5500 sampels/sekund, 256 kvantiseringsnivÄer.
22000sampels 6 s 8 bit 1056000bit.
22000sampels 6 s 4 bit 528000bit.
5500sampels 6 s 8 bit 264000bit.
5Vikningsdistorsion (aliasing)
IntrÀffar om man inte filtrerar bort frekvenser
som Àr högre Àn halva samplingsfrekvensen. Exempe
l En sinuston pÄ 4kHz som samplas med
samplingsfrekvens 4 kilosampels/s viks ned till
en ton pÄ ton pÄ 2kHz.
6Example
What sampling rate is needed for a signal with a
bandwidth of 10,000 Hz (1000 to 11,000 Hz)?
Solution
The sampling rate must be twice the highest
frequency in the signal
Sampling rate 2 x (11,000) 22,000
samples/s
7Samplingsteoremet
- f lt fs/2
- Den högsta frekvens som kan samplas Àr halva
samplingsfrekvensen. - Om man samplar högre frekvens Àn fs/2 sÄ byter
signalen frekvens, dvs det uppstÄr
vikningsdistorsion (aliasing). - För att undvika vikningsdistorsion sÄ har man ett
anti-vikningsfilter innan samplingen, som tar
bort frekvenser över halva samplingsfrekvensen. - Interpolationsfiltret anvÀnds vid rekonstruktion
av den digitala signalen för att gissa vÀrden
mellan samplen. - Ett ideal interpolationsfilter skulle kunna
Ă„terskapa den samplade signalen perfekt om den
uppfyller samplingsteoremet. I verkligheten finns
inga ideala filter. - Följdregel Nyqvists sats sÀger att max
datahastighet 2B2log M, dÀr M Àr antal nivÄer,
och B Àr signalens bandbredd, oftast lika med
signalens övre grÀnsfrekvens.
8Example 2.1
9(No Transcript)
10Example 2.4 PCM coding of speach and music
11Example 2.7Uncompressed video
12Kvantiseringsdistorsion
13 14Signal-to-quantization ratio (SQR)
15Example 2.2 Quantization distorsion
16Kvantiseringsdistorsion (kvantiseringsbrus)
- Avrundningsfelet lÄter ofta som ett brus.
- Svaga ljud avrundas bort, eller drÀnks i
kvantiseringsbruset. - Varje extra bit upplösning ger dubbelt sÄ mÄnga
spÀnningsnivÄer, vilket ger en halvering av
kvantiseringsdistorsionens spÀnningsnivÄ, dvs en
fjÀrdedels effekt, dvs en minskning med 6 dB. - N bit upplösning ger ett signal-till-kvantiserings
brus-förhÄllande (SQRSignal to quantization
noise ratio) pÄ i storleksordning N6 dB (det kan
skilja nÄgra dB beroende pÄ hur man definierar
max signalnivÄ.)
17Kompressionsalgoritmer
18Shannons entropi-formel
- Entropi informationsmÀngd per kodord, dvs
minsta möjliga antal bit per kodord efter
datakompression.
19SprÄkets entropi.
- Exempel Om det engelska alfabetets 26 bokstÀver
vore lika vanliga blir entropin per bokstav - Men, den verkliga entropin i det engelska
sprÄket Àr 2.62 bit/bokstav. Det gÄr alltsÄ att
komprimera till den nivÄn, med hjÀlp av en
variabel-lÀngd-kod, dvs en kod som har olika
antal bit för olika tecken, t.ex. s.k.
Huffmankodning.
20Example 3.1
21(No Transcript)
22(No Transcript)
23Huffman decoding example
24Figure 3.4 Huffman encoding example (a)
codewordgeneration (b) Huffman code tree.
25Figure 3.3 Huffman code tree construction (a)
final tree with codes (b) tree derivation.
26Example 3.2 A series of messages
27(No Transcript)
28(No Transcript)
29(No Transcript)
30Differentiell PCM-kodning av ljud
Det som överförs Àr skillnaden mellan nuvarande
sampel och och föregÄende mottagen sampel (inkl
kvantiseringsfel). DPCM möjliggör fÀrre bitar
per sampel Àn vidvanlig PCM. Vid tillrÀckligt
högsamplingsfrekvens kanman anvÀnda
s.k.enbitsteknik, dvs en bit per sampel.
31Linear predictive coding (LPC) signal encoder
anddecoder schematic.
AnvÀndsvid kodning av mÀnskligt
tal. Exempel GSMs talkodningkomprimerar
PCMs ursprungliga 64 000 bps till 13 000 bps.
32Delbandskodning (Sub-band coding)
En CD-spelare krÀver 16 bit per sampel x 44100
sampels per sekund x 2 kanaler 1,4Mbps
(miljoner bit per sekund). I MPEG layer 2
(anvÀnds vid DVD, DVB och digitalradio)
komprimeras datamÀngden till mellan 32Kbps och
384kbps (tusen bit per sekund) per ljudkanal.
Man utnyttjar dÄ örats maskeringseffekt, som
gör att starka ljud drÀnker svaga ljud pÄ
nÀrliggande frekvenser. En filterbank delar upp
signalen i delfrekvensband. Varje delband
kvantiseras för sig. I delband dÀr ljudet Àr
starkt kan man ha högt kvantiseringsbrus (högt
Vmax och dÀrmed högt q) utan att det hörs.
Spektrum
Hörs ej
Frekvens
33Figure 3.14 JPEG JointPhotographic Experts
Group
34DCT Discrete Cosine Transform 2D computation
35Figure 3.17 Example of DCT quantization.
36Figure 3.18 Vectoring using a zig-zag scan (a)
principle(b) vector for example shown in Figure
3.17.
37Video compression standards
- H.261, H.263, MPEG1 and MPEG2 are all based on
the following techniques - Each frame is divided into blocks.
- Transform coding of each block. (DCT coding, with
quantization, zig-zag scanning and run-length
coding.) - Differential coding of the motion.
- Motion prediction.
38Figure 4.11 Example frame sequences with (a)
I- and P-framesonly (b) I-, P- and B-frames
(c) PB-frames.
I intracoded frame P predicted/intercoded
frame B bidirectional interpolated frame
39Figure 4.20 MPEG-1 example frame structure
I intracoded frame P predicted/intercoded
frame B bidirectional interpolated frame
40Example 4.1 MPEG-1
41(No Transcript)
42Example 4.2
43(No Transcript)
44(No Transcript)