Datenkompression mit der Burrows-Wheeler-Transformation (BWT) - PowerPoint PPT Presentation

About This Presentation
Title:

Datenkompression mit der Burrows-Wheeler-Transformation (BWT)

Description:

Title: Datenkompression mit der Burrows-Wheeler-Transformation (BWT) Author: Andreas Junghans Last modified by: Junghans Created Date: 6/23/2001 8:45:31 AM – PowerPoint PPT presentation

Number of Views:44
Avg rating:3.0/5.0
Slides: 14
Provided by: AndreasJ5
Category:

less

Transcript and Presenter's Notes

Title: Datenkompression mit der Burrows-Wheeler-Transformation (BWT)


1
Datenkompression mit derBurrows-Wheeler-Transform
ation (BWT)
  • Andreas Junghans, IM2

2
Inhalt
  • Verfahren zur Datenkompression
  • Die Burrows-Wheeler-Transformation (BWT)
  • Datenkompression mit der BWT
  • Implementierung
  • Zusammenfassung und Ausblick

3
Verfahren zur Datenkompression
  • verlustfrei und verlustbehaftet
  • Wörterbücher und Statistiken
  • Wörterbücher schnell
  • Statistiken gute Kompression

BWT
BWT
4
Verfahren zur Datenkompression
  • adaptiv und statisch
  • Ströme und Blöcke

Code-Tabelle/Wörterbuch
0010110101011010
0010110101011010
0010110101011010
0010
1101
0101
1010
5
Die Burrows-Wheeler-Transformation
  • BWT Vorsortierung (reversible Transformation)
  • verlustfrei
  • statistisch
  • adaptiv oder statisch
  • blockorientiert (ab 100 KB)
  • Geschwindigkeit vergleichbar Wörterbüchern
  • Effizienz vergleichbar Statistiken

6
Die Burrows-Wheeler-Transformation
  • Vorwärtstransformation

HelloCello
ooHCeellll
7
Die Burrows-Wheeler-Transformation
  • Rücktransformation

8
Die Burrows-Wheeler-Transformation
  • Eigenschaften
  • Gruppen gleicherZeichen
  • wenige, kurzeUnterbrechungen

a rray swap(pStart a rray localIndex a rray
(n a rray (i.e. the posit a rray (needed for
rec a rray (which must be A rray new
byte1 a rray and outputs the a rray for
sortin a rray must not be ide a rray of
ltcodegtintlt/c a rray of MTF codes
9
Datenkompression mit der BWT
  • Ablauf

BWT
MTF
RLE Huffman / AC
MTF Move-To-Front-Coding (Nach-vorne-Codierung
) RLE Run-Length-Encoding (Lauflängen-Codierung)
AC Arithmetische Codierung
10
Datenkompression mit der BWT
  • MTF Move-To-Front-Coding

0
0
0
A
0
A
0
B
1
1
1
0
1
0
1
A
...
...
...
...
65
A
65
_at_
65
_at_
65
?
66
B
66
B
66
B
66
_at_
AAB
65, 0, 66
67
C
67
C
67
C
67
C
...
...
...
...
255
255
255
255
255
255
255
255
11
Datenkompression mit der BWT
  • MTF Move-To-Front-Coding

12
Implementierung
  • Speicher sparen (800 GB vs. 4,4 MB)
  • Effiziente Sortierung
  • RLE vor BWT (Rekursionstiefe!)
  • Huffman mit Codes für 0-Reihen
  • Effizienzvergleich

Datei
Original
WinZip
bzip2
Eigenbau
SRC-124.pdf
107.864
87.628 (81)
89.355 (83)
90.898 (84)
opngl32p.cpp
873.331
76.600 (9)
52.221 (6)
57.510 (7)
powerpnt.exe
4.247.604
2.151.382 (51)
2.030.911 (48)
2.132.403 (50)
13
Zusammenfassung und Ausblick
  • BWT ist Vorsortierung von Daten
  • Ergebnis läßt sich meist sehr gut komprimieren
  • Einsatz von RLE und statistischen Verfahren
  • Andere Kompressionsmöglichkeiten?
  • Andere Transformationen?
  • Verlustbehaftete Kompression?
Write a Comment
User Comments (0)
About PowerShow.com