Loading documents preview...
TALLER HUFFMAN
Equipo 5
UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS FACULTAD DE INGENIERÍA CIENCIAS DE LA COMPUTACIÓN II Bogotá D.C. 1 de Noviembre de 2020
Ejercicio: Dado el siguiente mensaje: ESTERNOCLEIDOMASTOIDEO ● ● ● ●
Construir el árbol de Huffman. Con todas las fuentes de información reducidas. Presentar tabla con longitud código y longitud media. Realizar todos los pasos. SOLUCIÓN
El mensaje posee 22 caracteres. En donde: E sale 4 veces:
4 ≃0.18 22
S sale 2 veces:
2 ≃ 0.09 22
T sale 2 veces:
2 ≃ 0.09 22
R sale 1 vez:
1 ≃0.05 22
N sale 1 vez:
1 ≃0.05 22
O sale 4 veces:
4 ≃ 0.18 22
C sale 1 vez:
1 ≃0.05 22
L sale 1 vez:
1 ≃0.05 22
I sale 2 veces:
2 ≃ 0.09 22
M sale 1 vez:
1 ≃0.05 22
A sale 1 vez:
1 ≃0.05 22
D sale 2 veces:
2 ≃ 0.09 22
Donde la suma de todos los valores es aproximadamente 1. Esa sería la probabilidad de aparición de cada letra en el mensaje, los valores con decimales infinitos fueron aproximados debidamente. Ahora se ordenan los datos en una tabla de manera ascendente teniendo en cuenta el orden de entrada de los caracteres en el mensaje:
O
0.18
E
0.18
D
0.09
I
0.09
T
0.09
S
0.09
A
0.05
M
0.05
L
0.05
C
0.05
N
0.05
R
0.05
Ahora comenzamos asociando (sumando) los datos con menor probabilidad de la siguiente manera:
Continuamos con este proceso hasta llegar a reducir totalmente la tabla, esto para encontrar la forma totalmente reducida de la información, y a partir de esta se iniciará la construcción del árbol de Huffman.
Finalmente, la fuente de información totalmente reducida será la suma de las últimas dos filas y representará el 100% de la información:
Árbol resultante:
Tabla con longitud código y longitud media:
Clave
Palabra Código
Longitud
Longitud Media ( L=Σ Pi l i)
R
0100
4
0.05∗4=0.2
N
0101
4
0.05∗4=0.2
C
0110
4
0.05∗4=0.2
L
0111
4
0.05∗4=0.2
M
1000
4
0.05∗4=0.2
A
1001
4
0.05∗4=0.2
S
1110
4
0.09∗4=0.36
T
1111
4
0.09∗4=0.36
I
000
3
0.09∗3=0.27
D
001
3
0.09∗3=0.27
E
101
3
0.18∗3=0.54
O
110
3
0.18∗3=0.54
44 bits
¿ 3.54
Podemos observar que una característica llamativa de las palabras código obtenidas, y es que ninguna es prefijo de otra.