sábado, 27 de agosto de 2011

Compresión de datos




¿Sábes como se comprime un archivo?


En esta oportunidad les explicaremos el concepto básico de la compresión de archivos en .ZIP y .RAR los cuales son los más comunes.


Muchos de los archivos en el computador son redundante, ¿Qué quiere decir esto?, que la información se repite una y otra vez en paquetes. Por este motivo los programas de compresión de archivos se deshacen de esta redundancia y guardan una sola copia de la información dejando registrada la referencia de la ubicación en donde la información aparece nuevamente dentro del archivo.


Con un conocido trabalenguas haremos un ejemplo:



"Pablito clavo un clavito - que clavito clavo Pablito"



Encontramos dentro de esta frese 8 palabras compuestas de 43 letras, 8 espacios y 1 guion. Las letras, espacios, y símbolos en un espacio de memoria suman 52 unidades.


La redundancias presentes son:

"Pablito" aparece dos veces.

"clavo" aparece dos veces.


"un" aparece una vez.
"clavito" aparece dos veces.

"que" aparece una vez.


Por lo tanto, 3 de 8 se repiten y con 5 palabras podemos construir toda la frase.


Las aplicaciones utilizan algoritmos que catalogan las piezas de información, si el trabalenguas se ordena en forma numérica utilizando las palabras que se repiten queda como sigue:


1.-Pablito


2.- clavo


3.- clavito



Al leerlo:


1 2 un 3 - que 3 2 1


Tendremos así el orden y 5 palabras, obtenemos la frase compuesta de 8 palabras. Las aplicaciones utilizan este método, lee la información redundante y la ubicación para ser registrado en el archivo original.


Conclusión:


La capacidad de compresión de un archivo, depende de la cantidad de información existente, las redundancias, de los patrones que se obtienen según el análisis y principalmente del algoritmo utilizado.

No hay comentarios:

Publicar un comentario en la entrada