Un formato de fichero es una manera particular de
codificar información para almacenarla en un fichero informático.
Dado que una unidad de disco, o de hecho cualquier almacenamiento
informático sólo puede almacenar bits, la computadora debe tener alguna
manera de convertir la información a ceros y unos y viceversa. Hay
diferentes tipos de formatos para diferentes tipos de información. Sin
embargo, dentro de cada tipo de formato, por ejemplo documentos de un
procesador de texto, habrá normalmente varios formatos diferentes, a
veces en competencia.
Generalidades
Algunos formatos de fichero están diseñados para almacenar tipos de
datos muy particulares: el formato JPEG, por ejemplo, está diseñado para
almacenar solamente imágenes estáticas. Otros formatos de fichero, sin
embargo, están diseñados para almacenar varios tipos diferentes de
datos: el formato GIF admite almacenar imágenes estáticas y animaciones
simples, y el formato QuickTime puede actuar como un contenedor para
muchos tipos diferentes de multimedia. Un fichero de texto es
simplemente uno que almacena cualquier texto, en un formato como ASCII o
Unicode, con pocos o ninguno caracteres de control. Algunos formatos de
fichero, como HTML, o el código fuente de algún lenguaje de programación
particular, también son de hecho ficheros de texto, pero se adhieren a
reglas más específicas que les permiten ser usados para propósitos
específicos.
A veces es posible hacer que un programa lea un fichero codificado en un
formato como si hubiera sido codificado en otro formato. Por ejemplo,
uno puede reproducir un documento de Microsoft Word como si fuera una
canción usando un programa de reproducción de música que acepte ficheros
de audio «sin cabecera». El resultado no suena muy melodioso, sin
embargo. Esto es así porque una disposición sensata de bits en un
formato casi nunca tiene sentido en otro.
Especificaciones
Muchos formatos de fichero, incluyendo algunos de los formatos de
fichero más conocidos, tienen publicado un documento de especificación
(a menudo con una implementación de referencia) que describe exactamente
como se deben codificar los datos, y que se puede usar para determinar
si un programa concreto trata un formato de fichero particular
correctamente o no. Hay, sin embargo, dos razones por las que éste no es
siempre el caso. Primero, algunos desarrolladores de formatos de fichero
ven sus documentos de especificación como secretos comerciales, y por lo
tanto no los ponen a disposición del público. Un ejemplo prominente de
esto existe en varios formatos usados por las aplicaciones de Microsoft
Office. Segundo, algunos desarrolladores de formatos de fichero nunca
gastan tiempo en escribir un documento de especificación independiente;
en vez de ello, el formato se define sólo implícitamente, por medio del
programa que manipula datos en ese formato.
Observe que utilizar formatos de fichero que no tengan una
especificación disponible públicamente puede resultar caro. Aprender
como funciona el formato requerirá bien hacerle ingeniería inversa a
partir de una implementación de referencia o adquirir el documento de
especificación por algún precio a los desarrolladores del formato. Este
segundo enfoque es posible solamente cuando hay un documento de
especificación, y requiere normalmente firma un acuerdo de no
divulgación. Ambas estrategias requieren mucho tiempo, dinero, o ambos.
Por lo tanto, y como regla general, los formatos de fichero con
especificaciones disponibles públicamente son usados por un número mayor
de programas, mientras que los formatos no públicos son reconocidos
solamente por unos pocos programas.
|