miércoles, 30 de marzo de 2011

*Extraer y eliminar metadatos de un documento*

En la siguiente entrada daré a conocer la forma como se extraen los metadatos de un documento (.doc), información básica de este como la fecha en la cual fue creado, los usuarios encontrados, la aplicación en la cual fue creado, entre otros. Las herramientas de extracción de metadatos tienen como función principal analizar o mostrar la información contenida en los metadatos de un fichero.

Para esto, tambien vamos a implementar FOCA y lo vamos a utilizar vía online, pero se puede descargar de la página oficial http://www.informatica64.com/foca/, este software soporta varios formatos para extraer información y no almacena los ficheros subidos ni el contenido de los mismos.

EXTRAER METADATOS DE UN DOCUMENTO
  • Para subir el documento, damos clic en EXAMINAR, inmediatamente nos aparece una ventana en la cual debemos seleccionar el mismo al cual le vamos a extraer los datos, despues de haberlo elegido damos clic en Open.


  • Como siguiente paso, damos clic en Analizar el fichero! y esperamos a que nos muestre los metadatos del archivo.

  • Cuando el software termina la búsqueda o scanneo del documento, aparece la siguiente información (METADATOS), muestra datos específicos que se encuentran en el documento.


ELIMINAR METADATOS DE UN DOCUMENTO


Para la eliminación de estos metadatos, vamos a implementar un software llamado Doc scrubber, el cual es un programa que nos permite hacer un análisis y una depuración de los metadatos, para ello debemos instalarlo; puede limpiar documetnos y borrar datos ocultos de varias versiones de Word. Cuando depura los metadatos, este nos crea un nuevo archivo con el mismo contenido pero cambia el nombre ya que el programa le añade al final la palabra SCRUBBER, esto nos específica que ya realizó la depuración o la eliminación de los metadatos.

  • Después de haber instalado la aplicación, nos aparece una ventana, la cual nos ofrece dos opciones para utilizar el software, una de ellas es Analyza que nos permite verificar si el archivo o documento tiene metadatos y la otra es Scrub que nos permite eliminar definitivamente los metadatos; para este caso damos clic en Scrub.


  • Al instante nos aparece un asistente en el cual debemos seleccionar el método para especificar el archivo, en este caso elegimos la segunda opción para seleccionar la carpeta en la cual se encuentra el archivo que vamos a utilizar y damos Next.



  • Para este caso tenemos el docuemento en el escritorio y por ende seleccionamos Desktop y damos clic en ok.



  • Habiendo seleccionado la ruta en la cual se encuentra el archivo, ya esta nos aparece en la barra de browser y damos clic en Next.


  • En el siguiente asistente nos brindan unas opciones de configuración para el borrado de los metadatos, si deseamos seleccionamos todas las opciones dependiendo de que es lo queremos eliminar y damos clic en Next; esperamos a que complete el proceso y cerramos la aplicación.



  • Ahora nos dirigimos al escritorio y verificamos que el nuevo archivo esté allí con el nuevo nombre asignado que pone por defecto este software.

NOTA: Este nombre puede ser modificado y no altera el resultado de la eliminación de los metadatos.


  • Ahora nos dirigimos nuevamente a la página oficial de Foca para probar, damos clic en Examinar y subimos el documento, para finalizar damos clic en Analizar fichero!.


  • En la siguiente imagen podemos observar que efectivamente los metadatos han sido eliminados del documento.

No hay comentarios:

Publicar un comentario