código escrito · artículos digitales de informática
 
Los secretos de MS Word
06.12.2003 :: Jaime Irurzun

En mi búsqueda de revistas interesantes sobre informática, he encontrado una que tiene buena pinta: @rroba. Deja a un lado los repetidos cursos prácticos paso a paso que tanto publican las revistas de PC, y se centra exclusivamente en artículos sobre hacking, crack, programación (php y python), seguridad, virus, linux... y temas por el estilo.

Esta semana la he comprado por primera vez y aunque me falta la mayor parte por leer, me ha gustado mucho un artículo titulado Los secretos de Microsoft Word. Con un tono muy cercano y sin pelos en la lengua, habla sobre lo que esconden los archivos del procesador de textos más utilizado del planeta. Aunque supongo que esto es algo conocido por la mayoría de la gente que entiende un poco del tema, para mí ha sido toda una sorpresa.

Siempre me había preguntado por qué ocupan tanto los archivos .DOC de MS Word, -incluso cuando no has escrito nada en ellos-, pero siempre lo acababa achacando a que Word necesitaría guardar información sobre el formato del texto. En parte esto es cierto, pero otra gran parte de estos bytes de sobra se deben a que Word incluye en el documento demasiada información relacionada con tu equipo:

[...] datos de formateo, control... algunos necesarios, otros recomendables, y otros directamente imperdonables, robados de nuestra privacidad por el programa, para quedar por siempre incrustados en el documento y poner en peligro nuestra intimidad cuando compartamos esos apuntes de clase en un disquete o entreguemos nuestro currículum en formato electrónico a cualquier empresa. [...]

Si bien es cierto que el artículo lo ha escrito alguien muy pro-software libre y muy anti-microsoft, -por lo que no es del todo objetivo en las explicaciones-, no deja de tener razón y de ser imperdonable que el gigante Microsoft juegue de esta forma con los datos de los usuarios de Word, provocando un aumento del tamaño de los ficheros muy importante, y sobre todo, evitable:

[...] Los metadatos son "datos sobre los datos" que incluyen todos los ficheros creados con Office y que Microsoft justifica alegando que su inclusión mejora la edición, el visionado, el archivado y la recuperación de documentos Office, en definitiva, parece que hacen del mundo un lugar mejor donde vivir. Pero nada de esto es cierto. Los metadatos son absolutamente prescindibles, sin menoscabar un ápice de funcionalidad del paquete ofimático. [...]

El artículo explica que se puede comprobar la inclusión de estos datos en los archivos .DOC mediante un editor hexadecimal como Hexplorer, creando un documento word, escribiendo unos párrafos, guardando el archivo, borrando lo escrito, sustituyéndolo por un nuevo texto, y guardando los cambios. Al abrir el archivo con Hexplorer, deben apreciarse -además del último texto escrito en el documento- fragmentos de los primeros párrafos que fueron borrados. A mí no me ha funcionado el experimento, pero lo he probado con Office XP. El autor recomienda hacer la prueba con Office 97, ya que en cada versión MS ha ido reduciendo la cantidad de datos incluidos en la trastienda de los documentos.

A pesar de que el artículo plantea 4 soluciones:

Yo apoyo sin duda la primera opción. Creo que esta es una buena razón más para utilizar OpenOffice.

comentarios (7) |


Comentarios del artículo
1 · Luis Vasquez · 06.12.2003

Hola Jaime.
Gusto en saludarte.
Me pareció un tema interesante el que has planteado. Aunque parezca que es un robo de información o una violación a tu privacidad no todo es tan malo como parece, me recuerdo que hace un tiempo atras, acá en Chile, se filtró información muy importante de algun ministerio del gobierno, y tras la investigación lograron determinar el origen de la información a traves de estos datos incluidos dentro del archivo, lamentablemente no me recuerdo cual fue el desenlace, o sea, si los apresaron o no, pero como puedes apreciar la información fue usada para buenos fines.
Aunque puede ser que sea demasiada la cantidad de información incluida dentro de estos archivos, el mayor peligro lo representan los desquisiados que hacen mal uso de la información.
Un saludo cordial desde Chile y mucho ánimo con tu página que es muy interesante.
Luis Vasquez.

2 · etxe · 06.12.2003

Abundando en lo que dice Luis, recuerdo que se descubrió hace meses que el famoso informe presentado por el gobierno británico para "demostrar" el peligro que suponían las supuestas "armas de destrucción masiva" (sic) de Irak, era simplemente una burda adaptación/manipulación de un trabajo universitario de tiempo atrás, gracias sobre todo a los metadatos incrustados en el archivo electrónico del documento distribuído a los medios de comunicación y otras instancias internacionales...

3 · Walito · 07.12.2003

De la misma forma, los gobiernos podrían rastrear a los opositores, o a denunciantes de maniobras del gobierno, antes que la justicia pueda finalizar con la investigación. Y esto va para cualquier gobierno, tanto para los que dicen estar del lado de los buenos, como de los que dicen que estan del lado de los malos.
No son menores las dudas de los gobiernos europeos por lo cual estan abandonando los productos de Microsoft por software Libre.

4 · Walito · 07.12.2003

Lástima que por estas latitudes Sudamericanas, @rroba llegue con 4 o 6 meses de atraso :-((

5 · Jose A. Suarez · 10.12.2003

Al hilo de los comentarios de Luis Vazquez y de etxe, expongo que "es muy loable por parte de Microsoft obligar a los autores de textos escritos con su procesador de textos a incluir información que no desean", a mi modo de ver eso es vivir en un estado policial que destruye toda posibilidad de democracia y atenta contra la individualidad de las personas. A ver si ahora, con la excusa de salvar la democracia vamos a terminar cayendo en el agujero de la dictadura encubierta en cuanto a libertad de expresión se refiere. Por mi parte nunca he usado MS Word, y a la vista de la manía de Microsoft de meterse en los asuntos de sus usuarios me niego totalmente a usarlo.

Nada, absolutamente nada, justifica que un programa de edición de textos, un sistema operativo o cualquier otra cosa se apodere de mis datos, sean cuales sean los fines que con ello se persiga.

Saludos,

Jose A. Suarez

6 · Anónimo cobarde · 29.05.2004

Lo más gracioso es cuando escribes unas líneas, guardas el archivo, las borras, vuelves a guardar el archivo, lo abres con un editor de texto, buscas un poco... y allí están las líneas que borraste ;-)
(word 97 - no he comprobado si sigue pasando en 2k o XP)

7 · Milton Rueda · 17.03.2005

Hola amigo pense q tu talvez me puedas ayudar con una clave q se me olvido en un documento word, problema radica que es una clave q pasa de 9 digitos y he utilizado passware no he podido recuperarla y es de vital importancia, entiendo yo que con un editor hexadecimal se puede facilmente y sin ser hacker desactivar esta clave aunque tengo el editor no se como usarlo, me gustaria si usted sabe o me puede orientar como hacerlo, saluos Milton Rueda














































Creative Commons - Jaime Irurzun y Aitor Martin