Metagoofil, analyse de métadonnées oubliées

Lors de la phase d’approche d’un pen-test, il est toujours intéressant de récupérer un maximum d’informations sur sa cible. Metagoofil, développé par Edge-Security, permet la récolte d’informations par le biais des documents disponibles sur Internet.

Metagoofil se chargera d’extraire les “métadonnées” de différents types de documents (pdf ,doc, xls, ppt, odp, ods), d’un nom de domaine cible, disponibles sur Internet. Pour ce faire, Metagoofil va interroger Google, et utilisera les options de recherches avancées du moteur de recherche pour cibler les extensions de fichiers (filetype:pdf site:zataz.com, par exemple).

  • Les options de Metagoofil sont les suivantes :

usage: metagoofil options

-d: domain to search
-f: filetype to download (all,pdf,doc,xls,ppt,odp,ods, etc)
-l: limit of results to work with (default 100)
-o: output file, html format.
-t: target directory to download files.

Example: metagoofil.py -d microsoft.com -l 20 -f all -o micro.html -t micro-files

Comme vous pouvez le voir, Metagoofil propose de filtrer les documents cibles desquels seront recupérés les métadonnées. Il est aussi possible de donner une limite aux résultats retournés par Google, d’enregistrer un rapport d’activité HTML et de spécifier le répertoire cible des documents qui auront été téléchargés.

  • Le rapport d’activité vous donnera les informations suivantes :

– URL d’où le document a été téléchargé.
– Un lien direct vers le document sauvé en local.
– L’extrait des metadonnées.

  • Les metadonnées peuvent contenir des informations juteuses, tels que par exemple :

– La date de création du document
– La date de dernière modification du document
– Le logiciel et la version de logiciel utilisé pour créer le document.
– La langue par défaut dans laquelle le logiciel a été configuré pour éditer le document
– Le nombre de pages, de caractères, de mots, paragraphes et de lignes du document
– Le nom du template utilisé pour la création du document
– Le type d’imprimante ayant généré le document
– Le chemin d’accès de stockage du document
– Le nom de l’utilisateur ayant créé le document (correspond la plupart du temps à l’identifiant de l’utilisateur dans le domaine)
– Le nom de l’utilisateur ayant modifié en dernier le document (correspond la plupart du temps à l’identifiant de l’utilisateur dans le domaine)

creation date - 20040919050429+02'00'
producer - OpenOffice.org 1.1.2
creator - Writer
format - PDF 1.4
mimetype - application/pdf

subject - Image
title -
producer - Canon iR C3380
author -
creation date - 20080320141726+01'00'
format - PDF 1.3
mimetype - application/pdf

title - Microsoft Word - ThreatNews_Flyer.doc
creator - PScript5.dll Version 5.2
author - robert.duschnock
producer - Acrobat Distiller 5.0.5 \(Windows\)
modification date - D:20050905162340+02'00'
creation date - 20050905142137Z
format - PDF 1.4
mimetype - application/pdf

mimetype - application/msword
language - U.S. English
paragraph count - 4
line count - 16
last saved by - eromang
character count - 2019
template - Normal.dot
creation date - 2008-10-28T12:04:00Z
title - qu'il est beau mon document word
word count - 354
page count - 1
creator - dbancal
date - 2009-08-11T17:28:00Z
generator - Microsoft Office Word