Vous avez dit GEDCOM?

GEDCOM est l'abréviation de GEnealogical Data COMmunication (Communication de Données Généalogiques). C'est un format de fichier défini initialement par l'Eglise des Mormons pour permettre les échanges de données généalogiques informatisées au sein de leur communauté.
Ce format est devenu aujourd'hui le standard international des échanges d'informations entre la quasi-totalité des logiciels de généalogie
.

Un fichier au format GEDCOM est une base relationnelle d'informations généalogiques mise en forme de fichier séquentiel. Une base relationnelle est un fichier dont la structure permet de gérer des informations liées entre elles par une relation. Deux individus, par exemple, peuvent être liés par une relation de type 'mariage' ou 'parent-enfant'. Dans un fichier séquentiel, les informations sont stockées les unes à la suite des autres. Les informations généalogiques que l'on trouve dans un fichier GEDCOM (fichier séquentiel) sont toujours associées à un identificateur qui les caractérise et qui permet de relier une information à une autre.

Depuis sa création, la norme GEDCOM a évolué et aujourd'hui sa version courante est la version 5.5. De version en version, de nouveaux identificateurs ont été ajoutés pour gérer des informations supplémentaires, et certains identificateurs ont été supprimés.Tous les programmes de généalogie ne sont pas compatibles avec la plus récente version de la norme GEDCOM. Lors de l'import d'un fichier GEDCOM, un programme ignorera généralement les informations associées aux identificateurs qu'il ne reconnait pas.

Le langage GEDCOM version 5.5

Le format d'une ligne d'informations GEDCOM

On peut rencontrer dans un fichier GEDCOM quatre formats de ligne différents.

Pour décrire les informations qui sont regroupées dans une structure et n'ont pas de relations avec d'autres informations du fichier, on trouvera des lignes dont la syntaxe sera:

Décoder les informations d'un fichier GEDCOM

Tout fichier GEDCOM débute obligatoirement par un entête (identificateur HEAD) et se termine obligatoirement par une marque de fin (identificateur TRLR). Entre l'entête et la marque de fin, on trouvera principalement les types d'informations suivants:
  • les informations relatives aux individus (identificateur INDI)
  • les informations relatives aux familles (identificateur FAM)
  • les notes (identificateur NOTE)
  • les sources (identificateur SOUR)
  • La norme GEDCOM comprend beaucoup d'autres identificateurs dont vous trouverez la description plus loin dans cette page. Un bon nombre d'entre eux n'ont d'utilité que pour les membres de l'Eglise des Mormons. Certains programmes utilisent des identificateurs spécifiques supplémentaires. Les informations associées à ces identificateurs spéciaux ne pourront pas être transférées entre différents logiciels par Export/Import d'un fichier GEDCOM.

    Exemple d'analyse d'un fichier

    L'entête

    
    0 HEAD entête du fichier
      1 SOUR Legacy          système créateur du fichier 
        2 VERS 2.0version
        2 NAME Legacy for Windows   nom du système
        2 CORP Millennia Corp.          nom de l'organisme, de la société
          3 ADDR PO Box 1800            adresse
            4 CONT Duvall, WA 98019     suite de l'adresse
      1 DEST Legacy          système destinataire du fichier
      1 DATE 10 Sep 1998     date de création du fichier
      1 CHAR ANSI            jeu de caractères utilisé
      1 SUBM @S0@            auteur  (pointeur vers l'auteur @S0@)
      1 FILE WEINLAND.GED    nom du fichier GEDCOM
      1 GEDC                 identification GEDCOM
        2 VERS 5.5version utilisée
        2 FORM LINEAGE_LINKED       format utilisé
    

    L'auteur du fichier
    
    0 @S0@ SUBM    définition de l'auteur @S0@
      1 NAME Louis JEANPIERRE        nom de l'auteur
    

    Un individu de la généalogie
    
    0 @I1@ INDI  définition de l'individu @I1@
      1 NAME Jules Albert /Leprince/    prénoms/nom
      1 SEX M         sexe masculin
      1 BIRTnaissance
        2 DATE 19 Aug 1875      date
        2 PLAC Metz, 57, F      lieu
        2 SOUR @S1@             source (pointeur vers la source @S1@)
          3 PAGE pg 56            numéro de la page
      1 DEATdécès
        2 DATE 21 Feb 1947      date
        2 PLAC Nancy, 54, F     lieu
      1 CHANdernière modification 
        2 DATE 10 Sep 1996      date
          3 TIME 09:07           et heure
      1 FAMS @F3@      famille de son couple (pointeur vers famille @F3@)
      1 FAMC @F1@      famille de ses parents (pointeur vers famille @F1@)
      1 OCCU mécanicien profession
      1 NOTE @NI1@     note associée à l'individu (pointeur vers note @NI1@)
    

    Une famille
    
    0 @F1@ FAM         définition de la famille @F1@
      1 HUSB @I3@        le mari  (pointeur vers l'individu @I3@)
      1 WIFE @I4@        l'épouse  (pointeur vers l'individu @I4@)
      1 MARR             mariage
        2 DATE 5 Mar 1874      date
        2 PLAC Sarcey, 69, F   lieu
        2 NOTE @NF1@   note associée au mariage (pointeur vers note @NF1@)
      1 CHIL @I1@      1er enfant de la famille (pointeur vers @I1@)
      1 CHIL @I2@      2ème enfant de la famille (pointeur vers @I2@)
      1 CHAN           dernière modification
        2 DATE 30 May 1998    date
          3 TIME 15:24         et heure
    

    Une note
    
    0 @NI1@ NOTE  blablabla...  début du texte de la note @NI1@
      1 CONT  etc...            suite du texte 
      1 CONT  etc...            suite du texte 
    
    Autre format possible, la note est directement incluse dans une structure (INDIvidu, FAMille...):
    
    0 @I19@ INDI  définition de l'individu @I19@
      1 NAME  Alphonse /Leprince/    prénoms/nom
      ...
      1 NOTE  blablabla...          début du texte de la note 
        2 CONT  etc                 suite du texte 
    

    Une source
    
    0 @S1@ SOUR
      1 ABBR Les familles de Pontaudouce, par David Koskoff.
      1 TITL Les familles de Pontaudouce, par David Koskoff.
    

    Un individu sans lien de parenté (ami, voisin, parrain...)
    
    O @I9@ INDI
      1 NAME René/LAMORCE/
      1 ASSO @I4@
        2 RELA parrain
    

    La marque de fin de fichier
    
    0 TRLR            marqueur de fin de fichier
    

    La liste complète des identificateurs GEDCOM 5.5 et leur définition

    Le nom complet en anglais de l'identificateur est donné entre {crochets} pour une meilleure compréhension, mais c'est toujours le nom abrégé en 3 ou 4 caractères qui est utilisé dans les fichiers GEDCOM.

  • Pour toute information complémentaire sur le format GEDCOM, consultez le document de référence de la version 5.5. Vous trouverez aussi ces informations sous forme d'un fichier compressé de documentation à imprimer sur le site de GedX (en anglais).

  • Ceux qui veulent en savoir plus sur l'évolution de la norme GEDCOM peuvent consulter le Gedcom File Information Web site ou le site Gentech.
  •  

    Des programmes utilitaires pour travailler sur des fichiers GEDCOM

    On trouve sur le site américain de l'Université de l'Etat de Pennsylvanie un grand nombre de programmes utilitaires qui manipulent des données GEDCOM. Ces utilitaires vous permettront de:
  • comparer des fichiers GEDCOM,
  • créer des arbres ou des tableaux à partir de fichiers GEDCOM,
  • visualiser, manipuler et imprimer des données GEDCOM,
  • créer vos pages web à partir de vos données GEDCOM,
  • convertir des données GEDCOM au format MS EXCEL ou MS ACCESS,
  • faire des statistiques sur des fichiers GEDCOM.
  • Pour consulter la liste de ces utilitaires, allez sur ftp://ftp.cac.psu.edu/pub/genealogy/gedcom/index.html
    Les versions de démonstration de plusieurs logiciels de généalogie sont également disponibles sur ce site. Pour en consulter la liste, allez sur ftp://ftp.cac.psu.edu/pub/genealogy/programs/index.html

    Sur les sites suivants, vous trouverez aussi des programmes utilitaires qui vous serviront à diverses manipulations de vos données généalogiques :

  • PAF Review Home Page [en anglais]
    La page à consulter pour tout savoir sur ce programme utilisé par l'Eglise des Saints du Dernier Jour et sur les utilitaires complémentaires.
  • GenBox2 [en anglais]
    Pour faire des arbres et tableaux d'ancêtres à partir d'un fichier GEDCOM.
  • GEDSplit [en anglais]
    Pour éclater des fichiers GEDCOM.
  • GEDPlace [en anglais]
    Pour éditer les noms de lieux dans des fichiers GEDCOM.
  • WWW Genealogical Tools [en anglais]
    Exemples de pages Web produites à partir de fichiers GEDCOM par les outils Ged2html, Ged2htm, Gedpage, Ged2www, Webged.

  • VisuGed [en français]
    Programme de visualisation, de comparaison, de contrôle, d'impression et de conversion de fichiers GEDCOM.
  • Créer des pages web à partir de fichiers GEDCOM (conversion au format HTML)
  • Kinship Archivist [en anglais]
    Version française téléchargeable: ftp://kinshiparchivist.com/pub/ka/anc025fr.exe
  • Ged2html [en anglais]
  • Gedpage [en anglais]
  • Ged2www [en anglais] ou sa version française de Jean-Baptiste Fahy.
  • GED2WEB [en anglais]
  • GedcomToHTML [en anglais]
  • Vous trouverez sur le site http://help.surnameweb.org/knight/ une sélection d'outils de conversion GEDCOM-HTML.
    Supprimer dans un fichier GEDCOM les renseignements qui concernent les personnes non décédées
    Convertir les caractères ANSEL en caractères ASCII, MSDOS ou Windows

    Les fichiers GEDCOM qui contiennent des caractères accentués utilisent souvent le jeu de caractères ANSEL, le plus couramment utilisé dans les catalogues de bibliothèques. Lorsqu'un fichier GEDCOM contient la ligne :
      1 CHAR ANSEL
    vers le début du fichier, beaucoup d'éditeurs de texte n'afficheront pas tous les caractères correctement. Barney Tyrwhitt-Drake a créé un convertisseur ANSEL-texte.

    Dernière mise à jour le 28 juillet 2001