Logowanie
 
 Użytkownik
 Hasło
 Zapamiętaj mnie


Nie masz jeszcze konta? Możesz je założyć tutaj.
 


Języki/Languages
 
Wybierz język interfejsu:

 

 
Opis formatu GEDCOM
Wysłany przez: Maatzey włączone Środa, 23 Kwiecień 2003 - 12:08
{article-edit-del}
Komputery i InternetTo pierwszy artykuł przesłany przez użytkownika naszego serwisu. Jest dodany "ręcznie" przez admina, ale to nie umniejsza faktu coraz większej aktywności użytkowników GenPolu. Zapraszam wszystkich do dodawania kolejnych artykułów korzystając z formularza Wyślij artykuł.

Poniższy artykuł jest krótkim opisem standardu GEDCOM. Jego oryginalna wersja (w języku angielskim) znajduje się pod adresem http://www.leisterpro.com/doc/Articles/GEDCOM101.html.
Wszystkie odnośniki ze stopki kierują na stronę autora tekstu.

Napisane przez Jan McClintock przetłumaczone przez Macieja Plewickiego



Format GEDCOM znany jest przez szerokie rzesze używających go genealogów jako znakomity sposób na dzielenie się genealogicznymi informacjami. Niestety podąża za nim także zła sława – jako formatu wybrednego. W tym artykule postaram się wyjaśnić absolutne podstawy dotyczące formatów pliku GEDCOM. Więcej detali (Duuuużo więcej) znaleźć można we właściwej dokumentacji GEDCOM v5.5 tutaj. Przekonasz się, że format ten pełen jest zawiłości i intrygującego potencjału.

Czym jest GEDCOM?
GEDCOM jest akronimem od Genealogical Data Communication (Przekaz Danych Genealogicznych), jest to metoda formatowania tekstu danych genealogicznych w ten sposób, aby różne oprogramowanie i systemy operacyjne mogły go czytać i rozumieć.
“Standard” GEDCOM był początkowo rozwijany przez the Church of Jesus Christ of Latter-day Saints' Family History Department (Nie znam pełnej polskiej nazwy, a nie chciałbym nikogo obrazić), który jest właścicielem praw autorskich do niego. Mimo, że początkowo był „uniwersalnym” standardem, potem jednak wiele programów wprowadziło swoje własne, częściowo zmodyfikowane odmiany GEDCOM. Dla użytkownika oznacza to tyle, że nie jest to zawsze oczywiste, że wszystkie dane będą swobodnie wymieniane pomiędzy jednym a drugim programem (więcej o tym poniżej)

Czym jest plik GEDCOM?

Plik GEDCOM jest plikiem tekstowym (zwykle w standardzie ASCII), gdzie każda linia zawiera specyficzną cześć danych odpowiadających wprowadzanym danym rodziny. Linie są ponumerowane, aby pokazać hierarchię danych i zawierają znaczniki (tagi) odpowiednie do poszczególnych typów danych.

Jest dość prostą rzeczą przygotowanie pliku GEDCOM ręcznie (za pomocą programu tekstowego), lecz proces taki może wymagać wielkiej cierpliwości. Dla przykładu plik GEDCOM dla jednego z moich rodzinnych archiwów z Reunion zawierających jedynie 405 osób (228 rodzin) zawierał 5306 linijek! Reunion przygotuje plik GEDCOM, który będzie właściwie sformatowany i gotowy do używania przez innych. Detale i instrukcje znaleźć można w elektronicznym podręczniku [Help -> Search for Help "gedcom"]

Części pliku GEDCOM

Po przygotowaniu pliku GEDCOM i otwarciu go za pomocą programu do obróbki tekstu zobaczyć można linijkę za linijką pełne numerów, skrótów i innych kawałków danych. Plik taki nie zawiera pustych linijek ani akapitów. Mimo, że wygląd jego może wprawiać w zakłopotanie to w tym szaleństwie jest metoda.

Te grupy linijek, które zawierają informacje o osobach (INDI od angielskiego individual), źródle (SOUR od angielskiego source) lub rodzinie (FAM od angielskiego family) są poszczególnymi rekordami danych, a każda linijka w rekordzie posiada numer poziomu. Pierwsza linia każdego rekordu posiada numer „0” (zero), w celu podkreślenia, iż jest to początek nowego rekordu. W samym rekordzie różne numery poziomów odnoszą się do następnego najbliższego poziomu powyżej; kolejne linie, za linią oznaczoną zerem odnoszą się to tego rekordu aż do osiągnięcia następnej linii z numerem 0.

Dla przykładu poniżej znajduje się uproszczony record osoby z uwagami w nawiasach.

0 NAME Joseph /PRYOR/ 1 SEX M (dane dotyczą rekordu powyżej, o numerze 0, którym jest Joseph)
1 BIRT (więcej danych o Josephie, tym razem informacja o tym, że się urodził...)
2 DATE 13 FEB 1922 (szczegóły dotyczące urodzin w poziomie 1, powyżej)
2 PLAC Monroeville, Cass Co, MI (dalsze szczegóły o urodzinach)
[Te dane dotyczą Josepha PRYOR aż do następnej linii zaczynającej się od 0 i sygnalizującej nowy rekord:]
0 NAME Martha /WHITE/ (nowy rekord dotyczący nowej osoby)
1 SEX F (dane dotyczące już Marthy)
1 BIRT (itd.)

Za numerem poziomu linie zawierają Znaczniki (Tagi), które są skrótem typu danych, jakie zawarte są w poszczególnych liniach. Większość z nich jest oczywistych (dla mówiących językiem angielskim); HUSB jako mąż (z angielskiego husband) PLAC dla miejsca (z angielskiego place), MARR dla małżeństwa (z angielskiego marriage) itd. Lecz niektóre są bardziej wyjątkowe jak EMIG dla emigracji (emigration z angielskiego) i HMOT dla męża matki (a angielskiego husband of mother). Znaczniki mogą także być Wskaźnikami (@S43@), które wskazują na inne osoby z rodziny, lub źródła z tego samego pliku GEDCOM.

W Reunion, znacznik GEDCOM przypisywany jest do pola w momencie jego utworzenia. Można dalej modyfikować te znaczniki podczas procesu eksportowania pliku GEDCOM. Jednakże należy być świadomym, że nie wszystkie programy rozpoznają wybrane znaczniki, szczególnie te stworzone samodzielnie. Może to powodować, że dane zamieszczone za znacznikiem zostaną zignorowane lub utracone.

Importując plik GEDCOM program genealogiczny używa numerów poziomów i znaczników, aby przyporządkować dane do poszczególnych rodzin z nienaruszonymi powiązaniami. Oprogramowanie czyta numery linii i znaczniki i próbuje przyporządkować dane do odpowiednich pól. Jeżeli oprogramowanie nie rozpozna znacznika, albo ignoruje taką linię, albo umieszcza dane z niej w specyficznym polu, aby mogła zostać następnie przeniesiona ręcznie do innego, odpowiedniego. Importując plik GEDCOM do Reunion, istnieje wybór odrzucenia danych z nierozpoznanych znaczników, lub umieszczanie ich w polu Notatki.

Poniżej znajduje się przykład pliku GEDCOM wziętego z mojego własnego archiwum w Reunion. Celem (z angielskiego DESTination) jest archiwum rodowe a zestawem znaków (z angielskiego CHARacter set)jest MS-DOS.

Pierwszym rekordem (sekcja ogólna pliku) jest nagłówek (z angielskiego HEADer) (rozpoczynająca się linią 0 i ciągnącą się aż do wykrycia następnej linii rozpoczynającej się od 0) Nagłówek zawiera wstępne informacje, takie jak źródło (z angielskiego SOURce), czyli program użyty do utworzenia pliku GEDCOM, a także wersja programu (VERSion) itd.

0 HEAD
1 SOUR REUNION (oprogramowanie tworzące plik)
2 VERS V5.0 (wersja Reunion)
2 CORP Leister Productions
1 DEST ANSTFILE (oprogramowanie importujące)
1 DATE 12 NOV 1997 (data utworzenia pliku GEDCOM)
1 FILE Paternal Family File 4.0 (nazwa pliku na dysku)
1 GEDC
2 VERS 4.0 (zastosowana wersja GEDCOM)
1 CHAR IBM DOS (ustawienia znaków oprogramowania importujące)

Następna sekcja dotyczy osoby (INDIvidual) Michaela Fitzgerald. Przypisany jest mu numer porządkowy 302.


0 @I302@ INDI
1 NAME Michael /FITZGERALD/
1 SEX M
1 BIRT
2 DATE 1842
2 PLAC Duncannon, Ireland
1 DEAT
2 DATE 3 JAN 1916
1 OCCU Theater Stage Hand
1 NOTE Emigrated from Ireland in 1860, prob. landed at the Battery, New York City. Had a brother who emigrated later and settled in Boston. Michael worked for the old Forepaugh's Theatre as a stage hand and collected autographs and news clippings of
2 CONT stage stars; spoke with a thick Irish brogue and known for his wit.
1 SOUR @S2@</tt>
1 HEAL Died of le grippe.
1 FAMS @F107@</tt>


[Znacznik CONTinue (kontynuacja) oznacza, że pole NOTE (notatki) zawiera więcej danych niż zmieści się w jednym znaczniku, dlatego będzie kontynuowane na następnym poziomie, 2]
[Linia SOURce (źródło) pokazuje gdzie informacja podana powyżej została odnaleziona; wskazuje do źródła o numerze 2; patrz poniżej]
[FAMS @F107@ jest wskaźnikiem do rekordu rodziny (FAMily) litera S w FAMS oznacza, że rekord ten dotyczy danej osoby i małżonka, tworzących rodzinę o numerze 107; patrz poniżej]

Dalej w pliku GEDCOM znajdują się źródła (SOURces), są wymienione w porządku numerycznym. Poniżej jest rekord dla źródła numer 2

0 @S2@ SOUR
1 NAME "Historia Rodziny Fitzgerald", Zebrane przez Eileen DeHope i Elizabeth DeHope Boyce, 1978


Dalej w pliku GEDCOM wymienione w porządku numerycznym są rodziny. Poniższa rodzina o numerze porządkowym 107, składa się z męża (HUSBand) o numerze porządkowym 302 i jego żony (WIFE) o numerze porządkowym 303, oraz ich dzieci (CHILdren) o wymienionych numerach porządkowych. Zawarta jest tu także data ślubu małżonków (MARRiage DATE)

0 @F107@ FAM
1 HUSB @I302@</tt>
1 WIFE @I303@</tt>
1 CHIL @I38@</tt>
1 CHIL @I316@</tt>
1 CHIL @I111@</tt>
1 CHIL @I109@</tt>
1 CHIL @I318@</tt>
1 CHIL @I36@</tt>
1 CHIL @I321@</tt>
1 MARR
2 DATE 17 DEC 1862


Należy pamiętać, że w kompletnym pliku GEDCOM zawartych jest wiele rekordów. Wszystkie linie są wymienione jedna po drugiej, zwykle z osobami wymienionymi na początku, dalej źródłami i rodzinami. Ostatnim rekordem wymaganym w pliku GEDCOM jest tak zwany Trailer (z angielskiego zwiastun), który informuje oprogramowanie, że plik został zakończony:

0 TRLR



Strona z Artykułami | Strona domowa Reunion
e-mail: info@LeisterPro.com
© 2000 Leister Productions Inc. All rights reserved.

 

 

Powiązane odsyłacze
  · Więcej o Komputery i Internet
· Napisane przez Maatzey


Najczęściej czytany artykuł w Komputery i Internet:
Badania genealogiczne przy pomocy internetu

 

Opis formatu GEDCOM | Loguj/Utwórz konto | 0 Komentarze
Próg
Komentarze są własnością ich twórców. Nie ponosimy odpowiedzialności za ich treść.
    
Dodaj do ulubionych .::. Startuj z nami .::. Rekomenduj nas .::.
Copyright 2004 Tomasz Nitsch ( admin@genpol.com ) | Warunki używania serwisu | Polityka prywatności