GEDCOM

редактировать
Спецификация генеалогических данных
GEDCOM
Расширение имени файла .ged
РазработаноLDS FHD
Первый выпуск1984; 36 лет назад (1984)
Последний выпуск GEDCOM 5.5.1 Standard. (15 ноября 2019; 10 месяцев назад (2019-11-15))
Тип форматаГенеалогия обмен данными
Стандартный Фактически
Веб-сайтwww.familysearch.org / developers / docs / guides / gedcom

GEDCOM() (акроним, расшифровывающийся как «Обмен генеалогическими данными») - это открытый де-факто спецификация для обмена генеалогическими данными между различными генеалогическими программами. GEDCOM был разработан Церковью Иисуса Христа Святых последних дней (Церковь LDS) в качестве помощи в генеалогическом исследовании.

Файл GEDCOM представляет собой простой текст (обычно либо UTF-8, либо ASCII ), содержащие генеалогическую информацию об отдельных лицах, и метаданные, связывающие эти записи вместе. Большинство программ для генеалогии поддерживает импорт и экспорт в формат GEDCOM. Однако некоторые программы генеалогии включают использование проприетарных расширений формата, которые не всегда распознаются другими генеалогическими программами, такими как спецификация GEDCOM 5.5 EL (Extended Locations).

Хотя GEDCOM X и несколько других спецификаций были предложены в качестве замены, текущая версия 2019 года, основанная на проекте 1999 года, остается отраслевым стандартом спустя 20 лет.

Содержание

  • 1 Модель GEDCOM
  • 2 Файловая структура GEDCOM
    • 2.1 Пример
  • 3 Версии
    • 3.1 История выпусков
  • 4 Ограничения
    • 4.1 Поддержка многопользовательских событий и источников
    • 4.2 Неоднозначность в спецификации
    • 4.3 Поддержка различных определений семейств и отношений
    • 4.4 Порядок событий, не имеющих дат
  • 5 Менее известные функции
    • 5.1 Мультимедиа
    • 5.2 Конфликты информация
    • 5.3 Интернационализация
  • 6 GEDCOM X
  • 7 Альтернативы GEDCOM
  • 8 См. также
  • 9 Ссылки
  • 10 Внешние ссылки

Модель GEDCOM

GEDCOM использует модель данных, связанная с происхождением. Эта модель данных основана на нуклеарной семье и индивиду. Это контрастирует с моделями, основанными на фактах, где данные структурированы так, чтобы отражать подтверждающие доказательства. В модели данных, связанной с происхождением GEDCOM, все данные структурированы так, чтобы отражать предполагаемую реальность, то есть фактические (или предполагаемые) нуклеарные семьи и индивидов.

Структура файла GEDCOM

Файл GEDCOM состоит из раздела заголовка, записей и раздела концевика. В этих разделах записи представляют людей (запись INDI), семьи (записи FAM), источники информации (записи SOUR) и другие различные записи, включая примечания. Каждая строка файла GEDCOM начинается с номера уровня, где все записи верхнего уровня (HEAD, TRLR, SUBN и каждый INDI, FAM, OBJE, NOTE, REPO, SOUR и SUBM) начинаются со строки с уровнем 0, а другие числа уровней - положительные целые числа.

Хотя теоретически возможно написать файл GEDCOM вручную, формат был разработан для использования с программным обеспечением и поэтому не особенно удобен для человека. Валидатор GEDCOM, который можно использовать для проверки структуры файла GEDCOM, включен как часть проекта PhpGedView, хотя он не предназначен для использования в качестве автономного валидатора. Для автономной проверки вы можете использовать «Windows GEDCOM Validator» или более старый неподдерживаемый Gedcheck от Церкви LDS Church.

В 2001 году проект GEDCOM TestBook оценил, насколько хорошо четыре популярные программы генеалогии соответствуют стандарту GEDCOM 5.5 с помощью программы Gedcheck. Результаты показали, что существует ряд проблем и что «наиболее часто встречающейся ошибкой, приводящей к потере данных, была неспособность прочитать тег NOTE на всех возможных уровнях, на которых он может появиться». В 2005 году отчетная карта генеалогического программного обеспечения была оценена (Биллом Мамфордом, который участвовал в первоначальном проекте тестовой книги GEDCOM) и включала тестирование стандарта GEDCOM 5.5 с использованием программы Gedcheck.

Пример

Следующее это образец файла GEDCOM.

sample.ged
0 HEAD 1 SOUR PAF 2 NAME Personal Ancestral File 2 VERS 5.0 1 DATE 30 NOV 2000 1 GEDC 2 VERS 5.5 2 FORM LINEAGE-LINKED 1 CHAR ANSEL 1 SUBM @ U1 @ 0 @ I1 @ INDI 1 ИМЯ John / Smith / 1 SEX M 1 FAMS @ F1 @ 0 @ I2 @ INDI 1 NAME Elizabeth / Stansfield / 1 SEX F 1 FAMS @ F1 @ 0 @ I3 @ INDI 1 NAME James / Smith / 1 SEX M 1 FAMC @ F1 @ 0 @ F1 @ FAM 1 HUSB @ I1 @ 1 WIFE @ I2 @ 1 MARR 1 CHIL @ I3 @ 0 @ U1 @ SUBM 1 ИМЯ Отправитель 0 TRLR

Заголовок (HEAD) включает исходную программу и версию (Personal Ancestral File, 5.0), версию GEDCOM (5.5), кодировку символов (ANSEL) и ссылку на информацию об отправителе файла.

Отдельные записи (INDI) определяют Джона Смита (ID I1), Элизабет Стэнсфилд (ID I2) и Джеймса Смита (ID I3).

Семейная запись (FAM) связывает мужа (HUSB), жену (WIFE) и ребенка (CHIL) по их идентификационным номерам.

Версии

Текущая версия спецификации - GEDCOM 5.5.1, которая была выпущена 15 ноября 2019 года. Прежний проект спецификации GEDCOM 5.5.1 был выпущен в 1999 году и вводил девять новых тегов., включая WWW, EMAIL и FACT, и добавив UTF-8 в качестве утвержденной кодировки символов . ANSEL по-прежнему определяется как допустимая кодировка символов, но она не очень распространена и больше не нужна. Текущий выпуск содержит лишь незначительные исправления к проекту. Проект не был официально одобрен, но его положения были частично приняты рядом генеалогических программ и используются FamilySearch.org. В то время как PAF 5.2 поддерживает GEDCOM 5.5, PAF 5.2 использует UTF-8 в качестве внутреннего набора символов, функцию, которая была представлена ​​в проекте GEDCOM 5.5.1, и может выводить UTF -8 GEDCOM.

23 января 2002 г. была выпущена черновая (бета) версия GEDCOM 6.0 только для изучения разработчиками, поскольку это не была полная спецификация, и разработчикам было рекомендовано не начинать внедрение в свое ПО. Например, не были включены описания значения и ожидаемого содержания тегов. GEDCOM 6.0 должен был стать первой версией, сохраняющей данные в формате XML, и должен был изменить предпочтительный набор символов с ANSEL на Unicode.

GEDCOM, связанный с линией происхождения, является преднамеренным де-факто общим знаменателем.. Несмотря на то, что версия 5.5 стандарта GEDCOM была впервые опубликована в 1996 году, многие поставщики генеалогического программного обеспечения до сих пор не поддерживают функцию многоязычного текста Unicode (вместо набора символов ANSEL), введенную в этой версии спецификации. Единообразное использование Unicode позволит использовать международные наборы символов. Примером может служить хранение восточноазиатских имен в их оригинальных китайских, японских и корейских (CJK) иероглифах, без которых они могли бы быть двусмысленными и мало пригодными для генеалогических или исторических исследований.

История выпусков

Значение
КрасныйСтарый стандарт / проект; не поддерживается
ЖелтыйСтарый стандарт; все еще поддерживается
ЗеленыйТекущий стандарт
СинийПроект будущего
Версия GEDCOMДата выпускаПримечания
1.01984-
2.0декабрь 1985 годаPAF 2.0
2.1февраль 1987 годаGEDCOM для PAF 2.1
2.3 Проект7 августа 1985 г.с PAF2.0 Соглашения по реализации GEDCOM
2.4 Проект13 декабря 1985 г.с PAF2.0 Соглашения о реализации GEDCOM
стандарт 3.09 октября 1987 г.PAF 2.0 и 2.1 реализация стандарта 3.0
4.0август 1989 г.PAF 2.1 - 2.31
4.1 Проект--
4.2 Проект25 января 1990 г.-
5.0 Проект31 декабря 1991 г.были введены структуры, связанные с линией передачи.
5.1 Проект18 сентября 1992 г.-
5.2 Проект22 января 1992 г.-
5.3 Проект4 ноября 1993 г.Стандарт Unicode ( ISO / IEC 10646 ) был введен как дополнительный набор символов.
5.4 Проект21 августа 1995 г.-
5.5 Стандарт11 декабря 1995PAF 3, 4 и 5
5.5 Стандарт 2 января 1996PAF 3, 4 и 5 / 5.5 Стандарт
GEDCOM (Future Direction) Проект1 мая 1998 г."использовались совершенно новые данные модель "
5.5.1 Проект2 октября 1999 г.Используется FamilySearch.org UTF-8 добавлен в качестве утвержденной кодировки символов.
5.5.1 Версия15 ноября 2019 г.текущий стандарт, незначительные изменения текста в 5.5.1 Проект.
5.6 Частный проект-«Джед Аллен отправил эти два файла нескольким людям только для своего рода« личных комментариев »
6.0 XML-проект28 декабря 2001 г.Был не является полной спецификацией и не рекомендуется начинать реализацию программного обеспечения.

Ограничения

Поддержка событий и источников, связанных с несколькими людьми

Файл GEDCOM может содержать информацию о таких событиях, как рождения, смерти, записи переписи населения, судовые записи, браки и т. д.; практическое правило состоит в том, что событие - это что-то, что произошло в определенное время, в определенном месте (даже если время и место неизвестны). Файлы GEDCOM могут также содержат такие атрибуты, как физическое описание, род занятий и общее количество детей; в отличие от событий, атрибуты обычно не могут быть связаны с конкретным временем или местом.

Спецификация GEDCOM требует, чтобы каждое событие или атрибут было точно связано с один человек или семья. Это приводит к избыточности таких событий, как записи переписи, в которых Запись sus часто содержит информацию о нескольких лицах. В файле GEDCOM для записей переписи необходимо добавить отдельное событие «CENS» переписи для каждого отдельного упоминания. Некоторые генеалогические программы, такие как Gramps и The Master Genealogist, имеют сложные структуры баз данных для источников, которые используются, среди прочего, для представления событий, связанных с участием нескольких людей. Когда базы данных экспортируются из одной из этих программ в GEDCOM, эти структуры базы данных не могут быть представлены в GEDCOM из-за этого ограничения, в результате чего информация о событии или источнике, включая всю соответствующую справочную информацию о цитировании, должна дублироваться в каждом месте, где она используемый. Это дублирование затрудняет для пользователя сохранение информации, относящейся к источникам.

В спецификации GEDCOM события, связанные с семьей, такие как информация о браке, сохраняются в GEDCOM только один раз, как часть семейной записи (FAM), а затем оба супруга связываются с этой единственной семьей. запись.

Неоднозначность в спецификации

Спецификация GEDCOM была специально сделана гибкой для поддержки многих способов кодирования данных, особенно в области источников. Такая гибкость привела к большой неоднозначности и привела к тому побочному эффекту, что некоторые программы генеалогии, импортирующие GEDCOM, не импортируют все данные из файла.

Поддержка различных определений семейств и отношений

GEDCOM явно не поддерживает представление данных о многих типах близких межличностных отношений, таких как однополые браки, домашние партнерства, сожительство, полиамурность или полигамия. Такие отношения могут быть представлены только с помощью общего тега ASSO, используемого для любого типа отношений.

Упорядочивание событий, не имеющих дат

Спецификация GEDCOM не предлагает явной поддержки сохранения известного порядка событий. В частности, могут быть потеряны порядок отношений (FAMS) для человека и порядок детей в отношениях (FAM). Во многих случаях последовательность событий может быть получена из связанных дат. Но даты не всегда известны, особенно при работе с данными столетней давности. Например, в случае, если у человека было два отношения, оба с неизвестными датами, но из описаний известно, что второе действительно является вторым. Порядок, в котором эти FAMS записываются в записи INDI GEDCOM, будет зависеть от программы экспорта. Например, в Aldfaer последовательность зависит от порядка данных пользователем (алфавитный, хронологический, справочный и т. Д.). Предлагаемый стандарт XML GEDCOM также не решает эту проблему.

Менее известные функции

GEDCOM имеет множество функций, которые обычно не используются и, следовательно, неизвестны некоторым людям. Некоторые программные пакеты не поддерживают все функции, которые допускает стандарт GEDCOM.

Мультимедиа

Стандарт GEDCOM поддерживает включение мультимедийных объектов (например, фотографий людей). Такие мультимедийные объекты могут быть включены либо в сам файл GEDCOM (так называемая «встроенная форма»), либо во внешний файл, где имя внешнего файла указано в файле GEDCOM (так называемая «связанная форма»). Встраивание мультимедиа непосредственно в файл GEDCOM упрощает передачу данных, поскольку вся информация (включая мультимедийные данные) находится в одном файле, но полученный файл может быть огромным. Связывание мультимедиа позволяет контролировать размер файла GEDCOM, но затем при передаче файла мультимедийные объекты должны либо передаваться отдельно, либо архивироваться вместе с GEDCOM в один файл большего размера. Поддержка прямого встраивания мультимедиа была исключена в проекте стандарта 5.5.1.

Конфликтующая информация

Стандарт GEDCOM допускает указание нескольких мнений или противоречивых данных, просто указав несколько записей того же типа. Например, если дата рождения человека была записана как 10 января 1800 года в свидетельстве о рождении, но 11 января 1800 года в свидетельстве о смерти, будут включены две записи BIRT для этого человека, первая с датой 10 января 1800 года и указанием даты рождения. свидетельство в качестве источника, а второе с датой 11 января 1800 года и свидетельством о смерти в качестве источника. Предпочтительная запись обычно указывается первой.

Этот пример, закодированный в GEDCOM, может выглядеть так:

0 @ I1 @ INDI 1 NAME John / Doe / 1 BIRT 2 DATE 10 JAN 1800 2 SOUR @ S1 @ 3 DATA 4 TEXT Transcription из свидетельства о рождении 3 ПРИМЕЧАНИЕ. Эта запись о рождении является предпочтительной, потому что она происходит из свидетельства о рождении. 3 ПРИБОР 2 1 РОЖДЕНИЕ 2 ДАТА 11 ЯНВАРЯ 1800 г. 2 ИСТОЧНИК @ S2 @ 3 ДАННЫЕ 4 ТЕКСТ Транскрипция свидетельства о смерти должна быть здесь 3 ПРИЧАЛЬ 2

Конфликт данных также может быть результатом ошибок пользователя. Стандарт никоим образом не указывает, что содержимое должно быть согласованным. Дата рождения, такая как «10 апреля 1819 года», могла быть ошибочно записана как «10 апреля 1918 года» спустя много времени после смерти человека. Единственный способ выявить такие несоответствия - это тщательная проверка данных содержания.

Интернационализация

Стандарт GEDCOM поддерживает интернационализацию несколькими способами. Во-первых, более новые версии стандарта позволяют хранить данные в Unicode (или, в последнее время, UTF-8), поэтому текст на любом языке может быть сохранен. Во-вторых, так же, как вы можете иметь несколько событий для человека, GEDCOM позволяет вам иметь несколько имен для человека, поэтому имена могут храниться на нескольких языках (хотя не существует стандартизированного способа указать, какой экземпляр на каком языке). Наконец, в последней черновой версии (5.5.1, еще не получившей широкого распространения) поле NAME также поддерживает фонетический вариант (FONE) и латинизированный вариант (ROMN) имени.

GEDCOM X

В феврале 2012 года на конференции RootsTech 2012 FamilySearch обрисовал в общих чертах новый крупный проект по генеалогическим стандартам под названием GEDCOM X и пригласил к сотрудничеству. Он будет включать программное обеспечение, разработанное в рамках Apache лицензии с открытым исходным кодом. Он включает форматы данных, которые упрощают построение генеалогических деревьев на основе источников и записей (как физических артефактов, так и цифровых артефактов), поддержку обмена и связывания данных в Интернете, а также API.

В августе 2012 г. FamilySearch Сотрудник и руководитель проекта GEDCOM X Райан Хитон отказался от утверждения, что GEDCOM X является новым отраслевым стандартом, и позиционировал GEDCOM X как еще один проект FamilySearch с открытым исходным кодом.

Альтернативы GEDCOM

Commsoft, авторы серии программного обеспечения для генеалогии Roots и Ultimate Family Tree, определили версию под названием Event-Oriented GEDCOM (также известную как Event GEDCOM и первоначально названную InterGED), которая включала события как предметы первого класса (нулевого уровня). Хотя она основана на событиях, это все же модель, построенная на предполагаемой реальности, а не на доказательствах. Мероприятие GEDCOM было более гибким, поскольку позволяло разделить предполагаемые события и участников. Однако Event GEDCOM не получил широкого распространения среди других разработчиков из-за его семантических различий. Поскольку Roots и Ultimate Family Tree больше не доступны, очень немногие люди сегодня используют Event GEDCOM.

Gramps XML - это основанный на XML открытый формат, созданный проект с открытым исходным кодом генеалогия Gramps и также используется PhpGedView.

Организация по стандартам информации по семейной истории была создана в 2012 году с целью разработки международных стандартов в области семейно-исторической и генеалогической информации.. Одним из их стандартов является продолжение GEDCOM, называемое расширенным унаследованным форматом (ELF), которое начнется с совместимости с GEDCOM 5.5 (.1), но будет включать механизм расширяемости. Это разработано, чтобы помочь программному обеспечению с финансовыми обязательствами перед GEDCOM и предотвратить его отставание по мере развития новых стандартов.

См. Также

Ссылки

Внешние ссылки

Общие
Последняя правка сделана 2021-05-21 08:47:47
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте