Биодокументация - это область исследований в области наук о жизни, предназначенная для перевода и интеграции биомедицинских знаний из научных статей в совместимые базы данных. Биологическое документирование биомедицинских знаний стало возможным благодаря совместной работе биокураторов, разработчиков программного обеспечения и специалистов по биоинформатике.
Biocurator является профессиональным ученым, который является куратором, собирает, аннотирования, и проверяет информацию, распространяемую биологических и модельных баз данных организма. Роль биокуратора включает в себя контроль качества первичных данных биологических исследований, предназначенных для публикации, извлечения и систематизации данных из оригинальной научной литературы, а также описание данных с помощью стандартных протоколов аннотаций и словарей, которые обеспечивают функциональные запросы и функциональную совместимость биологических баз данных. Биокураторы общаются с исследователями, чтобы гарантировать точность кураторской информации и способствовать обмену данными с исследовательскими лабораториями.
В геноме аннотаций, например, biocurators обычно использует, и принять участие в создании и развитии совместно используемого биомедицинские онтологии : структурированные, контролируемые словари, которые охватывают многие биологические и медицинские области знаний, такие как Open биомедицинских онтологии найдены в OBO Foundry. Эти области включают геномику и протеомику, анатомию, развитие животных и растений, биохимию, метаболические пути, таксономическую классификацию и мутантные фенотипы.
Биокураторы обеспечивают постоянное использование руководящих принципов по номенклатуре генов и участвуют в комитетах по генетической номенклатуре различных модельных организмов, часто в сотрудничестве с Комитетом по номенклатуре генов HUGO ( HGNC ). Они также обеспечивают соблюдение других рекомендаций по номенклатуре, таких как те, которые предоставлены Номенклатурным комитетом Международного союза биохимии и молекулярной биологии (IUBMB), одним из примеров которых является номер ЕС Комиссии по ферментам.
Международное общество Biocuration (ISB) было основано в 2008 году; некоммерческая организация «продвигает область биодокументации и предоставляет форум для обмена информацией посредством встреч и семинаров». Международные конференции по биокументации проводились в Пасифик-Гроув, Калифорния (2005 г.), Сан-Хосе, Калифорния (2007 г.), Берлине, Германия (2009 г.), Токио, Япония (2010 г.), Вашингтоне, округ Колумбия (2012 г.), Кембридже, Великобритания (2013 г.), Торонто, Канада (2014), Пекин, Китай (2015), Женева, Швейцария (2016) и Стэнфорд, Калифорния (2017). 11-я Международная конференция по биокументации прошла 8–11 апреля 2018 г. в Шанхае, Китай. ИМК предлагает Biocuration Карьера премии в biocurators в общины: Biocurator Career Award (вручается ежегодно) и премии ISB за исключительный вклад в Biocuration ( с учетом двухгодичной).
Технологии обработки естественного языка и интеллектуального анализа текста могут помочь биокураторам извлекать информацию для ручного редактирования.
Традиционно биодокументация проводится специализированными экспертами, которые объединяют основные группы баз данных, таких как UniProt.
Было высказано предположение, что курирование со стороны сообщества (в дополнение к экспертному) может помочь справиться с потоком биологических знаний.
Один из таких примеров - создание биовики. AuthorReward, например, является расширением MediaWiki, которое позволяет количественно оценить вклад исследователей в биовики. RiceWiki был примером базы данных на основе вики для общественного курирования генов риса, снабженной AuthorReward.
Известные примеры курирования сообщества включают:
Есть некоторое совпадение между работой биокураторов и Википедией, при этом границы между научными базами данных и Википедией становятся все более размытыми. Например, такие базы данных, как Rfam и Protein Data Bank, активно используют Википедию и ее редакторы для сбора информации. Тем не менее, большинство баз данных предлагают хорошо структурированные данные, которые доступны для поиска в сложных комбинациях, что обычно невозможно в Википедии, хотя Викиданные нацелены на решение этой проблемы до некоторой степени.