Вычислительная геномика

редактировать

Вычислительная геномика (часто называемая вычислительной генетикой) относится к использование вычислительного и статистического анализа для расшифровки биологии из последовательностей генома и связанных данных, включая последовательность ДНК и РНК, а также других «постгеномных» данных (т.е. экспериментальные данные, полученные с помощью технологий, требующих геномной последовательности, таких как геномные ДНК-микрочипы ). В сочетании с вычислительными и статистическими подходами к пониманию функции генов и статистическим ассоциативным анализом эта область также часто упоминается как вычислительная и статистическая генетика / геномика. Таким образом, вычислительную геномику можно рассматривать как подмножество биоинформатики и вычислительной биологии, но с акцентом на использование целых геномов (а не отдельных генов) для понимания принципов того, как ДНК вида контролирует его биологию на молекулярном уровне и за его пределами. При нынешнем изобилии массивных наборов биологических данных компьютерные исследования стали одним из наиболее важных средств к биологическим открытиям.

Содержание

  • 1 История
  • 2 Вклад исследований компьютерной геномики в биологию
  • 3 См. Также
  • 4 Ссылки
  • 5 Внешние ссылки

История

Корни вычислительной геномики совпадают с корнями биоинформатики. В течение 1960-х годов Маргарет Дейхофф и другие сотрудники Национального фонда биомедицинских исследований собрали базы данных гомологичных белковых последовательностей для эволюционного исследования. В их исследованиях было разработано филогенетическое дерево, которое определило эволюционные изменения, которые потребовались для превращения определенного белка в другой белок, на основе лежащих в основе аминокислотных последовательностей. Это привело их к созданию оценочной матрицы, которая оценивала вероятность связи одного белка с другим.

Начиная с 1980-х годов начали регистрироваться базы данных последовательностей геномов, но это создало новые проблемы в виде поиска и сравнения баз данных с информацией о генах. В отличие от алгоритмов текстового поиска, которые используются на таких веб-сайтах, как Google или Wikipedia, для поиска участков генетического сходства требуется найти строки, которые не просто идентичны, а похожи. Это привело к разработке алгоритма Нидлмана-Вунша, который представляет собой алгоритм динамического программирования для сравнения наборов аминокислотных последовательностей друг с другом с использованием скоринговых матриц, полученных из более ранних исследований Dayhoff. Позже был разработан алгоритм BLAST для выполнения быстрого и оптимизированного поиска в базах данных последовательностей генов. BLAST и его производные, вероятно, являются наиболее широко используемыми алгоритмами для этой цели.

Появление фразы «вычислительная геномика» совпадает с появлением полных секвенированных геномов в середине-конце 1990-х годов. Первое заседание Ежегодной конференции по вычислительной геномике было организовано учеными из Института геномных исследований (TIGR) в 1998 году, что стало форумом для этой специальности и эффективно отличило эту область науки от более общих областей. Геномика или Вычислительная биология. Согласно выдержкам из MEDLINE этот термин впервые был использован в научной литературе всего за год до этого в статье Nucleic Acids Research. Заключительная конференция по вычислительной геномике была проведена в 2006 году, и на ней выступил лауреат Нобелевской премии Барри Маршалл, один из первооткрывателей связи между Helicobacter pylori и язвой желудка. По состоянию на 2014 год ведущие конференции в этой области включают Интеллектуальные системы для молекулярной биологии (ISMB) и Исследования в области вычислительной молекулярной биологии (RECOMB).

Развитие компьютерной математики (с использованием таких продуктов, как Mathematica или Matlab ) помогло инженерам, математикам и компьютерным специалистам начать работу в этой области, и растет общедоступная коллекция тематических исследований и демонстраций, от сравнений всего генома до анализа экспрессии генов. Это увеличило внедрение различных идей, включая концепции систем и управления, теории информации, анализа строк и интеллектуального анализа данных. Ожидается, что вычислительные подходы станут и останутся стандартной темой для исследований и преподавания, в то время как студенты, свободно владеющие обеими темами, начнут формироваться в нескольких курсах, созданных за последние несколько лет.

Вклад исследований компьютерной геномики в биологию

Вклад исследований компьютерной геномики в биологию включает:

См. также

Ссылки

Внешние ссылки

Последняя правка сделана 2021-05-15 08:29:57
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте