Информатика биоизображений

редактировать

Информатика биоизображений - это подполе биоинформатики и вычислительной биологии. Он фокусируется на использовании вычислительных методов для анализа биоизображений, особенно изображений клеток и молекул, в крупном масштабе и с высокой пропускной способностью. Цель состоит в том, чтобы получить полезные знания из сложных и разнородных изображений и связанных метаданных.

Автоматические микроскопы могут собирать большое количество изображений с минимальным вмешательством. Это привело к взрывному росту объемов данных, который абсолютно требует автоматической обработки. Вдобавок, что удивительно, для некоторых из этих задач есть доказательства того, что автоматизированные системы могут работать лучше, чем люди. Кроме того, автоматизированные системы беспристрастны, в отличие от человеческого анализа, на оценку которого (даже неосознанно) может повлиять желаемый результат.

Все большее внимание уделяется разработке новых обработки изображений, компьютерного зрения, интеллектуального анализа данных, баз данных и методов визуализации для извлечения, сравнения, ищите и управляйте биологическими знаниями в этих проблемах с большим объемом данных.

Содержание
  • 1 Модальности данных
    • 1.1 Флуоресцентная микроскопия
    • 1.2 Гистология
  • 2 Важные проблемы
    • 2.1 Анализ субклеточного местоположения
    • 2.2 Скрининг высокого содержания
    • 2.3 Сегментация
    • 2.4 Отслеживание
    • 2.5 Регистрация
  • 3 Важные места
  • 4 Программное обеспечение
  • 5 См. Также
  • 6 Внешние ссылки
  • 7 Ссылки
Модальности данных

Используются несколько систем и платформ сбора данных, которые требуют различных методов для оптимальной обработки.

Флуоресцентная микроскопия

Флуоресцентное изображение клетки в телофазе. Были отображены множественные красители, которые показаны разными цветами.

Флуоресцентная микроскопия позволяет непосредственно визуализировать молекулы на субклеточном уровне как в живых, так и в фиксированных клетках. Представляющие интерес молекулы помечены либо зеленым флуоресцентным белком (GFP), либо другим флуоресцентным белком, либо флуоресцентно меченным антителом. Регулярно используются несколько типов микроскопов: широкопольный, конфокальный или двухфотонный. Большинство систем микроскопии также поддерживают сбор временных рядов (фильмов).

Как правило, фильтры используются так, что каждый краситель отображается отдельно (например, синий фильтр используется для изображения Hoechst, а затем быстро переключается на зеленый фильтр для изображения GFP). Для потребления изображения часто отображаются в ложном цвете, показывая каждый канал другим цветом, но это может даже не быть связано с исходными используемыми длинами волн. В некоторых случаях исходное изображение могло быть получено даже в невидимых длинах волн (инфракрасное излучение является обычным явлением).

Выбор на этапе получения изображения влияет на анализ и часто требует специальной обработки. Конфокальные стеки потребуют 3D-обработки, а псевдостеки с широким полем часто выигрывают от цифровой деконволюции для удаления не в фокусе света.

Появление автоматических микроскопов, которые могут автоматически получать множество изображений, является одной из причин, почему анализ нельзя проводить на глаз (в противном случае аннотации быстро стали бы узким местом исследования). Использование автоматических микроскопов означает, что некоторые изображения могут быть не в фокусе (системы автоматического определения фокуса иногда могут быть неправильными), содержать небольшое количество клеток или быть заполненными мусором. Следовательно, полученные изображения будет труднее анализировать, чем изображения, полученные оператором, поскольку он выбрал бы другие места для изображения и правильной фокусировки. С другой стороны, оператор может внести неосознанную ошибку в свой выбор, выбрав только те клетки, фенотип которых наиболее похож на тот, который ожидался до эксперимента.

Гистология

Гистологическое изображение альвеолярного микролитиаза

Гистология - это приложение для микроскопии, при котором срезы тканей окрашивают и наблюдают под микроскопом (обычно с помощью светового микроскопа, но также используется электронная микроскопия).

При использовании светового микроскопа, в отличие от флуоресцентной визуализации, изображения обычно получают с помощью стандартных цветных камер. Это частично отражает историю области, где люди часто интерпретировали изображения, но также и тот факт, что образец можно освещать белым светом и собирать весь свет, а не возбуждать флуорофоры. Когда используется более одного красителя, необходимым этапом предварительной обработки является размешивание каналов и получение оценки интенсивностей, характерных для чистого красителя.

Было показано, что субклеточное расположение окрашенных белков можно определить по гистологическим изображениям.

Если целью является медицинская диагностика, то приложения для гистологии часто попадают в сферу цифровой патологии или автоматизированного анализа изображений тканей, которые являются родственными областями биоизображения. информатика. Часто применимы одни и те же вычислительные методы, но цели скорее медицинские, чем исследовательские.

Важные проблемы

Анализ субклеточного местоположения

Пример субклеточного местоположения. Примеры различных шаблонов отображаются в двухмерном пространстве путем вычисления различных признаков изображения. Изображение неизвестных белков аналогичным образом отображается в этом пространстве, и поиск ближайшего соседа или другой классификатор может использоваться для определения местоположения этого неклассифицированного белка.

Анализ субклеточного местоположения был одной из первоначальных проблем в этом поле. В контролируемом режиме проблема состоит в том, чтобы изучить классификатор, который может распознавать изображения основных клеток органелл на основе изображений.

Используемые методы основаны на машинном обучении, построении дискриминантного классификатора на основе числовых признаков, вычисленных на основе изображения. Возможности - это либо общие характеристики из компьютерного зрения, такие как особенности текстуры Харалика, либо особенности, специально разработанные для захвата биологических факторов (например, совместная локализация с ядерным маркером является типичным примером).

Для основной проблемы идентификации органелл можно получить очень высокие значения точности, в том числе лучше чем? полученные результаты. Эти методы полезны в фундаментальных исследованиях клеточной биологии, но также были применены для открытия белков, местоположение которых изменяется в раковых клетках.

Однако классификация органелл является ограниченной формой проблемы, поскольку многие белки локализуются. в несколько мест одновременно (смешанные образцы), и можно различить многие образцы, даже если они не являются разными мембраносвязанными компонентами. В этой области есть несколько нерешенных проблем, и исследования продолжаются.

Скрининг высокого содержания

Автоматическое конфокальное считывание изображений

Высокопроизводительные экраны с использованием технологии автоматизированной визуализации (иногда называемой скрининг высокого содержания ) стали стандартным методом для обоих препаратов. открытие и фундаментальные биологические исследования. Используя многолуночные планшеты, робототехнику и автоматизированную микроскопию, тот же анализ можно очень быстро применить к большой библиотеке возможных реагентов (обычно либо небольших молекул, либо РНКи ), получая тысячи изображений за короткое время. Из-за большого объема генерируемых данных автоматический анализ изображений является необходимостью.

Когда доступны положительные и отрицательные контроли, проблема может рассматриваться как проблема классификации и те же методы вычисления и классификации признаков, которые используются используется для анализа субклеточного местоположения.

Сегментация

Пример изображения для проблемы сегментации. Показаны ядра мышиного NIH 3T3, окрашенные Hoechst и сегментация красным цветом.

Сегментация клеток является важной подзадачей во многих областях, указанных ниже (и иногда полезно само по себе, если целью является только подсчет клеток в анализе жизнеспособности ). Цель состоит в том, чтобы определить границы ячеек на многоклеточном изображении. Это позволяет обрабатывать каждую ячейку индивидуально для измерения параметров. В трехмерных данных сегментация должна выполняться в трехмерном пространстве.

Поскольку отображение ядерного маркера является обычным для многих изображений, широко используемый протокол заключается в сегментировании ядер. Это может быть полезно само по себе, если необходимы ядерные измерения, или может послужить для начала водораздела, который расширяет сегментацию на все изображение.

Для изображений ячеек описаны все основные методы сегментации, от простого порогового определения до методов установки уровня. Поскольку существует несколько модальностей изображения и разные типы ячеек, каждый из которых предполагает разные компромиссы, единого принятого решения для этой проблемы не существует.

Сегментация изображения клетки как важная процедура часто используется для изучения экспрессии генов, взаимосвязи колокализации и т. Д. Отдельных клеток. В таких случаях одноклеточного анализа часто необходимо однозначно определить идентичность клеток при сегментировании клеток. Такая задача распознавания часто является нетривиальной в вычислительном отношении. Для модельных организмов, таких как C. elegans, которые имеют четко определенные клеточные клоны, можно явно распознать идентичность клеток с помощью анализа изображений, комбинируя методы сегментации изображения и распознавания образов. Одновременная сегментация и распознавание клеток также было предложено как более точное решение этой проблемы, когда доступен «атлас» или другая априорная информация о клетках. Поскольку экспрессия генов при разрешении отдельных клеток может быть получена с использованием этих типов подходов к визуализации, можно комбинировать эти методы с другими методами количественной оценки экспрессии генов отдельных клеток, такими как RNAseq.

Отслеживание

Отслеживание - еще одна традиционная проблема обработки изображений, которая появляется в информатике биоизображений. Проблема в том, чтобы связать объекты, которые появляются в последующих кадрах фильма. Как и в случае с сегментацией, проблема может быть поставлена ​​как в двух-, так и в трехмерной форме.

В случае флуоресцентной визуализации отслеживание часто должно выполняться на очень низкоконтрастных изображениях. Поскольку получение высокого контраста достигается за счет большего количества света, который повреждает образец, а разрушает краситель, освещение сохраняется на минимальном уровне. Часто бывает полезно подумать о бюджете фотонов: количество фотонов, которые можно использовать для построения изображения до того, как образец будет поврежден, настолько велико, что данным больше нельзя доверять. Следовательно, если необходимо получить высококонтрастные изображения, можно использовать только несколько кадров; тогда как для длинных фильмов каждый кадр будет иметь очень низкий контраст.

Регистрация

Когда рассматриваются образцы данных изображений различной природы, например, соответствующие разным методам маркировки, разные люди, образцы в разные моменты времени и т. Д., Изображения часто необходимо регистрировать для лучшего сравнения. Один из примеров: когда собираются данные о динамике, изображения в последующих кадрах часто должны быть зарегистрированы, чтобы можно было исправить незначительные сдвиги в положении камеры. Другой пример: когда собираются многие изображения модельного животного (например, C. elegans или или мозг мыши ), часто возникает существенная потребность в регистрации этих изображений для сравнения их паттерны (например, они соответствуют одной и той же или разной популяции нейронов, имеют общую или разную экспрессию генов и т. д.).

Пакеты программного обеспечения для регистрации медицинских изображений были ранними попытками использования приложений для регистрации микроскопических изображений. Однако из-за часто гораздо большего размера файла изображения и гораздо большего количества образцов в экспериментах во многих случаях необходимо разработать новое программное обеспечение для регистрации трехмерных изображений. BrainAligner [12] - это программное обеспечение, которое использовалось для автоматизации процесса трехмерной деформируемой и нелинейной регистрации с использованием стратегии надежного сопоставления ориентиров. Он в основном использовался для создания более 50 000 стандартизированных трехмерных изображений мозга плодовых мух на ферме Janelia в HHMI, а также для других приложений, включая стрекоз и мышей.

Важные места

Консорциум ученых из университетов и научно-исследовательских институтов с 2005 года организует ежегодные встречи по информатике биоизображений. На конференции ISMB был курс по биовизуализации и визуализации данных с 2010 года. Журнал Bioinformatics также представил трек Bioimage Informatics в 2012 году. В журнале OpenAccess BMC Bioinformatics есть раздел, посвященный анализу биоизображений, визуализации и связанным приложениям. Другие журналы по компьютерной биологии и биоинформатике также регулярно публикуют работы по информатике биоизображений. В рамках программы расходов Европейского Союза NEUBIAS (сеть европейских аналитиков биоизображений) с 2017 года проводятся ежегодные конференции, а также школы и тэггатоны для аналитиков биологических изображений.

Программное обеспечение

Есть несколько пакетов, которые делают методы информатики биоизображений, доступные через графический интерфейс пользователя, например ImageJ, FIJI, CellProfiler или Icy. Платформы визуализации и анализа, такие как Vaa3D, появились в последние годы и использовались в обоих крупномасштабных проектах, особенно для нейробиологии и настольных приложений.

Пример мозга мухи, визуализированный с помощью моделей поверхности его отсеков с использованием Vaa3D

Другие исследователи разрабатывают свои собственные методы, обычно основанные на языке программирования с хорошей поддержкой компьютерного зрения, например Python, C ++ или MATLAB. Библиотека Mahotas для Python - один из популярных примеров. Тем не менее, существуют примеры разработанных исследователем методов на языках программирования с меньшей поддержкой компьютерного зрения, чем R (например, trackdem).

См. Также
Внешний ссылки
Ссылки
Последняя правка сделана 2021-05-12 06:47:08
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте