Прогноз субклеточной локализации белка (или просто прогноз локализации белка) включает в себя предсказание того, где белок находится в ячейке, ее субклеточная локализация.
Как правило, инструменты прогнозирования принимают в качестве входных данных информацию о белке, такую как последовательность белка из аминокислоты, и в качестве выходных данных производят прогнозируемое местоположение внутри клетки, например, ядро , эндоплазматический ретикулум, аппарат Гольджи, внеклеточный пробел или другие органеллы. Цель состоит в том, чтобы создать инструменты, которые могут точно предсказать результат нацеливания на белок в клетках.
Прогнозирование субклеточной локализации белка является важным компонентом биоинформатики прогнозирования функции белка и аннотации генома, и это может помочь в идентификации мишеней наркотиков.
Экспериментальное определение субклеточная локализация белка может быть трудоемкой и требующей много времени задачей. Иммуномарка или маркировка (например, зеленым флуоресцентным белком ) для просмотра локализации с помощью флуоресцентного микроскопа часто используются. Альтернативой высокой пропускной способности является использование прогнозирования.
Благодаря развитию новых подходов в информатике в сочетании с увеличенным набором данных о белках с известной локализацией, вычислительные инструменты теперь могут обеспечивать быстрые и точные прогнозы локализации для многих организмов. Это привело к тому, что прогнозирование субклеточной локализации стало одной из проблем, которым успешно помогают биоинформатика и машинное обучение.
. Многие методы прогнозирования теперь превышают точность некоторых высокопроизводительных лабораторных методов идентификации. субклеточной локализации белка. В частности, были разработаны некоторые предикторы, которые можно использовать для работы с белками, которые могут одновременно существовать или перемещаться между двумя или более различными субклеточными локациями. Для подтверждения предсказанных локализаций обычно требуется экспериментальная проверка.
В 1999 г. PSORT была первой опубликованной программой для предсказания субклеточной локализации. Последующие инструменты и веб-сайты были выпущены с использованием таких методов, как искусственные нейронные сети, поддержка векторной машины и белковые мотивы. Предикторы могут быть специализированы для белков в разных организмах. Некоторые из них специализируются на эукариотических белках, некоторые - на человеческих, а некоторые - на растительных. Были рассмотрены методы прогнозирования предикторов локализации бактерий и их точность.
Развитие прогнозирования субклеточного расположения белков было обобщено в двух всеобъемлющих обзорных статьях. Последние инструменты и отчет об опыте можно найти в недавней статье Meinken and Min (2012).
Знание субклеточной локализации белка может значительно улучшить идентификацию цели во время процесс открытия лекарств. Например, секретируемые белки и белки плазматической мембраны легко доступны для молекул лекарственного средства благодаря их локализации во внеклеточном пространстве или на поверхности клетки.
Поверхность бактериальных клеток и секретируемые белки также представляют интерес в связи с их потенциалом в качестве кандидатов в вакцины или диагностических целей. Аберрантная субклеточная локализация белков наблюдалась в клетках нескольких заболеваний, таких как рак и болезнь Альцгеймера. Секретные белки некоторых архей, которые могут выжить в необычных условиях, имеют важное промышленное применение.
Используя прогнозирование, можно оценить большое количество белков, чтобы найти кандидатов, которые доставляются в желаемое место.
Результаты предсказания субклеточной локализации могут храниться в базах данных. Примеры включают многовидовую базу данных Compartments, FunSecKB2, базу данных грибов; PlantSecKB, база данных растений; MetazSecKB, база данных о животных и людях; и ProtSecKB, протистская база данных.