C9orf50 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Идентификаторы | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Псевдонимы | C9orf50, хромосома 9 открытая рамка считывания 50 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Внешние идентификаторы | MGI: 1923631 HomoloGene: 18859 GeneCard: C9orf50 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
ортологи | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
виды | человек | мышь | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Entrez | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ensembl | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
UniProt | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
RefSeq (мРНК) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
RefSeq (белок) |
Открытая рамка считывания 50 хромосомы 9 - это белок, который у человека кодируется ген C9orf50 . У C9orf50 есть еще один известный псевдоним - FLJ35803. У человека длина кодирующей последовательности гена составляет 10051 пару оснований, транскрибирующая мРНК из 1624 оснований, которая кодирует белок из 431 аминокислоты. Содержание
Ген МестоположениеУ человека ген расположен на отрицательной цепи 9q34.11, а длина кодирующей последовательности составляет 8,552 пары оснований. На хромосоме 9 человека ген охватывает основания chr9: 132,374,504-132,383,055 Рядом с C9orf50 находится ASB6, который является геном непосредственно перед C9orf50 на отрицательной цепи, а на положительной цепи - NTMT1, который более чем вдвое превышает размер C9orf50. [1] [2] [1] ASB6 https: //www.ncbi.nlm.nih.gov / gene / 140459 [2] NTMT1 https://www.ncbi.nlm.nih.gov/gene/28989 . Белок C9orf50 Схематическая иллюстрация с использованием Dog2.0. 431 аминокислота отображается желтым, полиамфолит - красным, а DUF4685 - бирюзовым. Другие мотивы показаны и помечены в правильном положении AA. Розовые кружки представляют собой участки ацетилирования, бирюзовый - гликирование, а синий - сумоилирование. Белок C9orf50 имеет молекулярную массу 47 639 кДа и состоит из 431 аминокислот с прогнозируемой изоэлектрической точкой 10,38 Белок C9orf50 содержит консервативный домен в pfam15737-DUF4685, функция которого недостаточно изучена и консервативна у позвоночных. Белок состоит из 7 экзонов. ИзоформыC9orf50 имеет 9 различных изоформ сплайсинга (SI) и 11 различных вариантов транскрипта (TV), наиболее распространенными являются изоформа 1 и вариант транскрипта 1. Таблица изоформ C9orf50. Автор Ханна Берхоу Изоформы C9orf50 и варианты транскриптовДомены Белок можно анализировать как целое, так и разделить на 3 части, включая N-концевой домен из 193 остатков, DUF4685 из 103 остатков, и С-концевой домен из 135 остатков. Полный белок pI аналогичен среднему значению pI NTD, DUF4685 и CTD. Из этих участков NTD имеет самые высокие pI и mW, но также имеет наибольшее количество остатков - 193 из 431.
Состав Анализ состава белка C9orf50 показывает низкие количества I, M, Y и FIKMNY по сравнению с людьми и высокие количества R и KR-ED. Нет данных для кластеров зарядов, заряженных или незаряженных сегментов с высокими оценками, пробегов зарядов, паттернов, гидрофобных или трансмембранных сегментов с высокими оценками. Три различных уникальных интервала C были обнаружены в положениях 161, 190 и 342. Также обнаружено, что C9orf50 имеет 3 повторяющиеся структуры, первая последовательность PRLP_KLT начинается в положении 30, а затем повторяется в положении 78. Другой повторяющейся структурой является SLLP в позиции 30. положения 99 и 398. Последняя повторяющаяся структура в 250 и 303 состоит из KAAL. Третичная структура Третичная структура белка C9orf50 может быть обнаружена с помощью I-Tasser. Этот инструмент дает 5 визуализированных структур, две из которых имеют наивысшие оценки C -3,25 и -1,27. Регуляция уровня гена ПромоторОбласть промотора для C9orf50 была обнаружена с помощью поисковой машины Genomatix Gene2Promoter. В результате было найдено 6 промоторных областей. Только 2 из них были поддержаны стенограммами и бирками клеток. Наиболее поддерживаемая область промотора охватывает 1962 основания и консервативна в 6 из 8 ортологичных локусов с 945 клеточными тегами. Было установлено, что сайт начала транскрипции расположен в 1,503 транскрипта с 7 экзонами, поддерживаемыми 118 клеточными тегами. Сайты связывания факторов транскрипцииСуществуют сотни факторов транскрипции, которые, как предполагается, связываются промоутерский регион. В таблице факторов транскрипции промоторной области выделено 20 из них. Регулирование уровня транскрипта C9orf50 5 'UTR межмолекулярная спаренная структура с самой высокой дельта G составляет -323,4 ккал / моль. Это самая низкая энергетическая структура, предсказанная для области 5'UTR. Для 3 'UTR самый высокий dG составляет -127,5 ккал / моль, что указывает на то, что он не так стабилен, как 5' UTR. C9orf50 3 'Петлевая структура ствола UTR C9orf50 5' Структура петли ствола UTRЭкспрессия в тканяхRNA-seq данные C9orf50 обнаружили низкий уровень экспрессии, 25-50-й процентиль, в большинство человеческих тканей по сравнению со всеми человеческими белками. Однако наиболее сильно он выражен в яичках, головном мозге и желчном пузыре. Экспрессия белка C9orf50 выше, чем экспрессия РНК C9orf50. При изучении данных гибридизации in situ ортолог мыши C9orf50, символ 1700001O22Rik, использовали для сравнения экспрессии белка с бета-актином, который экспрессируется повсеместно, и анализ показывает аналогичные паттерны экспрессии в мозге мыши. Во время развития белок может быть обнаружен на стадиях развития плода. Субклеточная экспрессияБелок локализован преимущественно в ядре и реже - в митохондриях и цитозоле. Промотор C9orf50 Факторы транскрипции регионаОртологи Известных паралогов C9orf50 нет. ортологи C9orf50 были обнаружены консервативными у большинства подклассов млекопитающих, причем самый дальний из них, опоссум инфракласса marsupialia, разошелся 159 миллионов лет назад. Этот ген не обнаружен у рептилий, земноводных, птиц или любых других организмов, развившихся до млекопитающих. Список млекопитающих, у которых сохраняется C9orf50, показан ниже.
ЭволюцияC9orf50, по прогнозам, будет развиваться быстрее, чем другие распространенные белки, включая цитохром C, бета-гемоглобин и альфа-цепь фибриногена. Молекулярные часы C9orf50Консервация аминокислотВажные аминокислоты характеризуются теми аминокислотами, которые находились на 100% консенсусе линия, созданная в MView строгого ортолога множественного выравнивания последовательностей. Аминокислоты, выделенные красным, представляют собой консервативные аминокислоты в DUF4685. 14 из 22 высококонсервативных аминокислот находятся в этом домене. Лейцин занимает наиболее консервативные позиции белка C9orf50.
Мутации Посттрансляционные модификации и вторичная структура C9orf50. PTM для C9orf50 были обнаружены с помощью инструментов, размещенных на сайте Expasy Protein Modifications. Вторичная структура для C9orf50 была предсказана с использованием анализа из Gor, COILS, CFSSP, JPRED и SOPMA. Были включены спирали, обозначенные зелеными цилиндрами, бета-лист, обозначенный синими стрелками, и структуры витков, указанные розовыми стрелками. ниже в концептуальном переводе, если у них был высокий балл предсказания. Также были сохранены все структуры, которые были обнаружены более чем в одном инструменте анализа. Белок не имеет трансмембранных последовательностей. Общие варианты в C9orf50 были обнаружены с помощью NCBI SNPGeneView.
Ссылки
Последняя правка сделана 2021-05-13 09:56:30
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное). |