C9orf50

редактировать
C9orf50
Идентификаторы
Псевдонимы C9orf50, хромосома 9 открытая рамка считывания 50
Внешние идентификаторыMGI: 1923631 HomoloGene: 18859 GeneCard: C9orf50
Расположение гена (человек)
Хромосома 9 (человека)
Chr. Хромосома 9 (человек)
Хромосома 9 (человека) Местоположение генома для C9orf50 Местоположение генома для C9orf50
Полоса 9q34.11Начало129,612,225 bp
Конец129,620,776 bp
ортологи
видычеловекмышь
Entrez

375759

73598

Ensembl

ENSG00000179058

ENSMUSG00000044320

UniProt

Q5SZB4

A2APZ1

RefSeq (мРНК)

NM_199350

NM_198000

RefSeq (белок)

<3211722>NP_95538 Местоположение (UCSC)

Chr 9: 129,61 - 129,62 Мб Chr 2: 30,79 - 30,8 Мб
P ubMed search
Wikidata
View / Edit Human View / Edit Mouse

Открытая рамка считывания 50 хромосомы 9 - это белок, который у человека кодируется ген C9orf50 . У C9orf50 есть еще один известный псевдоним - FLJ35803. У человека длина кодирующей последовательности гена составляет 10051 пару оснований, транскрибирующая мРНК из 1624 оснований, которая кодирует белок из 431 аминокислоты.

Содержание
  • 1 Ген
    • 1.1 Расположение
  • 2 Белок
    • 2.1 Изоформы
  • 3 Домена
  • 4 Состав
  • 5 Третичная структура
  • 6 Регуляция уровня гена
    • 6.1 Промотор
    • 6.2 Сайты связывания факторов транскрипции
  • 7 Регуляция уровня транскрипта
    • 7.1 Экспрессия в тканях
    • 7.2 Субклеточная экспрессия
  • 8 Ортологи
    • 8.1 Эволюция
    • 8.2 Консервация аминокислот
  • 9 Мутации
  • 10 Ссылки
Ген

Местоположение

У человека ген расположен на отрицательной цепи 9q34.11, а длина кодирующей последовательности составляет 8,552 пары оснований. На хромосоме 9 человека ген охватывает основания chr9: 132,374,504-132,383,055 Рядом с C9orf50 находится ASB6, который является геном непосредственно перед C9orf50 на отрицательной цепи, а на положительной цепи - NTMT1, который более чем вдвое превышает размер C9orf50. [1] [2]


[1] ASB6 https: //www.ncbi.nlm.nih.gov / gene / 140459

[2] NTMT1 https://www.ncbi.nlm.nih.gov/gene/28989

.

Белок
C9orf50 Схематическая иллюстрация с использованием Dog2.0. 431 аминокислота отображается желтым, полиамфолит - красным, а DUF4685 - бирюзовым. Другие мотивы показаны и помечены в правильном положении AA. Розовые кружки представляют собой участки ацетилирования, бирюзовый - гликирование, а синий - сумоилирование.

Белок C9orf50 имеет молекулярную массу 47 639 кДа и состоит из 431 аминокислот с прогнозируемой изоэлектрической точкой 10,38 Белок C9orf50 содержит консервативный домен в pfam15737-DUF4685, функция которого недостаточно изучена и консервативна у позвоночных. Белок состоит из 7 экзонов.

Изоформы

C9orf50 имеет 9 различных изоформ сплайсинга (SI) и 11 различных вариантов транскрипта (TV), наиболее распространенными являются изоформа 1 и вариант транскрипта 1.

Таблица изоформ C9orf50. Автор Ханна Берхоу Изоформы C9orf50 и варианты транскриптов
Домены

Белок можно анализировать как целое, так и разделить на 3 части, включая N-концевой домен из 193 остатков, DUF4685 из 103 остатков, и С-концевой домен из 135 остатков. Полный белок pI аналогичен среднему значению pI NTD, DUF4685 и CTD. Из этих участков NTD имеет самые высокие pI и mW, но также имеет наибольшее количество остатков - 193 из 431.

C9orf50pImW kDОстатки
цельный белок человека10,3847,6431
NTD11,1421,1193
DUF468510,811,8103
CTD9,4714,7135
Состав

Анализ состава белка C9orf50 показывает низкие количества I, M, Y и FIKMNY по сравнению с людьми и высокие количества R и KR-ED. Нет данных для кластеров зарядов, заряженных или незаряженных сегментов с высокими оценками, пробегов зарядов, паттернов, гидрофобных или трансмембранных сегментов с высокими оценками. Три различных уникальных интервала C были обнаружены в положениях 161, 190 и 342. Также обнаружено, что C9orf50 имеет 3 повторяющиеся структуры, первая последовательность PRLP_KLT начинается в положении 30, а затем повторяется в положении 78. Другой повторяющейся структурой является SLLP в позиции 30. положения 99 и 398. Последняя повторяющаяся структура в 250 и 303 состоит из KAAL.

Третичная структура

Третичная структура белка C9orf50 может быть обнаружена с помощью I-Tasser. Этот инструмент дает 5 визуализированных структур, две из которых имеют наивысшие оценки C -3,25 и -1,27.

Регуляция уровня гена

Промотор

Область промотора для C9orf50 была обнаружена с помощью поисковой машины Genomatix Gene2Promoter. В результате было найдено 6 промоторных областей. Только 2 из них были поддержаны стенограммами и бирками клеток. Наиболее поддерживаемая область промотора охватывает 1962 основания и консервативна в 6 из 8 ортологичных локусов с 945 клеточными тегами. Было установлено, что сайт начала транскрипции расположен в 1,503 транскрипта с 7 экзонами, поддерживаемыми 118 клеточными тегами.

Сайты связывания факторов транскрипции

Существуют сотни факторов транскрипции, которые, как предполагается, связываются промоутерский регион. В таблице факторов транскрипции промоторной области выделено 20 из них.

Регулирование уровня транскрипта

C9orf50 5 'UTR межмолекулярная спаренная структура с самой высокой дельта G составляет -323,4 ккал / моль. Это самая низкая энергетическая структура, предсказанная для области 5'UTR. Для 3 'UTR самый высокий dG составляет -127,5 ккал / моль, что указывает на то, что он не так стабилен, как 5' UTR.

C9orf50 3 'Петлевая структура ствола UTR C9orf50 5' Структура петли ствола UTR

Экспрессия в тканях

RNA-seq данные C9orf50 обнаружили низкий уровень экспрессии, 25-50-й процентиль, в большинство человеческих тканей по сравнению со всеми человеческими белками. Однако наиболее сильно он выражен в яичках, головном мозге и желчном пузыре. Экспрессия белка C9orf50 выше, чем экспрессия РНК C9orf50. При изучении данных гибридизации in situ ортолог мыши C9orf50, символ 1700001O22Rik, использовали для сравнения экспрессии белка с бета-актином, который экспрессируется повсеместно, и анализ показывает аналогичные паттерны экспрессии в мозге мыши. Во время развития белок может быть обнаружен на стадиях развития плода.

Субклеточная экспрессия

Белок локализован преимущественно в ядре и реже - в митохондриях и цитозоле.

Промотор C9orf50 Факторы транскрипции региона
Ортологи

Известных паралогов C9orf50 нет. ортологи C9orf50 были обнаружены консервативными у большинства подклассов млекопитающих, причем самый дальний из них, опоссум инфракласса marsupialia, разошелся 159 миллионов лет назад. Этот ген не обнаружен у рептилий, земноводных, птиц или любых других организмов, развившихся до млекопитающих. Список млекопитающих, у которых сохраняется C9orf50, показан ниже.

Ортологи C9orf50
Обычное названиеТаксономическая группаДивергенция от людей (MYA)Регистрационный номер NCBIДлина белка (AA)Идентичность последовательности для людей%
ЧеловекГоминини0NP_955382.3431100
ШимпанзеПриматы6,65XP_016817319.143197,22
ГориллаПриматы9.06XP_018889539.143593.17
Deer MouseRodentia90XP_006983488.139146.14
Prairie VoleRodentia90XP_005346778.137045,18
Американская пищухаLagomorpha90XP_004593748.157938,11
Бесконечная морская свинья с узким гребнемКитообразные96XP_024617982.147356,71
КосаткаCetacea96XP_012388229.134359.34
АльпакаArtiodactyla96XP_006205 645.139953.83
Черная летучая лисицаChiroptera96XP_015449607.143253.21
Летучая мышь египетского плодаChiroptera96XP_015989428.143153.01
КозаПарнокопытная96XP_017910228.143852,4
Северный морской котикПлотоядное животное96XP_025744313.144152.36
Медведь гризлиПлотоядный96XP_026369526.144750.63
Европейский ежSoricomorpha96XP_007527129.141951,42
Звездоносный кротХоботок96XP_012576659.138348,68
Южный белый носорогPerissodactyla96XP_014637447.148947.25
Африканский кустовой слонProboscidea105XP_023401069.152749.31
Девятиполосый броненосецСингулата105XP_023443586.147646.72
Серый короткохвостый опоссумDidelpimorphia159XP_007475193.158332,56

Эволюция

C9orf50, по прогнозам, будет развиваться быстрее, чем другие распространенные белки, включая цитохром C, бета-гемоглобин и альфа-цепь фибриногена.

Молекулярные часы C9orf50

Консервация аминокислот

Важные аминокислоты характеризуются теми аминокислотами, которые находились на 100% консенсусе линия, созданная в MView строгого ортолога множественного выравнивания последовательностей. Аминокислоты, выделенные красным, представляют собой консервативные аминокислоты в DUF4685. 14 из 22 высококонсервативных аминокислот находятся в этом домене. Лейцин занимает наиболее консервативные позиции белка C9orf50.

Консервированные аминокислотыПоложение C9orf50 AA
Пролин33,325
Лейцин147, 155, 158, 280, 285, 321, 328
Фенилаланин231, 275
Аргинин272, 286
Валин273, 313
Аланин267
Аспарагиновая кислота277
Глутаминовая кислота278, 289
Треонин279
Тирозин287
Триптофан288
Мутации
Посттрансляционные модификации и вторичная структура C9orf50. PTM для C9orf50 были обнаружены с помощью инструментов, размещенных на сайте Expasy Protein Modifications. Вторичная структура для C9orf50 была предсказана с использованием анализа из Gor, COILS, CFSSP, JPRED и SOPMA. Были включены спирали, обозначенные зелеными цилиндрами, бета-лист, обозначенный синими стрелками, и структуры витков, указанные розовыми стрелками. ниже в концептуальном переводе, если у них был высокий балл предсказания. Также были сохранены все структуры, которые были обнаружены более чем в одном инструменте анализа. Белок не имеет трансмембранных последовательностей.

Общие варианты в C9orf50 были обнаружены с помощью NCBI SNPGeneView.

dbSNP rs # Cluster IDFunctiondbSNP AlleleAmino Кислотное положение
rs146521610СинонимыV → G317
rs566893379СинонимыS → T310
rs111868243СинонимыS → A258
rs918165MissenseK → A248
rs141573674MissenseS → A201
rs759058008FrameshiftУдалено L189
rs111606531СинонимусA → T86
rs146618124MissenseS → C52
rs372378735СинонимыG → A45
rs751493011ЕрундаInsert T11
Ссылки
Последняя правка сделана 2021-05-13 09:56:30
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru