Хранение цифровых данных ДНК

редактировать

Хранение цифровых данных ДНК - это процесс кодирования и декодирования двоичных данных в / из синтезированных цепочек ДНК.

Хотя ДНК как носитель информации имеет огромный потенциал из-за высокой плотности хранения, ее практическое использование в настоящее время сильно ограничено из-за ее высокой стоимости и очень медленного времени чтения и записи.

В июне 2019 г. ученые сообщили, что все 16 ГБ текста из англоязычной версии Википедии были закодированы в синтетическую ДНК.

Содержание
  • 1 Без клеток
  • 2 In vivo
  • 3 История
  • 4 Davos Bitcoin Challenge
  • 5 ДНК вещей
  • 6 См. Также
  • 7 Ссылки
  • 8 Дополнительная литература
Без клеток

В настоящее время наиболее распространенная технология секвенирования ДНК в настоящее время используется метод, разработанный Illumina, который включает иммобилизацию одноцепочечной ДНК на твердой подложке, амплификацию последовательностей с помощью полимеразной цепной реакции (ПЦР) и мечение индексов. Индивидуальные основания ДНК с комплементарными основаниями, помеченные флуоресцентными маркерами (см. секвенирование красителей Illumina ). Затем образец флуоресценции (разный цвет для каждого из четырех оснований ДНК) можно зафиксировать на изображении и обработать для определения последовательности ДНК. Недавно разработанной альтернативой является технология нанопор, в которой молекулы ДНК проходят через поры наноразмеров под контролем храпового фермента. Прохождение молекул ДНК вызывает небольшое изменение электрического тока, которое можно измерить. Основное преимущество технологии нанопор состоит в том, что их можно читать в реальном времени. Однако точность считывания этой технологии в настоящее время недостаточна для хранения данных.

In vivo

Генетический код в живых организмах потенциально может быть использован для хранения информации. Более того, синтетическая биология может использоваться для создания клеток с «молекулярными регистраторами», позволяющими хранить и извлекать информацию, хранящуюся в генетическом материале клетки. может также использоваться для вставки искусственных последовательностей ДНК в геном клетки.

История

Идея хранения цифровых данных ДНК восходит к 1959 году, когда физик Ричард П. Фейнман в «Внизу много места: приглашение войти в новую область физики» обрисованы общие перспективы создания искусственных объектов, подобных объектам микромира (в том числе биологических) и имеющих аналогичные или даже более широкие возможности. В 1964-65 гг. Советский физик Михаил Самойлович Нейман опубликовал 3 статьи о микроминиатюризации в электронике на молекулярно-атомном уровне, в которых независимо представлены общие соображения и некоторые расчеты, касающиеся возможности записи, хранения и поиска информации о синтезированной ДНК и Молекулы РНК. После выхода в свет первой книги М.С. Статья Неймана и после получения редактором рукописи его второй статьи (8 января 1964 г., как указано в этой статье) было опубликовано интервью с кибернетиком Норбертом Винером. Н. Винер высказал идеи о миниатюризации компьютерной памяти, близкие к идеям, независимо предложенным М. С. Нейманом. Об этих идеях Винера М. С. Нейман упоминал в третьей статье.

Одно из первых применений хранения ДНК произошло в 1988 году в сотрудничестве между художником Джо Дэвисом и исследователями из Гарварда. Изображение, хранящееся в последовательности ДНК в кишечной палочке, было организовано в матрицу 5 x 7, которая после расшифровки сформировала изображение древней германской руны, представляющей жизнь и женскую Землю. В матрице единицы соответствуют темным пикселям, а нули соответствуют светлым пикселям.

В 2007 году в Университете Аризоны было создано устройство, использующее адресацию молекул для кодирования участков несовпадения в цепи ДНК. Эти несоответствия затем можно было считать, выполнив дайджест ограничений, таким образом восстановив данные.

В 2011 году Джордж Черч, Шри Косури и Юань Гао провели эксперимент, который закодировал книгу размером 659 КБ. соавтором которого является Church. Для этого исследовательская группа провела взаимно-однозначное соответствие, в котором двоичный ноль был представлен либо аденином, либо цитозином, а двоичный ноль - гуанином или тимином. После исследования в ДНК было обнаружено 22 ошибки.

В 2012 году Джордж Черч и его коллеги из Гарвардского университета опубликовали статью, в которой ДНК была закодирована с помощью цифровой информации. это включало HTML-черновик книги из 53 400 слов, написанной ведущим исследователем, одиннадцать изображений в формате JPG и одну программу на JavaScript. Было добавлено несколько копий для избыточности, и в каждом кубическом миллиметре ДНК можно хранить 5,5 петабита. Исследователи использовали простой код, в котором биты были сопоставлены один к одному с базами, что имело недостаток, заключающийся в том, что он приводил к длительным прогонам одной и той же базы, последовательность которых подвержена ошибкам. Этот результат показал, что, помимо других функций, ДНК также может быть другим типом носителя информации, таким как жесткие диски и магнитные ленты.

В 2013 году была опубликована статья исследователей из Европейского института биоинформатики (EBI) и представленный примерно в то же время, что и статья Черча и его коллег, подробно описывающая хранение, извлечение и воспроизведение более пяти миллионов бит данных. Все файлы ДНК воспроизводили информацию с точностью от 99,99% до 100%. Основными нововведениями в этом исследовании стали использование схемы кодирования с исправлением ошибок для обеспечения чрезвычайно низкой скорости потери данных, а также идея кодирования данных в серии перекрывающихся коротких олигонуклеотидов, идентифицируемых с помощью схема индексации на основе последовательности. Кроме того, последовательности отдельных цепей ДНК перекрывались таким образом, что каждая область данных повторялась четыре раза, чтобы избежать ошибок. Две из этих четырех цепей были построены в обратном направлении, также с целью устранения ошибок. Стоимость одного мегабайта оценивалась в 12 400 долларов на кодирование данных и 220 долларов на поиск. Однако было отмечено, что экспоненциальное снижение затрат на синтез ДНК и секвенирование, если оно продолжится в будущем, должно сделать технологию экономически эффективной для долгосрочного хранения данных к 2023 году.

В 2013 году программное обеспечение под названием DNACloud был разработан Маниш К. Гупта и его коллеги для кодирования компьютерных файлов в их ДНК-представление. Он реализует версию алгоритма эффективности использования памяти, предложенного Goldman et al. для кодирования (и декодирования) данных в ДНК (файлы.dnac).

Долгосрочная стабильность данных, закодированных в ДНК, была описана в феврале 2015 года в статье исследователей из ETH Zurich. Команда добавила избыточность с помощью кодирования с исправлением ошибок Рида – Соломона и инкапсуляции ДНК в сферы из кварцевого стекла с помощью химии Sol-gel.

В исследовании 2016 г., проведенном Черч и Technicolor Research and Innovation был опубликован, в котором 22 МБ сжатой последовательности фильма в формате MPEG были сохранены и восстановлены из ДНК. Было обнаружено, что восстановление последовательности не имело ошибок.

В марте 2017 г. Янив Эрлих и Колумбийский университет и Нью-Йоркский центр генома опубликовал метод, известный как Фонтан ДНК, который хранит данные с плотностью 215 петабайт на грамм ДНК. Метод приближается к емкости Шеннона для хранения ДНК, достигая 85% теоретического предела. Этот метод не был готов к широкомасштабному использованию, так как синтез 2 мегабайт данных стоит 7000 долларов, а чтение - еще 2000 долларов.

В марте 2018 года Вашингтонский университет и Microsoft опубликовала результаты, демонстрирующие хранение и извлечение примерно 200 МБ данных. В исследовании также был предложен и оценен метод произвольного доступа к элементам данных, хранящимся в ДНК. В марте 2019 года та же группа объявила, что продемонстрировала полностью автоматизированную систему для кодирования и декодирования данных в ДНК.

Исследование, опубликованное Eurecom и Imperial College в январе 2019 продемонстрировала возможность хранить структурированные данные в синтетической ДНК. Исследование показало, как кодировать структурированные или, более конкретно, реляционные данные в синтетической ДНК, а также продемонстрировало, как выполнять операции обработки данных (аналогичные SQL ) непосредственно на ДНК в виде химических процессов.

В июне 2019 года ученые сообщили, что все 16 ГБ Википедии были закодированы в синтетическую ДНК.

. Первая статья, описывающая хранение данных о последовательностях нативной ДНК посредством ферментативного разрезания, была опубликована в апреле 2020 года. В статье ученые демонстрируют новый метод записи информации в основу ДНК, который обеспечивает побитовый произвольный доступ и вычисления в памяти.

Davos Bitcoin Challenge

21 января 2015 года Ник Голдман из Европейского института биоинформатики (EBI), один из первых авторов статьи Nature 2013 года, объявил о Davos Bitcoin Challenge на World Ежегодное собрание Экономического форума в Давосе. Во время его презентации аудитории были розданы пробирки с ДНК, в которых говорилось, что каждая пробирка содержит закрытый ключ ровно одного биткойна, все закодированные в ДНК. Тот, кто первым выполнит последовательность и расшифрует ДНК, может получить биткойн и выиграть соревнование. Задача была назначена на три года и закрылась, если никто не претендовал на приз до 21 января 2018 года.

Почти три года спустя, 19 января 2018 года, EBI объявил, что бельгийский аспирант Сандер Вуйтс из Университет Антверпена и Брюссельский университет были первыми, кто выполнил задание. Рядом с инструкциями о том, как потребовать биткойн (хранится в виде простого текста и PDF-файла ), логотипом EBI, логотипом компании, напечатавшей ДНК (CustomArray), и эскизом Джеймс Джойс были извлечены из ДНК.

ДНК вещей

Концепция ДНК вещей (DoT) была представлена ​​в 2019 году группой исследователей из Израиля и Швейцария, в том числе Янив Эрлих и Роберт Грасс. DoT кодирует цифровые данные в молекулы ДНК, которые затем встраиваются в объекты. Это дает возможность создавать объекты, несущие собственный план, похожие на биологические организмы. В отличие от Интернета вещей, который представляет собой систему взаимосвязанных вычислительных устройств, DoT создает объекты, которые являются независимыми объектами хранения, полностью автономными.

В качестве доказательства концепции DoT, Исследователь напечатал на 3D-принтере Стэнфордского кролика, который содержит его чертеж в пластиковой нити, используемой для печати. Отрезав крошечный кусочек уха кролика, они смогли прочитать план, умножить его и произвести следующее поколение кроликов. Кроме того, способность DoT служить для стеганографических целей была продемонстрирована путем создания неразличимых линз, которые содержат видео YouTube, интегрированное в материал.

См. Также
Ссылки
Дополнительная литература
Последняя правка сделана 2021-05-16 09:17:07
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте