Сокращение данных

редактировать

Сокращение данных - это преобразование цифровой или буквенной цифровой информации выведено эмпирически или экспериментально в исправленную, упорядоченную и упрощенную форму. Основная концепция - сокращение огромных объемов данных до значимых частей.

Когда информация получена из показаний прибора, также может происходить преобразование из аналоговой формы в цифровую. Когда данные уже представлены в цифровой форме, «сокращение» данных обычно включает в себя некоторое редактирование, масштабирование, кодирование, сортировку, сопоставление и создание сводных таблиц.. Когда наблюдения дискретны, но лежащее в основе явление является непрерывным, часто требуются сглаживание и интерполяция. Обработка данных часто выполняется при наличии ошибок чтения или ошибок измерения. Некоторое представление о природе этих ошибок необходимо, прежде чем можно будет определить наиболее вероятное значение.

Примером в астрономии является обработка данных на спутнике Kepler. Этот спутник записывает 95-мегапиксельные изображения каждые шесть секунд, генерируя десятки мегабайт данных в секунду, что на порядки больше, чем пропускная способность нисходящего канала в 550 Кбит / с. Бортовое сокращение данных включает в себя совместное добавление необработанных кадров в течение 30 минут, уменьшая полосу пропускания в 300 раз. Кроме того, предварительно выбираются интересные цели, и обрабатываются только соответствующие пиксели, что составляет 6% от общего количества. Эти сокращенные данные затем отправляются на Землю, где они обрабатываются дальше.

Также были проведены исследования по использованию сокращения объема данных в носимых (беспроводных) устройствах для приложений мониторинга и диагностики состояния здоровья. Например, в контексте диагностики эпилепсии сокращение данных использовалось для увеличения срока службы батареи носимого устройства ЭЭГ путем выбора и только передачи данных ЭЭГ, которые актуальны для диагностики, и исключения фоновой активности.

Содержание
  • 1 Лучшие практики
  • 2 См. Также
  • 3 Ссылки
  • 4 Библиография
Лучшие практики

Это распространенные методы, используемые при обработке данных.

  • Упорядочить по некоторому аспекту размера.
  • Диагонализация таблицы, при которой строки и столбцы таблиц переупорядочиваются, чтобы их было легче увидеть (см. Диаграмму).
  • Резкое округление до одной или не более двух эффективных цифр (эффективные цифры - это цифры, которые различаются в этой части данных).
  • Используйте средние значения для визуального фокуса, а также для сводки.
  • Используйте макет и надписи, чтобы направлять взгляд.
  • Удалите мусор, например изображения и линии.
  • Сделайте краткое словесное резюме.
См. Также
Ссылки
Библиография
  • Эренберг, Эндрю С.К. (1975,1981), Data Reduction, John Wiley, Chichester. Перепечатано в Journal of Empirical Generalizations in Marketing Science, 2000, 5, 1-391
  • Ehrenberg, Andrew SC (1982) A Primer in Data Reduction: An Introductory Statistics Ehrenberg
Последняя правка сделана 2021-05-17 14:10:59
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте