Данные

редактировать
отдельных единиц информации Некоторые из различных типов данных.

Данные - это характеристики или информация, обычно числовые, которые собираются посредством наблюдения. В более техническом смысле данные представляют собой набор значений качественных или количественных переменных об одном или нескольких людях или объектах, в то время как данные (единственное число данных) - одно значение одной переменной.

Хотя термины «данные» и «информация» часто используются взаимозаменяемо, эти термины имеют разные значения. В некоторых популярных публикациях иногда говорится, что данные преобразуются в информацию, когда они рассматриваются в контексте или в ходе постанализа. Однако при академическом подходе к предмету данные - это просто единицы информации. Данные используются в научных исследованиях, управлении предприятиями (например, данные о продажах, выручке, прибыли, курс акций ), финансах, управлении (например, уровень преступности, уровень безработицы, уровень грамотности ) и практически во всех других формах человеческой организационной деятельности (например, переписи бездомных некоммерческими организациями).

Данные измеряются, собираются и сообщаются и анализируются, после чего их можно визуализировать с помощью графиков, изображений или другие инструменты анализа. Данные как общее понятие относятся к тому факту, что некоторая существующая информация или знания представлена ​​ или закодирована в некоторая форма, подходящая для лучшего использования или обработки. Необработанные данные («необработанные данные») - это набор чисел или символов до того, как они будут «очищены» и исправлены исследователями. Необработанные данные необходимо исправить, чтобы удалить выбросы или очевидные ошибки прибора или ввода данных (например, показания термометра из открытого арктического местоположения, фиксирующие тропическую температуру). Обработка данных обычно происходит поэтапно, и «обработанные данные» одного этапа могут считаться «необработанными данными» следующего этапа. Данные поля - это необработанные данные, которые собираются в неконтролируемой среде «in situ ». Экспериментальные данные - это данные, полученные в рамках научного исследования путем наблюдения и записи.

Данные были описаны как новое масло цифровой экономики.

Содержание
  • 1 Этимология и терминология
  • 2 Значение
  • 3 Документы с данными
    • 3.1 Сбор данных
  • 4 В других полях
  • 5 См. Также
  • 6 Ссылки
  • 7 Внешние ссылки
Этимология и терминология

Первое английское использование слова «данные» "относится к 1640-м годам. Слово «данные» впервые было использовано для обозначения «передаваемой и сохраняемой компьютерной информации» в 1946 году. Выражение «обработка данных» было впервые использовано в 1954 году.

Латинское слово «данные» является множественным числом от «данные», «( вещь) дано, "причастие прошедшего времени смею" давать ". В этом смысле данные могут использоваться как существительное во множественном числе, причем некоторые писатели - обычно научные писатели - в 20-м веке использовали данные в единственном числе и данные во множественном числе. Однако в повседневном языке «данные» чаще всего используются в единственном числе, как массовое существительное (например, «песок» или «дождь»). В руководстве по стилю APA "данные" должны быть множественного числа.

Значение
"ТАБЛИЦА отверстий в объектных очках" Адриена Аузута из статьи 1665 в Philosophical Transactions

Данные, информация, знание и мудрость являются тесно связанными понятиями, но каждое из них играет свою роль в отношении другой, и каждый термин имеет свое значение. Согласно общему мнению, данные собираются и анализируются; данные становятся информацией, пригодной для принятия решений, только после того, как они были проанализированы определенным образом. Можно сказать, что степень информативности набора данных для кого-либо зависит от того, насколько он неожидан для этого человека. Количество информации, содержащейся в потоке данных, может быть охарактеризовано его энтропией Шеннона.

Знание - это понимание, основанное на обширном опыте работы с информацией по предмету. Например, высота горы Эверест обычно считается данными. Высота может быть точно измерена с помощью альтиметра и внесена в базу данных. Эти данные могут быть включены в книгу вместе с другими данными об Эвересте, чтобы описать гору в манере, полезной для тех, кто хочет принять решение о наилучшем методе восхождения на нее. Понимание, основанное на опыте восхождения на горы, которое могло бы посоветовать людям путь к вершине Эвереста, может рассматриваться как «знание». Практическое восхождение на пик Эвереста, основанное на этих знаниях, можно рассматривать как «мудрость». Другими словами, мудрость относится к практическому применению знаний человека в тех обстоятельствах, которые могут привести к добру. Таким образом, мудрость дополняет и дополняет ряды «данные», «информация» и «знание» все более абстрактных понятий.

Часто считается, что данные являются наименее абстрактным понятием, на втором месте - информация, а наиболее абстрактными - знания. С этой точки зрения данные становятся информацией путем интерпретации; например, высота горы Эверест обычно считается "данными", книга о геологических характеристиках горы Эверест может считаться "информацией", а руководство альпиниста, содержащим практическую информацию о наилучшем способе достижения пика Эвереста, может считаться "знанием". «Информация» имеет множество значений, которые варьируются от повседневного до технического. Эта точка зрения, однако, также утверждается, чтобы изменить способ, которым данные возникают из информации, а информация - из знаний. Вообще говоря, концепция информации тесно связана с понятиями ограничения, коммуникации, контроля, данных, формы, инструкции, знания, значения, умственного стимула, паттерна, восприятия и представления. Бейнон-Дэвис использует понятие знака , чтобы различать данные и информацию; данные представляют собой серию символов, а информация возникает, когда символы используются для обозначения чего-либо.

До развития вычислительных устройств и машин людям приходилось вручную собирать данные и накладывать на них шаблоны. С момента развития вычислительных устройств и машин эти устройства также могут собирать данные. В 2010-х годах компьютеры широко использовались во многих областях для сбора данных, их сортировки или обработки, в различных дисциплинах: от маркетинга, анализа социальных услуг граждан до научных исследований. Эти закономерности в данных рассматриваются как информация, которую можно использовать для расширения знаний. Эти шаблоны могут интерпретироваться как «истина » (хотя «истина» может быть субъективным понятием) и могут быть признаны эстетическими и этическими критериями в некоторых дисциплинах или культурах. События, которые оставляют ощутимые физические или виртуальные останки, можно проследить с помощью данных. Метки больше не считаются данными, если связь между меткой и наблюдением нарушена.

Механические вычислительные устройства классифицируются в соответствии со средствами, с помощью которых они представляют данные. Аналоговый компьютер представляет данные как напряжение, расстояние, положение или другую физическую величину. Цифровой компьютер представляет часть данных в виде последовательности символов, взятых из фиксированного алфавита. Наиболее распространенные цифровые компьютеры используют двоичный алфавит, то есть алфавит из двух символов, обычно обозначаемых «0» и «1». Затем из двоичного алфавита строятся более знакомые представления, такие как числа или буквы. Различают некоторые особые формы данных. Компьютерная программа - это набор данных, которые можно интерпретировать как инструкции. В большинстве компьютерных языков проводится различие между программами и другими данными, с которыми они работают, но на некоторых языках, особенно на Lisp и подобных языках, программы по существу неотличимы от других данных. Также полезно различать метаданные, то есть описание других данных. Аналогичный, но более ранний термин для метаданных - «вспомогательные данные». Типичным примером метаданных является каталог библиотеки, который представляет собой описание содержания книг.

Документы данных

Когда данные должны быть зарегистрированы, данные существуют в виде данных документов. Типы документов с данными включают:

  • репозиторий данных
  • исследование данных
  • набор данных
  • программное обеспечение
  • информационный бюллетень
  • база данных
  • справочник данных
  • журнал данных

Некоторые из этих документов с данными (хранилища данных, исследования данных, наборы данных и программное обеспечение) проиндексированы, в то время как статьи с данными индексируются в традиционных библиографических базах данных, например, Индекс научного цитирования. См. Далее.

Сбор данных

Сбор данных может осуществляться через первичный источник (исследователь является первым, кто получает данные) или вторичный источник (исследователь получает данные, которые имеют уже были собраны другими источниками, например, данными, опубликованными в научном журнале). Методологии анализа данных различаются и включают триангуляцию данных и перколяцию данных. Последний предлагает четкий метод сбора, классификации и анализа данных с использованием пяти возможных углов анализа (по крайней мере, трех), чтобы максимизировать объективность исследования и дать возможность понять изучаемые явления как можно более полно: качественные и количественные методы, обзоры литературы (включая научные статьи), интервью с экспертами и компьютерное моделирование. После этого данные «просачиваются» с использованием ряда заранее определенных шагов, чтобы извлечь наиболее релевантную информацию.

В других областях

Хотя данные также все чаще используются в других областях, было высказано предположение, что их высокоинтерпретативный характер может противоречить этике данных как «данных». Питер Чекленд ввел термин capta (от латинского capere, «брать»), чтобы различать огромное количество возможных данных и их подмножество, на которое обращено внимание. Джоанна Друкер утверждал, что, поскольку гуманитарные науки утверждают, что производство знания «обусловлено, частичным и конститутивным», использование данных может вводить предположения, которые являются контрпродуктивными, например, что явления дискретны или не зависят от наблюдателя. Термин capta, который подчеркивает акт наблюдения как конститутивный, предлагается в качестве альтернативы данным для визуальных представлений в гуманитарных науках.

См. Также
Ссылки

Эта статья основана на материалах, взятых из Free On-line Dictionary of Computing до 1 ноября 2008 г. и включенных в соответствии с условиями «перелицензирования» GFDL, версия 1.3 или новее.

Внешние ссылки
Найдите данные в Викисловаре, бесплатном словаре.
На Викискладе есть медиафайлы, связанные с данными.
Последняя правка сделана 2021-05-17 14:07:15
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте