Вторичные данные относятся к данным, которые собирает кто-то, кроме пользователя. Общие источники вторичных данных для социальных наук включают переписи, информацию, собранную правительственными ведомствами, организационные записи и данные, которые первоначально были собраны для других исследовательских целей. Первичные данные, напротив, собираются исследователем, проводящим исследование.
Анализ вторичных данных может сэкономить время, которое в противном случае было бы потрачено на сбор данных, и, особенно в случае количественных данных, может предоставить более крупные и качественные базы данных, которые было бы невозможно для любого отдельного исследователя собрать самостоятельно. Кроме того, аналитики социальных и экономических изменений считают вторичные данные важными, поскольку невозможно провести новое обследование, которое могло бы адекватно отразить прошлые изменения и / или события. Однако вторичный анализ данных может быть менее полезным в маркетинговых исследованиях, поскольку данные могут быть устаревшими или неточными.
Вторичные данные могут быть получены из разных источников:
Правительственные ведомства и агентства регулярно собирают информацию при регистрации людей или проведении транзакций или для записи сохранение - обычно при оказании услуги. Эта информация называется административными данными.
Она может включать:
A перепись - это процедура систематического сбора и регистрации информации о членах данного населения. Это регулярный официальный подсчет определенной популяции. Это разновидность административных данных, но они собираются для целей исследования через определенные промежутки времени. Большая часть административных данных собирается непрерывно и с целью предоставления услуг людям.
Вторичные данные доступны из других источников и, возможно, уже использовались в предыдущих исследованиях, что упрощает проведение дальнейших исследований. Это экономия времени и рентабельность: данные были собраны кем-то, кроме исследователя. Административные данные и данные переписи могут подробно охватывать как более крупные, так и гораздо более мелкие выборки населения. Информация, собираемая правительством, также будет охватывать те части населения, которые с меньшей вероятностью откликнутся на перепись (в странах, где это необязательно).
Явным преимуществом использования вторичных данных является то, что большая часть фона Необходимая работа уже выполнена, например, обзоры литературы или тематические исследования. Данные могли быть использованы в опубликованных текстах и статистике где-то еще, и эти данные уже могли быть продвинуты в СМИ или приносить полезные личные контакты. Вторичные данные обычно имеют заранее установленную степень достоверности и надежности, которые не требуют повторной проверки исследователем, повторно использующим такие данные. Вторичные данные являются ключевыми в концепции обогащения данных, при которой наборы данных из вторичных источников подключаются к набору исследовательских данных для повышения его точности путем добавления ключевых атрибутов и значений.
Вторичные данные могут обеспечить основу для первичного исследования для сравнения собранных результатов первичных данных, и это также может быть полезно при дизайне исследования.
Однако вторичные данные также могут представлять проблемы. Данные могут быть устаревшими или неточными. При использовании данных, собранных для различных исследовательских целей, они могут не охватывать те выборки населения, которые исследователи хотят изучить, или недостаточно подробно. Административные данные, которые изначально не собирались для исследований, могут быть недоступны в обычных исследовательских форматах или к ним может быть трудно получить доступ.
В то время как «вторичные данные» связаны с количественными базами данных, анализ, сосредоточенный на словесных или визуальных материалах, созданных для другой цели, является законным средством для качественный исследователь. На самом деле можно было бы пойти еще дальше, заявив, что качественный анализ вторичных данных «можно понять не так много, как анализ ранее существовавших данных; скорее как вовлечение процесса повторного контекстуализации и воссоздания данных ».
При анализе вторичных качественных данных нельзя недооценивать хорошую документацию, поскольку она дает будущим исследователям возможность