Журналистика, управляемая данными

редактировать

Журналистика, управляемая данными, часто сокращается до «ddj», термин, используемый с 2009 года, является журналистским процесс, основанный на анализе и фильтрации больших наборов данных с целью создания или улучшения новостей. Многие истории, основанные на данных, начинаются с новых доступных ресурсов, таких как программное обеспечение с открытым исходным кодом, открытый доступ публикация и открытые данные, в то время как другие являются продуктами общедоступных фиксирует запросы или просочившиеся материалы. Этот подход к журналистике основан на старых методах работы, в первую очередь на компьютеризованной репортажной (CAR) - ярлыке, который десятилетиями использовался в основном в США. Другие ярлыки для частично схожих подходов - «точная журналистика», основанная на книге Филиппа Мейера, опубликованной в 1972 году, где он выступал за использование методов социальных наук в исследовании историй.

Журналистика, основанная на данных, имеет более широкий подход. В основе процесса лежит растущая доступность открытых данных, которые находятся в свободном доступе в Интернете и анализируются с помощью инструментов с открытым исходным кодом. Журналистика, основанная на данных, стремится выйти на новый уровень обслуживания общественности, помогая широкой публике или отдельным группам или отдельным лицам понимать закономерности и принимать решения на основе результатов. Таким образом, журналистика, основанная на данных, может по-новому поставить журналистов на роль, актуальную для общества.

С момента появления концепции ряд медиа-компаний создали «группы обработки данных», которые разрабатывают визуализацию для редакций. Наиболее заметными являются команды, например. в Reuters, Pro Publica и La Nacion (Аргентина). В Европе у The Guardian и Berliner Morgenpost есть очень продуктивные команды, а также общественные вещатели.

Как показывают такие проекты, как скандал с расходами парламентария (2009) и публикация «офшорных утечек» в 2013 году, журналистика, управляемая данными, может взять на себя роль расследования, имея дело с «не очень иногда открывать "секретные данные".

Ежегодная премия Data Journalism Awards присуждается за выдающиеся репортажи в области журналистики данных, и многочисленные Пулитцеровские премии в последние годы были присуждены за основанное на данных повествование, включая Пулитцеровскую премию 2018 года в области международной журналистики. Отчетность и Пулитцеровская премия 2017 года в сфере государственной службы

Содержание
  • 1 Определения
  • 2 Отчетность на основе данных
  • 3 Качество данных
    • 3.1 Журналистика, управляемая данными, и ценность доверия
  • 4 Процесс журналистики данных
    • 4.1 Перевернутая пирамида журналистики данных
    • 4.2 Этапы процесса
    • 4.3 Описание этапов
      • 4.3.1 Поиск данных
      • 4.3.2 Очистка данных
      • 4.3.3 Визуализация данных
      • 4.3.4 Публикация истории данных
      • 4.3.5 Распространение данных
      • 4.3.6 Измерение влияния историй данных
  • 5 Примеры
  • 6 См. Также
  • 7 Ссылки
  • 8 Внешние ссылки
Определения
Процесс журналистики, управляемой данными. Процесс журналистики, управляемой данными.

По мнению архитектора и мультимедийного журналиста Мирко Лоренца, журналистика, управляемая данными, является первичной y рабочий процесс, который состоит из следующих элементов: глубокое копание данных путем их очистки, очистки и структурирования, фильтрация путем интеллектуального анализа данных для конкретных целей, визуализация и создание истории. Этот процесс может быть расширен для получения результатов, отвечающих индивидуальным интересам и широкой общественности.

Преподаватель и писатель по журналистике данных Пол Брэдшоу описывает процесс журналистики, управляемой данными, аналогичным образом: данные должны быть найдены, что может потребовать специальных навыков, таких как MySQL или Python, затем опрашиваются, для чего необходимо понимание жаргона и статистики, и, наконец, визуализируются и обрабатываются с помощью инструментов с открытым исходным кодом.

Более ориентированное на результаты определение исходит из данных репортер и веб-стратег Хенк ван Эсс (2012). «Журналистика, основанная на данных, позволяет репортерам рассказывать нерассказанные истории, находить новые точки зрения или завершать истории посредством рабочего процесса поиска, обработки и представления значительных объемов данных (в любой форме) с открытыми инструментами или без них». Ван Эсс утверждает, что часть рабочего процесса, управляемого данными, приводит к продуктам, которые «не находятся на орбите с законами хорошего рассказывания историй», потому что в результате упор делается на демонстрацию проблемы, а не на ее объяснение. «Хорошее производство, основанное на данных, имеет разные уровни. Это позволяет вам находить персонализированные, которые важны только для вас, путем перехода к релевантным, но также позволяет уменьшить масштаб, чтобы получить общую картину».

В 2013 году Ван Эсс дал более короткое определение, которое не включает визуализацию как таковую:

«Журналистика данных - это журналистика, основанная на данных, которые должны быть обработаны с помощью инструментов, прежде чем соответствующая история возможна ".

Составление отчетов на основе данных

Рассказывать истории на основе данных - основная цель. Выводы из данных могут быть преобразованы в любую форму журналистского письма. Визуализации можно использовать для четкого понимания сложной ситуации. Кроме того, элементы повествования можно использовать, чтобы проиллюстрировать, что на самом деле означают полученные данные с точки зрения человека, на которого влияет развитие. Эту связь между данными и историей можно рассматривать как «новую дугу», пытающуюся преодолеть разрыв между актуальными, но плохо понятыми событиями, до истории, которая поддается проверке, заслуживает доверия, актуальна и легко запоминается.

Качество данных

Во многих исследованиях данные, которые можно найти, могут содержать пропуски или вводить в заблуждение. В качестве одного из уровней журналистики, основанной на данных, важен критический анализ качества данных. В других случаях данные могут быть закрытыми или иметь неправильный формат для дальнейшего анализа, например доступен только в формате PDF. Здесь процесс журналистики, основанной на данных, может превратиться в рассказы о качестве данных или об отказах учреждений предоставить данные. Поскольку практика в целом находится на ранних этапах разработки, исследования источников данных, наборов данных, качества данных и формата данных, следовательно, являются не менее важной частью этой работы.

Журналистика, основанная на данных, и ценность доверия

Основываясь на перспективе более глубокого изучения фактов и движущих сил событий, предлагается изменение в стратегии СМИ: с этой точки зрения идея заключается в перейти «от внимания к доверию». Привлечение внимания, которое было опорой бизнес-моделей СМИ, утратило свою актуальность, потому что сообщения о новых событиях часто быстрее распространяются через новые платформы, такие как Twitter, чем через традиционные каналы СМИ. С другой стороны, доверие можно рассматривать как дефицитный ресурс. Хотя распространение информации через Интернет намного проще и быстрее, обилие предложений требует затрат на проверку и проверку содержания любой истории, что создает возможность. Перспектива преобразования медиа-компаний в надежные центры данных описана в статье, опубликованной в феврале 2011 г. на сайтах Owni.eu и Nieman Lab.

Процесс журналистики, управляемой данными

Процесс преобразование необработанных данных в истории сродни уточнению и преобразованию. Основная цель - извлечь информацию, на которую получатели могут действовать. Задача журналиста данных - извлечь то, что скрыто. Этот подход может применяться практически к любому контексту, например к финансам, здоровью, окружающей среде или другим областям, представляющим общественный интерес.

Перевернутая пирамида журналистики данных

В 2011 году Пол Брэдшоу представил модель, которую он назвал «Перевернутая пирамида журналистики данных».

Этапы процесса

Для этого процесс следует разбить на несколько этапов. Хотя шаги, ведущие к результатам, могут различаться, основное различие можно сделать, рассмотрев шесть этапов:

  1. Найти: поиск данных в Интернете
  2. Очистить: процесс фильтрации и преобразования данных, подготовка к визуализации
  3. Визуализация: отображение шаблона в виде статического или анимированного визуального элемента
  4. Публикация: интеграция визуальных элементов, добавление данных к историям
  5. Распространение: обеспечение доступа на различных устройствах, например, в Интернете, на планшетах и ​​мобильных устройствах
  6. Измерение: отслеживание использования историй данных во времени и по всему спектру использования.

Описание шагов

Поиск данных

Данные можно получить непосредственно из правительственных баз данных, таких как data.gov, data.gov.uk и API данных Всемирного банка, но также можно разместить запросы о свободе информации в госорганы; некоторые запросы отправляются и собираются на таких веб-сайтах, как британский What Do They Know. Хотя существует общемировая тенденция к открытию данных, существуют национальные различия в том, в какой степени эта информация свободно доступна в удобных для использования форматах. Если данные находятся на веб-странице, парсеры используются для создания электронной таблицы. Примеры парсеров: Import.io, ScraperWiki, OutWit Hub и (прекращено в 2012 году). В других случаях для получения данных из PDF-файлов можно использовать программное обеспечение OCR.

Общественность также может создавать данные с помощью краудсорсинга, как было показано в марте 2012 года на конференции Datajournalism Conference в Гамбурге Хенком ван Эссом.

Очистка данных

Обычно данные не в формате, который легко визуализировать. Примеры: слишком много точек данных или строки и столбцы необходимо сортировать по-другому. Другая проблема заключается в том, что после исследования многие наборы данных необходимо очистить, структурировать и преобразовать. Различные инструменты, такие как Google Refine (открытый исходный код ) и Google Spreadsheets, позволяют загружать, извлекать или форматировать данные.

Визуализация данных

Для визуализации данных в виде графиков и диаграмм доступны такие приложения, как Many Eyes или Tableau Public. Yahoo! Pipes и Open Heat Map - это примеры инструментов, которые позволяют создавать карты на основе электронных таблиц. Количество опций и платформ расширяется. Некоторые новые предложения предоставляют возможности для поиска, отображения и встраивания данных, например:

Для создания значимых и релевантных визуализаций журналисты используют все больше инструментов. На данный момент существует несколько описаний того, что искать и как это делать. Наиболее известные опубликованные статьи:

  • Джоэл Гюнтер: «# ijf11: Уроки журналистики данных от New York Times»
  • Стив Майерс: «Использование визуализации данных в качестве инструмента отчетности может выявить форму истории», включая ссылка на учебное пособие Сары Коэн

С 2011 года использование библиотек HTML 5 с использованием тега canvas становится все более популярным. Существует множество библиотек, позволяющих отображать данные во все более разнообразных формах. Один из примеров - RGraph. По состоянию на 2011 год растет список библиотек JavaScript, позволяющих визуализировать данные.

Публикация истории данных

Существуют различные варианты публикации данных и визуализаций. Базовый подход - прикрепить данные к отдельным историям, аналогично встраиванию веб-видео. Более продвинутые концепции позволяют создавать отдельные досье, например для отображения ряда визуализаций, статей и ссылок на данные на одной странице. Часто такие специальные предложения нужно кодировать индивидуально, поскольку многие системы управления контентом предназначены для отображения отдельных сообщений на основе даты публикации.

Распространение данных

Предоставление доступа к существующим данным - еще один этап, который приобретает все большее значение. Думайте о сайтах как о «торговых площадках» (коммерческих или нет), где наборы данных могут быть легко найдены другими. Журналисты должны предоставить ссылку на данные, которые они использовали для расследования другими (что потенциально может начать новый цикл допроса, ведущий к новым открытиям), особенно в отношении информации для статьи, полученной из открытых данных.

Предоставление доступа к данным и предоставление группам возможности обсуждать, какую информацию можно извлечь, является основной идеей Buzzdata, сайта, использующего концепции социальных сетей, такие как совместное использование и подписка, для создания сообщества для исследования данных.

Другие платформы (которые могут использоваться как для сбора, так и для распространения данных):

  • Help Me Investigate (создано Полом Брэдшоу)
  • Timetric
  • ScraperWiki

Измерение влияния историй с данными

Заключительным этапом процесса является определение того, как часто просматривается набор данных или визуализация.

В контексте журналистики, основанной на данных, следует рассматривать степень такого отслеживания, например, сбор пользовательских данных или любой другой информации, которая может быть использована в маркетинговых целях или для других целей, не зависящих от пользователя. как проблемный. Еще один новый, ненавязчивый способ измерения использования - это легкий трекер под названием PixelPing. Трекер является результатом проекта ProPublica и DocumentCloud. Есть соответствующий сервис для сбора данных. Программное обеспечение имеет открытый исходный код и может быть загружено через GitHub.

Примеры

Список примеров того, как можно применять журналистику, управляемую данными, постоянно растет:

  • The Guardian, один из новаторские медиакомпании в этой сфере (см. «Журналистика данных в Guardian: что это такое и как мы это делаем?») составили обширный список историй с данными, см. «Вся наша журналистика данных в одной электронной таблице».

Другие известные применения журналистики, основанной на данных, связаны с публикацией организацией разоблачителей WikiLeaks Дневников афганской войны, сборника 91 000 секретных военных отчетов, освещающих войну. в Афганистане с 2004 по 2010 год. В трех глобальных информационных листках, а именно The Guardian, The New York Times и Der Spiegel, документам были посвящены обширные разделы; Репортаж The Guardian включал интерактивную карту с указанием типа, местоположения и потерь, вызванных 16 000 IED атак, The New York Times опубликовала подборку отчетов это позволяет пролистывать подчеркнутый текст, чтобы раскрыть объяснения военных терминов, в то время как Der Spiegel предоставил гибридные визуализации (содержащие как графики, так и карты) по таким темам, как количество смертей, связанных с бомбовыми атаками повстанцев. Для выпуска журналов войны в Ираке The Guardian использовала Google Fusion Tables для создания интерактивной карты каждого инцидента, в котором кто-то погиб, - метод, который он снова использовал во время беспорядков в Англии 2011 г.

См. Также
Ссылки
Внешние ссылки
Последняя правка сделана 2021-05-17 14:07:25
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте