Смешивание данных

редактировать

Смешивание данных - это процесс, посредством которого большие данные из нескольких источников объединяются в единое хранилище данных или набор данных. Это касается не только объединения различных форматов файлов или разрозненных источников данных, но также и различных разновидностей данных. Смешивание данных позволяет бизнес-аналитикам справляться с увеличением объема данных, которые им необходимы для принятия критически важных бизнес-решений на основе хорошего качества бизнес-аналитика.

Смешивание данных было описано как отличное от интеграции данных из-за требования аналитиков данных объединять источники очень быстро, слишком быстро для какого-либо практического вмешательства со стороны специалистов по данным.

Проблемы

Самый распространенный вопрос настраиваемых метаданных: «Как можно этот набор данных смешивается с моими другими наборами данных (присоединяется или объединяется с ними? " Исследование Forrester Consulting, проведенное в 2015 году, показало, что 52 процента компаний объединяют 50 и более источников данных, а 12 процентов объединяют более 1000 источников.

См. Также
Ссылки
  1. ^Alteryx Analytics выводит на рынок возможности прогнозирования и больших данных
  2. ^Смешивание данных - это процесс объединения данные из нескольких источников в действующий набор данных
  3. ^Полное руководство по смешиванию данных
  4. ^«Смешивание данных». Trifacta.com. 24 августа 2017 г.
  5. ^Что такое смешивание данных и какие инструменты его упрощают?
  6. ^Хир, Джеффри; Hellerstein, Джозеф; Кандел, Шон; Раттенбери, Тай (июль 2017 г.). Принципы обработки данных. http://shop.oreilly.com/product/0636920045113.do : O'Reilly Media. CS1 maint: location (ссылка )
  7. ^«Мэшапы данных для аналитики». Пентахо.
Последняя правка сделана 2021-05-17 14:09:27
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте