Смешивание данных - это процесс, посредством которого большие данные из нескольких источников объединяются в единое хранилище данных или набор данных. Это касается не только объединения различных форматов файлов или разрозненных источников данных, но также и различных разновидностей данных. Смешивание данных позволяет бизнес-аналитикам справляться с увеличением объема данных, которые им необходимы для принятия критически важных бизнес-решений на основе хорошего качества бизнес-аналитика.
Смешивание данных было описано как отличное от интеграции данных из-за требования аналитиков данных объединять источники очень быстро, слишком быстро для какого-либо практического вмешательства со стороны специалистов по данным.
Самый распространенный вопрос настраиваемых метаданных: «Как можно этот набор данных смешивается с моими другими наборами данных (присоединяется или объединяется с ними? " Исследование Forrester Consulting, проведенное в 2015 году, показало, что 52 процента компаний объединяют 50 и более источников данных, а 12 процентов объединяют более 1000 источников.