Поток данных

редактировать

В связи с установлением соединения, поток данных - это последовательность кодированных в цифровом виде когерентных сигналов (пакетов из данных или данных пакеты ), используемые для передачи или приема информации, которая находится в процессе передачи. Поток данных - это набор информации, извлеченной от поставщика данных. Он содержит необработанные данные, которые были собраны из поведения браузера пользователей на веб-сайтах, на которых размещен выделенный пиксель. Потоки данных полезны для специалистов по данным для предоставления алгоритмов big data и AI. Основными поставщиками потоков данных являются компании, занимающиеся технологиями данных.

Содержание

  • 1 Формальное определение
  • 2 Содержание
  • 3 Использование
  • 4 Интеграция
  • 5 Видимые источники данных
  • 6 Форматы
  • 7 GDPR
  • 8 Примечания
  • 9 Ссылки

Формальное определение

Формально поток данных - это любая упорядоченная пара (s, Δ) {\ displaystyle (s, \ Delta)}(s, \ Delta) где:

  1. s {\ displaystyle s}s - это последовательность из кортежей и
  2. Δ {\ displaystyle \ Delta}\ Delta - это последовательность положительных реальных временных интервалов.

Контент

. Поток данных содержит различные наборы данных, которые зависят от выбранного формата данных.

  • Атрибуты - каждый атрибут потока данных представляет определенный тип данных, например идентификатор сегмента / точки данных, временная метка, геоданные.
  • Атрибут Timestamp помогает определить, когда произошло событие.
  • Subject ID - это кодированный алгоритм, который был извлечен из файла cookie.
  • Необработанные данные включают информацию прямо от поставщика данных без обработки ни алгоритмом, ни человеком.
  • Обработанные данные - это данные, которые были подготовлены (каким-то образом изменены, проверено или очищено) для использования в будущих действиях.

Использование

Существуют различные области, в которых используются потоки данных:

  • Обнаружение и оценка мошенничества - исходные данные используются в качестве источника данные для алгоритма борьбы с мошенничеством (методы анализа данных для обнаружения мошенничества ). Например, временная метка или количество появлений файлов cookie или анализ точек данных используются в системе оценки для обнаружения мошенничества или для того, чтобы убедиться, что получатель сообщения не является ботом (так называемый трафик, не связанный с людьми).
  • Искусственный интеллект - необработанные данные обрабатываются как набор поездов и набор тестов при построении алгоритмов ИИ и машинного обучения.
  • Исходные данные используются для профилирования и персонализации для настройки профилей пользователей и разделения их для сегментации, например, по полу или местоположению (на основе точки данных ).
  • Бизнес-аналитика - необработанные данные являются источником информации для систем бизнес-аналитики, используемой для обогащения профили пользователей с подробной информацией о них, например, путь покупки или геоданные. Эта информация используется для бизнес-анализа и прогнозных исследований.
  • Таргетинг - данные, обработанные специалистами по данным, улучшают онлайн-кампании и используется для охвата целевой аудитории.
  • Расширение CRM - сырые данные интегрированы с клиентом- система управления отношениями. Интеграция CRM позволяет заполнить пробелы в профилях пользователей демографическими данными, интересами или покупательскими намерениями.

Интеграция

Основные интеграции с потоками данных:

  • Потоки данных интегрированы с такими системами, как платформа данных о клиентах (CDP), управления взаимоотношениями с клиентами (CRM) или платформа управления данными (DMP) для обогащения профилей пользователей внешними данными. Можно расширить знания о существующих пользователях, используя внешние источники.
  • Потоки данных используются для обогащения систем бизнес-аналитики и повышения точности анализа и более точных выводов.
  • В случае интеграция с системой управления контентом (CMS), поток данных используется для идентификации пользователей и персонализации их посещения, даже если это их первый визит. Путем анализа данных фактическое содержание веб-сайта адаптируется к пользователю.
  • Потоки данных интегрированы с платформой со стороны спроса (DSP) в экосистеме программной рекламы. Стороны (например, рекламодатели) могут обмениваться идентификаторами пользователей и объединять с ними существующие профили.
  • Потоки данных используются для выбора соответствующих сегментов пользователей (например, людей, интересующихся автомобильной промышленностью) и использования их в интерактивном режиме. кампания. Сегменты обогащаются дополнительными характеристиками пользователя из потока данных и затем отправляются в DSP.

Видны источники данных

В потоке данных видно, какое устройство использовалось на стороне пользователя - это видно на пользовательский агент :

  • мобильный - когда пользователь использует мобильный браузер для исследования, у него узкое разрешение экрана и версия мобильного приложения соответственно;
  • рабочий стол - когда пользователь использует настольный браузер или версия приложения.

Следующая информация передается с используемого устройства:

Форматы

A точка данных - это тег, который собирает информацию об определенном действии, выполняемом пользователем на веб-сайте. Точки данных существуют двух типов, значения которых используются для создания соответствующих аудиторий. Это:

  • «событие» с информацией о наступлении конкретного события (например, щелчок по ссылке или показ рекламы)
  • «атрибут» с числовыми или буквенно-цифровыми значениями.

Сегмент является логическим выражением, построенным на определенных точках данных с использованием операторов AND, OR или NOT.. Гибридные данные - необработанные данные из форматов данных точки данных и сегмента.. URL-адреса - это набор информации об определенном URL, который был посещен.

GDPR

Информация, собираемая с веб-сайтов, основана на поведении пользователей. Поставщики данных предоставляют как личную, так и неличную информацию. В потоке данных доступны два типа пользовательских данных:

  • Личная информация (PII) - информация, которая позволяет четко или путем объединения с методами идентификации данных идентифицировать человека. Примеры PII: страховой идентификатор, адрес электронной почты, номер телефона, IP-адрес, геолокация, биометрические данные.
  • неличная информация (не PII) - это информация, которая может не используются для идентификации человека или отслеживания местоположения. Файл cookie или идентификатор устройства являются примером не-PII.

Примечания

Ссылки

Последняя правка сделана 2021-05-17 14:11:19
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте