Небольшие данные - это данные, которые достаточно «малы» для понимания человеком. Это данные в объеме и формате, которые делают их доступными, информативными и действенными. На голову Исаака Ньютона упадет только одно яблоко, а не десять и не тысяча.
Термин «большие данные » относится к машинам, а «малые данные» - к людям. Это означает, что наблюдения очевидцев или пять связанных данных могут быть небольшими данными. Небольшие данные - это то, что мы привыкли считать данными. Единственный способ понять Большие данные - это уменьшить данные до небольших, визуально привлекательных объектов, представляющих различные аспекты больших наборов данных (например, гистограмма, диаграммы, и точечные графики). Большие данные - это поиск корреляций, но малые данные - это поиск причинно-следственной связи, причины, почему.
Формальное определение малых данных было предложено Аллен Бонд, бывший вице-президент по инновациям в Actuate - теперь часть OpenText : «Небольшие данные позволяют людям получать своевременные и значимые сведения (полученные из больших данных и / или« местных » источников), организованных и упакованных - часто визуально - для обеспечения доступности, понимания и выполнения повседневных задач ».
Другое определение небольших данных:
Было подсчитано, что «если взять 100 крупнейших инноваций нашего времени, возможно, около 60% до 65% процентов действительно основаны на малых данных ». как выразился Мартин Линдстрем. Небольшие данные включают в себя все, от Snapchat до простых объектов, таких как заметки. Линдстром считает, что мы настолько сосредоточены на больших данных, что забываем о более простых концепциях и творчестве. Линдстром определяет Small Data «как кажущиеся незначительными наблюдения, которые вы обнаруживаете в домах потребителей, это все, от того, как вы ставите обувь, до того, как вешаете свои картины». Таким образом, он считает, что нужно в совершенстве овладеть базовыми (малыми данными), чтобы добыть и найти корреляции.
Бонд писал на эту тему для Forbes, Direct Marketing News, CMO.com и других изданий.
Согласно Мартину Линдстрому в его книге Малые данные: "{В исследовании клиентов небольшие данные - это} На первый взгляд незначительные поведенческие наблюдения содержащие очень специфические атрибуты, указывающие на неудовлетворенные потребности клиентов. Небольшие данные - это основа для прорывных идей или совершенно новых способов изменить бренды ». Его подход основан на сочетании наблюдения небольших выборок с интуицией. Маркетологи могут получить представление о рынке, собирая небольшие данные, взаимодействуя с людьми и наблюдая за ними в их собственной среде. По сравнению с большими данными, малые данные могут вызывать эмоции и давать представление о причинах поведения клиентов. Он может раскрыть подробную информацию об экстраверсии или интроверсии человека, его уверенности в себе, о том, есть ли проблемы в его / ее отношениях и т. Д. Согласно Линдстрему, отношения между людьми и сегментами клиентов строятся по четырем критериям:
Многие компании недооценивают силу малых данных, использование выборок миллионов потребителей вместо признания ценности внимательного изучения небольших выборок в их маркетинговых исследованиях. В своей книге Линдстром определяет «7C», которые компании должны учитывать, пытаясь получить значимое представление о клиентах и рыночных тенденциях с помощью небольших данных от своих клиентов:
Некоторые клиенты Lindstrom, такие как Lowes Foods, смотрели на данные иначе и фактически предпочли жить с клиентом. «Когда вы входите в их магазин, они создают удивительное сообщество, в котором каждый сотрудник действует в настроении персонажа, основанном на Small Data». В супермаркете сделано все, чтобы покупатель чувствовал себя как дома. Все действия сотрудников основываются на отзывах клиентов, собранных в ходе собеседований, проводимых непосредственно у них дома.
Исследователи из Корнельского университета начали разработку приложений для мониторинга проблем со здоровьем у пациентов на основе небольших данных. Это инициатива лаборатории малых данных Корнелла в тесном сотрудничестве с Медицинским колледжем Вейл Корнелл под руководством Деборы Эстрин.
Лаборатория малых данных разработала серию приложений, ориентированных не только на сбор данных. данные о боли пациентов, а также отслеживание привычек в таких областях, как покупка продуктов. В случае пациентов с ревматоидным артритом, например, с обострениями и ремиссиями, которые не соответствуют определенному циклу, приложение собирает информацию пассивно, что позволяет прогнозировать, когда может возникнуть обострение. появиться на основе небольших изменений в поведении. Другие разработанные приложения также включают мониторинг онлайн-покупок продуктов для использования этой информации от каждого пользователя для адаптации своих продуктов к рекомендациям диетологов или мониторинг языка электронной почты для выявления закономерностей, которые могут указывать на «колебания когнитивных функций, утомляемость, побочные эффекты лекарств или плохой сон и другие состояния и методы лечения, о которых обычно сообщают пациенты и занимаются самолечением ".
Почтовая служба США (USPS) использовала оптическое распознавание символов (OCR) для автоматического считывания и обработки 98% всей почты, адресованной вручную, и 99,5% почты, напечатанной машиной. Объединив эту технологию с небольшой выборкой почтовых индексов США, USPS теперь может обрабатывать более 36 000 почтовых отправлений в час.
В 2015 году Boeing в сотрудничестве с Университетом Карнеги-Меллона открыла лабораторию аналитики аэрокосмических данных, чтобы усилить лидерство университета в машинное обучение, языковые технологии и анализ данных. Один из инициативных проектов направлен на стандартизацию журналов технического обслуживания с использованием ИИ для значительного снижения затрат.
В настоящее время не существует стандартизированной процедуры для документирования журналов обслуживания, приводящих к небольшим, но сильно неструктурированным наборам данных. В результате для обслуживающего персонала становится очень трудно переводить эти изменения в журналы технического обслуживания за короткий период времени. Однако с помощью AI и узкого набора данных общей терминологии технического обслуживания воздушных судов становится возможным динамически переводить эти журналы в реальном времени. Согласно Harvard Business Review.