Социальная революция данных

редактировать

революция социальных данных - это сдвиг в моделях человеческого общения в сторону увеличения обмена личной информацией и связанных с этим последствий, ставший возможным благодаря развитию социальных сетей в начале 2000-х. Это явление привело к накоплению беспрецедентных объемов общедоступных данных..

Этот большой и часто обновляемый источник данных был описан как новый тип научного инструмента для социальных наук. Несколько независимых исследователей использовали социальные данные для «текущего прогноза» и прогнозов таких тенденций, как безработица, вспышки гриппа, настроение всего населения, расходы на поездки и политические взгляды, причем быстрее, точнее и дешевле, чем стандартные правительственные отчеты или Опросы Gallup.

Социальные данные - это данные, создаваемые отдельными лицами, которыми они сознательно и добровольно делятся. Издержки и накладные расходы ранее делали эту полуобщественную форму общения невозможной, но достижения в области технологий социальных сетей в 2004–2010 годах сделали возможными более широкие концепции совместного использования. Типы данных, которыми обмениваются пользователи, включают геолокацию, медицинские данные, предпочтения в свиданиях, открытые мысли, интересные новостные статьи и т. Д.

Революция социальных данных делает возможными не только новые бизнес-модели, подобные этим на Amazon.com, но также предоставляет большие возможности для улучшения принятия решений для государственной политики и международного развития.

Анализ больших объемов социальных данных приводит к полям вычислительной социальной науки. Классические примеры включают изучение содержания СМИ или содержания социальных сетей.

Содержание
  • 1 Развитие социальных данных
  • 2 Веб 2.0 и сайты социальных сетей
  • 3 Деловой сектор и социальные данные
    • 3.1 Социальная коммерция
  • 4 Другое использование социальных данных
    • 4.1 Вычислительные социальные науки
  • 5 Вопросы конфиденциальности
  • 6 Международное развитие
  • 7 Типы данных
    • 7.1 Слова
    • 7.2 Местоположение
    • 7.3 Природа
    • 7.4 Поведение
  • 8 См. Также
  • 9 Ссылки
Развитие социальных данных

Каждая интернет-активность оставляет после себя следы данных (цифровой отпечаток ), которые могут использоваться, чтобы узнать больше о пользователе. Поскольку использование Интернета становится все более распространенным, датафикация мира быстро прогрессирует: в настоящее время создается около 16 зеттабайт данных в год, а к 2025 году ожидается 163 зеттабайта данных. Это привело к тому, что данные стали критически важным товаром. Это связывает воедино всех субъектов общества: государственные учреждения, частные фирмы, а также отдельных лиц, каждый из которых уникальным образом полагается на данные.

Правительства на протяжении веков собирали данные, чтобы обеспечить непрерывность институциональных систем, ограничивая риск невыполнения обязательств по кредитам, собирая налоги на основе дохода и предоставляя необходимую инфраструктуру с учетом интересов своих граждан. 'демографическое распределение. Вначале эти данные включали в себя письменную информацию для ведения учета и контроля, включая систему переписи.

Этот аналоговый процесс был очень трудоемким и затратным, оставляя мало места для интерпретации больших наборов данных. Между тем, корпоративные технологические разработки переместили эти офлайн-данные в цифровую эпоху, что позволило визуализировать и анализировать данные. В публичной сфере объединение методологий опросов и опросов с вычислением баз данных привело к возможности собирать и хранить большие наборы данных по отдельным лицам.

Web 2.0 и сайты социальных сетей

За последнее За несколько десятилетий Интернет перешел от использования в основном как источника информации о мире к использованию в основном для общения, пользовательского контента, обмена данными и построения сообщества. Это то, что многие считают развитием социальных сетей «Web 2.0 », таких как Facebook и YouTube, которые являются основой развития Web 2.0 и переход к совместному использованию социальных данных.

Ранними примерами веб-сайтов с социальными данными являются Craigslist и списки желаний Amazon.com. Оба позволяют пользователям передавать информацию любому, кто ее ищет. Они отличаются своим подходом к идентичности. Craigslist использует силу анонимности, в то время как Amazon.com использует силу постоянной идентичности, основанную на истории отношений клиента с фирмой. Рынок вакансий формируется даже благодаря информации, которую люди делятся о себе на таких сайтах, как LinkedIn и Facebook.

Примерами более сложных сайтов социальных данных являются Twitter и Facebook.. В Twitter отправить сообщение или твит так же просто, как отправить текстовое SMS-сообщение. Twitter сделал этот C2W клиентом для всего мира: любой твит, отправленный пользователем, потенциально может быть прочитан всем миром. Facebook фокусируется на взаимодействии между друзьями, C2C на традиционном языке. Он предоставляет множество способов сбора данных от пользователей: «отметить » друга на фотографии, «прокомментировать» то, что они опубликовали, или просто «поставить лайк». Эти данные являются основой сложных моделей отношений между пользователями. Их можно использовать для значительного повышения релевантности того, что демонстрируется пользователю, и в рекламных целях.

К 2009 году популярность сайтов социальных сетей выросла в четыре раза по сравнению с тем, что это было в 2005 году. По состоянию на 2013 год у Twitter более 250 миллионов пользователей, которые делятся почти 500 миллионами твитов в день, а у Facebook более миллиарда пользователей по всему миру.

Бизнес-сектор и социальные данные

Компании часто используют данные, которые передаются через сайты социальных сетей и другие формы обмена данными, рекламодателей и т. Д. Сайты социальных сетей, например, могут продавать пользовательские данные рекламодателям и другим организациям, которые затем могут влиять на решения потребителей.. Интеллектуальный анализ данных также используется для сбора этой информации.

Хотя веб-сайты и другие приложения были источником этого сбора данных, с развитием технологий многие устройства, которые используются в повседневной жизни, имеют способность собирать данные о физических лицах и, следовательно, увеличение количества доступных персональных данных (например, смартфоны, технические часы, музыкальные устройства и т. д.).

Этот рост цифровой идентичности людей - информации, доступной из этих электронных источников - используется компаниями и организациями для улучшения продуктов и услуги и снизить затраты, ориентируясь на то, что потребители хотят / ожидают. Данные, которые могут быть собраны, могут включать впечатления от покупок, предпочтения в социальных сетях, демографическую информацию и т. Д.

Использование этих данных позволяет улучшить персонализацию продуктов и стало ожидаемым и жизненно важным аспектом использования и производства продуктов. Доступные данные о потребителях могут быть использованы для определения моделей поведения потребителей. Например, информация о местоположении используется для оценки того, когда и где потребители собираются таргетировать рекламу и рекламные акции, исходя из того, в какие магазины собираются потребители. Интернет-магазины также получили представление о том, как лучше персонализировать процесс покупок в Интернете с помощью данных, собранных во время онлайн-транзакции.

Компании могут даже использовать данные о потребителях, чтобы определить, влияет ли различное расстояние между полками продуктов на их решения о покупке. а также оценить потенциальные возможности межпунктового маркетинга на основе товаров, часто покупаемых вместе.

Социальная коммерция

Хотя компании и рекламодатели часто пользуются доступными данными о потребителях, потребители также используют данные других пользователей. информация для принятия решения о покупке. Сайты социальной коммерции - это сайты, на которых потребители делятся впечатлениями о продуктах / услугах, мнениями и другой информацией. Известный пример такого сайта - Pinterest, у которого более 100 миллионов пользователей. Эти сайты и другие онлайн-источники информации о продуктах / брендах влияют на решения потребителей о покупке. По оценкам, около 67% онлайн-клиентов используют эту информацию при принятии решения о покупке. Эти сайты создают среду, которой потребители доверяют, поскольку информация поступает от других потребителей.

Другое использование социальных данных

Имея огромное количество доступных данных о людях, Возможности использования этой информации растут.

Сектор здравоохранения может найти множество потенциальных применений для этих данных. Информация, собранная из социальных сетей и других источников обмена социальными данными, может использоваться для прогнозирования гриппа, вспышек заболеваний, мер реагирования на чрезвычайные ситуации и многого другого. Используя Twitter и геотеги, медицинские исследователи могут оценить состояние здоровья в конкретном районе и использовать эту информацию для улучшения охвата населения и предоставления услуг. Medtronic разработала цифровой глюкометр, который позволяет медицинским работникам и пациентам знать о низких уровнях.

Социальные данные также могут использоваться для оценки реакции на кризисы. После урагана «Сэнди» исследователи использовали Twitter, чтобы оценить эмоции и проблемы, с которыми столкнулись пострадавшие. Эта информация потенциально может быть использована, чтобы помочь лучше подготовиться к будущим кризисам и отреагировать на них.

Эти данные могут быть использованы при городском планировании. Город Бостон использовал информацию о пассажирах из Uber для улучшения планирования перевозок и содержания дорог.

Вычислительные социальные науки

Использование социальных данных для исследований целей привело к развитию вычислительной социальной науки. Вычислительная социальная наука объединяет социальные науки, информатику и сетевую науку. Эта область возникла в 2009 году. До появления социальных данных и технологических достижений, которые поддерживали их, исследователи были ограничены узким взглядом на информацию, основанную на отдельных лицах, поскольку их основная форма исследования основывалась на интервью. Благодаря огромному количеству социальных данных, доступных сегодня, исследователи могут анализировать более широкую группу и получать более широкое представление об информации. Они могут использовать социальные сети, данные сотовых телефонов и проводить онлайн-эксперименты, которые позволяют им собирать больше информации, чем раньше.

Проблемы конфиденциальности

С объемом данных о людях, доступных из многих источников, конфиденциальность стала серьезной проблемой. Нарушения безопасности информации о клиентах и ​​другой социальной информации, такие как компрометация информации о кредитных картах более 56 миллионов клиентов Home Depot, повлияли на проблему конфиденциальности социальных данных. То, как компании используют собранную личную информацию, и возможное злоупотребление ею, беспокоит большинство потребителей. Несмотря на это, многие люди не знают, как сайты социальных сетей и другие источники используют и продают их данные. В исследовании 2014 года только 25% онлайн-пользователей знали, что к их местоположению можно получить доступ, и только 14% знали, что их история веб-серфинга может быть доступна и опубликована.

Несмотря на то, что забота о конфиденциальности является критическим фактором для людей обмен личной информацией в Интернете и общее участие в Интернете, большинство людей готовы поделиться этой информацией, если выгода от этого перевешивает потенциальные затраты на конфиденциальность и безопасность. Потребители получают удовольствие от персонализации продуктов и услуг, которая возможна благодаря сбору такой информации, и, несмотря на опасения, продолжают их использовать.

Международное развитие

«С точки зрения макроэкономики ожидается, что большие данные -информированное принятие решений окажет такое же положительное влияние на эффективность и продуктивность, как и ИКТ в последнее десятилетие ».

— Hilbert 2013

В своем исследовании революции данных в международном развитии Мартин Гильберт утверждал, что естественный следующий шаг от информационных обществ, подпитываемых ИКТ, с конца 1990-х годов общества знаний получают информацию с помощью анализа больших данных. Принятие решений на основе анализа больших данных повысило как эффективность, так и производительность в развитых странах. Гильберт исследует проблемы и потенциал революции данных в «неуправляемом мире международного развития».

Типы данных

Гильберт выделил четыре типа данных, доступных в больших количествах к 2013 году: слова, местоположение, характер и поведение.

Слова

Индивидуальные взаимодействия с Интернетом, такие как слова в комментариях, сообщения в социальных сетях и объемы поисковых запросов Google, являются все более крупным источником больших данных.. Обычно статистические данные генерируются посредством переписи или вероятностного обследования, например, (ASEC), Current Population Survey (CPS), American Community Survey (ACS), National Опрос о состоянии здоровья (NHIS) в США или административные записи, такие как платежная ведомость, безработица, подоходные налоги социального страхования, данные сканера и данные кредитной карты, а также другие записи коммерческих транзакций.

«Google проанализировал кластеры поиска термины по регионам в Соединенных Штатах, чтобы прогнозировать вспышки гриппа быстрее, чем это было возможно с использованием записей о госпитализации ».

— Shaw 2014« Почему «большие данные» - это большое дело »

Профессор Университета Уэзерхеда Гэри Кинг описал революцию не только в отношении количества доступных данных, но и в способности что-то делать с данными на благо общества.

Местоположение

Глобальная система позиционирования (GPS) -поддерживаемые мобильные планшеты, телефоны, Чипы радиочастотной идентификации (RFID) (часть Автоматическая идентификация и d ata capture (AIDC), телематика, игры на основе определения местоположения и т. д. предоставляют данные об абсолютном местоположении и относительном перемещении.

Природа

Гильберт относит данные о естественных процессах к категории «Природа», которая включает датчики, которые предоставляют данные о влажности воздуха и температуре.

Поведение

Данные могут быть получены на основе поведения пользователей в многопользовательских онлайн-играх, таких как League of Legends, World of Warcraft, Minecraft, Call of Duty и Dota 2. Натан Игл, ученый-компьютерщик из Института Санта-Фе в Нью-Мексико, начал использовать мобильные телефоны в начале 2000-х годов для сбора точных крупномасштабных данных о реальных социальных взаимодействиях. MIT Technology Review.

назвал этот проект одной из «10 технологий, которые, скорее всего, изменят наш образ жизни». См. Также
Ссылки
Последняя правка сделана 2021-06-08 07:48:45
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте