Проблема Сканторпа

редактировать
Проблема с ненормативной лексикой в ​​Интернете

Пример проблемы Сканторпа в Википедии из-за регулярное выражение соответствие

Проблема Сканторпа заключается в непреднамеренной блокировке веб-сайтов, электронной почты, сообщений на форуме или результатов поиска с помощью спам-фильтра или поисковой системе, поскольку их текст содержит строку букв, которые имеют непристойное или иное неприемлемое значение. Имена, сокращения и технические термины чаще всего упоминаются как затронутые проблемой.

Проблема возникает из-за того, что компьютеры могут легко идентифицировать строки текста в документе, но для интерпретации слов такого рода требуется значительная способность интерпретировать широкий диапазон контекстов, возможно, во многих культурах, что является чрезвычайно сложной задачей. В результате общие правила блокировки могут привести к ложным срабатываниям, затрагивающим невинные фразы.

Содержание

  • 1 Происхождение и история
  • 2 Другие примеры
    • 2.1 Отказ от имен веб-доменов и регистрации учетных записей
    • 2.2 Заблокированный поиск в Интернете
    • 2.3 Заблокированные электронные письма
      • 2.3.1 Блокировка по словам с двумя значениями
    • 2.4 Повреждены новостные статьи
    • 2.5 Другое
  • 3 См. также
  • 4 Ссылки
  • 5 Внешние ссылки

Происхождение и история

Проблема была названа в честь инцидент в 1996 году, когда фильтр ненормативной лексики AOL не позволил жителям города Сканторп, Северный Линкольншир, Англия, создать учетные записи в AOL, поскольку name содержит подстроку "cunt ". В начале 2000-х годов фильтры Google SafeSearch, по-видимому, совершили ту же ошибку, не позволив людям искать местные предприятия или URL-адреса, в именах которых был Сканторп.

Другие примеры

Ошибочные решения фильтров нецензурной лексики включают:

отказ в регистрации веб-доменных имен и учетных записей

  • В апреле 1998 года Джефф Голд попытался зарегистрировать доменное имя shitakemushrooms.com, но из-за дерьма с подстроками он был заблокирован фильтром InterNIC, запрещающим «семь грязных слов », который был активен между 1996 и передача управления ICANN в 1998 г. (Шитаке - от японского названия съедобного гриба Lentinula edodes.)
  • В 2000 г. в новостях канадского телевидения на программное обеспечение веб-фильтрации обнаружило, что веб-сайт Городского сообщества Монреаля (Communauté urbaine de Montréal, на французском языке) был полностью заблокирован, поскольку его доменное имя было его французской аббревиатурой CUM ( www.cum.qc.ca); «cum » (среди других значений) - это англоязычный сленг для спермы.
  • . В феврале 2004 года в Шотландии Крейг Кокберн сообщил, что не может использовать свою фамилию (произносится «Кобурн») с помощью Hotmail. Отдельно у него были проблемы с электронной почтой на рабочем месте, потому что его должность, специалист по программному обеспечению, содержала подстроку Сиалис, лекарство от эректильной дисфункции, обычно включаемое в спам электронные письма. Hotmail сначала сказал ему написать свое имя C0ckburn (с нулем вместо буквы «o»), но позже отменил запрет. В 2010 году у него была аналогичная проблема с регистрацией на веб-сайте BBC, где снова первые четыре символа его фамилии вызвали проблему для фильтра содержимого.
  • В феврале 2006 года Линде Каллахан изначально не разрешили зарегистрировать свое имя в Yahoo! в качестве адреса электронной почты, поскольку он содержит подстроку Allah. Yahoo! позже отменил запрет.
  • В июле 2008 года д-р Герман И. Либшиц не смог зарегистрировать адрес электронной почты, содержащий его имя от Verizon, потому что его фамилия содержала подстроку shit, а Verizon изначально отклонил его просьбу об исключении. В последующем заявлении пресс-секретарь Verizon извинилась за то, что не утвердила его желаемый адрес электронной почты.
  • В августе 2018 года Натали Вайнер сообщила в социальных сетях, что не может создать для себя учетную запись на веб-сайте, потому что ее фамилия также слово, используемое на сленге для пенис. Сообщается, что «сотни» людей ответили, что это коснулось и их. Имена ответивших включали Бен Шмук (фамилия слово на идише для «пениса») и Арун Дикшит (фамилия санскрит для того, кто преподает или предоставляет знания, содержащие подстрока говно). В статьях, посвященных этому вопросу, говорилось, что это обычная и чрезвычайно сложная техническая проблема, для которой в настоящее время не существует надежного решения.

Заблокированный поиск в Интернете

  • В месяцы, предшествовавшие январю 1996 года, некоторые веб-поиски по запросу Super Bowl XXX были фильтруется, потому что римская цифра для игры и сайта (XXX) также используется для идентификации порнографии.
  • Gareth Roelofse, веб-дизайнер для RomansInSussex.com, В 2004 году было отмечено, что «мы обнаружили, что многие станции библиотечной сети, школьные сети и интернет-кафе блокируют сайты со словом« секс »в доменном имени. Это было проблемой для RomansInSussex.co.uk, поскольку его целевая аудитория - школьники».
  • В 2008 году фильтр бесплатного беспроводного доступа в городе Факатане в Новой Зеландии блокировал поиски, содержащие собственное название города, потому что фонетический анализ фильтра считал " whak "звучать как ебать; название города на языке маори, а на языке маори «wh» чаще всего произносится как «f». Впоследствии город поместил название города в белый список фильтра.
  • В июле 2011 года веб-поиски в Китае по имени Цзян были заблокированы после заявлений на Sina Weibo сайт микроблогов о том, что бывший генеральный секретарь коммунистической партии Китая Цзян Цзэминь умер. Поскольку слово «Цзян», означающее «река», написано одним и тем же китайским иероглифом (江), поиски, связанные с реками, включают Янцзы (Cháng Jiāng ) появилось сообщение «Согласно соответствующим законам, постановлениям и политикам результаты этого поиска не могут быть отображены».
  • В феврале 2018 года поиск в Интернете на торговой платформе Google был заблокирован для таких товаров, как клей guns, Guns N 'Roses и Burgundy после того, как Google в спешке исправил свою поисковую систему, которая отображала результаты для оружия и аксессуаров, нарушающих заявленные политики Google.

Заблокированные электронные письма

  • В 2001 году Yahoo! Mail представил фильтр электронной почты , который автоматически заменил JavaScript -связанные строки альтернативными версиями, чтобы предотвратить возможность появления вирусов JavaScript в HTML-сообщениях.. Фильтр переносит термины «Javascript», «Jscript », «Vbscript "и" Livescript "; и заменил "eval ", "mocha" и "выражение " аналогичными, но не совсем синонимичными термины «обзор», «эспрессо» и «выписка» соответственно. При написании фильтров использовались предположения: не было предпринято никаких попыток ограничить эти замены строк разделами и атрибутами script или соблюдать границы слов, в случае, если это оставит некоторые лазейки открытым. Это привело к таким ошибкам, как medireview вместо средневекового.
  • . В феврале 2003 года члены парламента в британской палате общин обнаружили, что новый спам-фильтр блокирует имейлы. Он заблокировал электронные письма, содержащие ссылки на обсуждаемый в то время законопроект о сексуальных преступлениях, а также некоторые сообщения, касающиеся консультационного документа либерал-демократа о цензуре. Он также блокировал электронные письма, отправленные на валлийском языке, поскольку не распознавал этот язык.
  • В октябре 2004 года сообщалось, что Музей Хорнимана в Лондоне не мог получить некоторые из своих электронных писем. -mail, потому что фильтры ошибочно интерпретировали его имя как версию слов «рогатый мужчина». Возбужденный - это распространенный жаргонный термин для обозначения сексуального возбуждения.
  • Проблемы могут возникнуть со словами социализм, социалист и специалист, потому что они содержат подстроку Сиалис. При блокировке слова «специалист» блокируются отправленные по электронной почте резюме и curricula vitarum и другие материалы, включая описания должностей.

Заблокировано для слов с двумя значениями

  • В октябре 2004 г. - электронные письма с рекламой пантомимы Дика Уиттингтона, отправленные учителем из Норвича в Великобритании, блокировались школьными компьютерами из-за использования имени Дик, которое иногда используется как сленг для пенис.
  • В мае 2006 года мужчина в Манчестере в Великобритании обнаружил, что электронные письма, которые он писал в местный совет с жалобой на заявку на планирование, были заблокированы, поскольку в них содержалось слово эрекция при ссылке на структуру.
  • Заблокированные электронные письма и поиск в Интернете, относящиеся к The Beaver, журналу, базирующемуся в Виннипеге, вынудили издателя изменить свое название на История Канады в 2010 году, после 89 лет публикации. Издатель Дебора Моррисон прокомментировала: «Еще в 1920 году Бобр был совершенно подходящим названием. И хотя другое его значение [vulva ] не ново, его двусмысленность стала представлять собой совершенно новую проблему с развитием Интернет. Имя стало препятствием для нашего роста ».
  • В июне 2010 года Twitter заблокировал пользователя из Люксембурга через 29 минут после того, как он открыл свой аккаунт и опубликовал свой первый твит. В твите говорилось: «Наконец-то! В мой скворечник засела пара больших синиц (Parus major)! ». Несмотря на латинское название, указывающее на то, что твит был о птицах, любые попытки разблокировать аккаунт были тщетными.
  • В 2011 году член совета Дадли обнаружил письмо, помеченное как ненормативная лексика. программой безопасности его совета после упоминания блюда Black Country, педиков (разновидность фрикадельки, но также уничижительный термин для гомосексуалистов).
  • Жителям Пенистона в Южном Йоркшире заблокировали электронную почту, потому что в названии города есть подстрока пенис.
  • Лайтвотер в Суррее пострадали точно так же, потому что его имя содержит подстроку twat.
  • Жителям Clitheroe (Ланкашир, Англия) неоднократно причиняли неудобства, потому что в названии их города есть подстрока clit, которая является сокращением от "clitoris ".
  • Résumés выпускников magna cum laude были заблокированы спам-фильтрами из-за включения слова cum, которое на латыни означает with (в данном случае), но иногда используется как sla ng для спермы на английском языке.

Повреждены новостные статьи

  • В июне 2008 года новостной сайт, управляемый Американской семейной ассоциацией, отфильтровал Associated Press статья о спринтере Тайсоне Гее, где слова «гей» заменены на «гомосексуалист », в результате чего его имя передается как «Тайсон-гомосексуалист».
  • Слово или строка «ass» может быть заменено на «butt», в результате чего «clbuttic» означает «классический» и «buttbuttinate» означает «убийство».

Другое

  • В ноябре 2013 года британский Facebook временно заблокировал пользователей за использование слова fagot в отношении блюда педик.
  • . В январе 2014 года файлы, используемые в онлайн-игре League of Legends, были заблокированы некоторыми фильтрами британских интернет-провайдеров из-за имен 'VarusExpirationTimer.luaobj' и 'XerathMageChainsExtended.luaobj', содержащие буквы, используемые в слове "секс".
  • В мае 2018 года веб-сайт продуктового магазина Publix не разрешал торт на заказ, содержащий латинскую фразу с отличием. Заказчик попытался решить проблему, добавив специальные инструкции, но все равно получил торт с надписью «Summa --- Laude».
  • В мае 2020 года, несмотря на тщательную проверку СМИ, некоторые хэштеги напрямую относились к британскому политическому советнику. Доминик Каммингс не смог отслеживать тренд в Twitter, потому что подстрока cum в фамилии Каммингс активировала антипорнфильтр Twitter.
  • В октябре 2020 г. фильтр ненормативной лексики запретил слово «кость» на конференции палеонтологии.

См. также

Ссылки

Внешние ссылки

Последняя правка сделана 2021-06-07 07:03:10
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте