Интернет-лингвистика

редактировать

Интернет-лингвистика - это область лингвистики, которую защищает английский лингвист Дэвид Кристал. Он изучает новые языковые стили и формы, которые возникают под данной областью Интернета и других новых медиа, таких как Служба коротких сообщений (SMS) текстовые сообщения. С момента появления встречи человека и компьютера (HCI), ведущего к компьютерной связи (CMC) и Интернет-опосредованной связи (IMC), экспертов, таких как Гретхен МакКаллох признали, что лингвистика играет в этом важную роль с точки зрения веб-интерфейса и удобства использования. Изучение нового языка в Интернете может помочь улучшить концептуальную организацию, перевод и удобство использования в Интернете. Такое исследование нацелено на то, чтобы принести пользоваться как лингвистам, так и пользователям Интернета, вместеым.

Изучение интернет-лингвистики может происходить по четырем основным направлениям: социолингвистика, образование, стилистика и прикладная лингвистика. Развитие в результате дальнейшего технического прогресса, включая развитие Интернета , корпус, распространение и влияние стилистических вариаций, порожденных распространением Интернета, через СМИ и через литературные произведения. Ввиду растущего числа пользователей, подключенных к Интернету, лингвистическое будущее еще предстоит определить, как появляются новые компьютерные технологии и люди адаптируют свои языки для соответствия этим новым средствам массовой информации. Интернет продолжает играть роль людей в поощрении использования языков.

Содержание
  • 1 перспективы
    • 1.1 Социолингвистическая перспектива
      • 1.1.1 Темы
    • 1.2 Образовательная перспектива
    • 1.3 Стилистическая перспектива
      • 1.3.1 Мобильные телефоны
      • 1.3.2 Блоги
      • 1.3.3 Виртуальные миры
      • 1.3.4 Электронная почта
      • 1.3.5 Обмен мгновенными сообщениями
    • 1.4 Прикладная перспектива
      • 1.4.1 Документация по языку
      • 1.4.2 Возрождение языка
      • 1.4.3 Использование Интернета
  • 2 Измерения
    • 2.1 Интернет как корпус
      • 2.1.1 Темы
      • 2.1.2 Британский национальный корпус
      • 2.1.3 Многоязычный Интернет
      • 2.1.4 Проблемы
      • 2.1.5 Представление
    • 2.2 Влияние и влияние
      • 2.2. 1 СМИ
  • 3 Лингвистическое будущее Интернета
  • 4 См. Также
  • 5 Ссылки
  • 6 Дополнительная литература
Основные

Дэвид Кристал определил четыре основные перспективы для дальнейшего - социолингвист Иная перспектива, образовательная перспектива, стилистическая перспектива и прикладная перспектива. Четыре точки зрения взаимосвязаны и друг на друга.

Социолингвистическая перспектива

Эта точка зрения касается того, как рассматривает влияние развития Интернета на языки. Появление произвело революцию в коммуникации во многих отношениях; он изменил способ общения людей и создал новые платформы с далеко идущим социальным воздействием. Важные возможности включают, помимо прочего, текстовые SMS-сообщения, электронную почту, чат-группы, виртуальные миры и Интернет.

Эволюция Использование этих новых средств коммуникации вызвало серьезную озабоченность в отношении метода использования языка. Согласно Кристаллу (2005), эти опасения не беспочвенны и известны в истории - они возникают почти всегда, когда новый технологический прорыв влияет на языки; как видно в 15 веке, когда печатание было введено в 19 веке, когда был изобретен телефон, и в 20 веке, когда радиовещание начало проникать в наше общество. 51>

На личном уровне CMC, например текстовые SMS-сообщения и мобильная электронная почта (push mail ), значительно улучшили мгновенную связь. Некоторые примеры включают iPhone и BlackBerry.

. В школах нередко преподаватели и учащиеся получают персональные школьные учетные записи электронной почты для общения и взаимодействия. Классные обсуждения все чаще переносятся в Интернет в форме дискуссионных форумов. Например, в Технологическом университете Наньян студенты участвуют в совместном обучении на портале университета - edveNTUre, где они участвуют в обсуждениях на форумах и в онлайн-викторинах, а также просматривают потоковые подкасты, подготовленные их курсов, в частности, преподавателями курсов. iTunes U в 2008 году начал сотрудничать с университетами, превратив музыкальный сервис Apple в магазин, который бесплатно предоставляет академические лекции и учебные материалы - они стали вместе более 600 учреждений в 18 странах, включая университеты Оксфорд, Кембридж и Йель.

Эти формы академических социальных сетей и средств массовой информации будут развиваться как преподаватели из всех стран. во всем мире продолжают искать новые способы более активного вовлечения студентов. Для Нью-Йоркского университета обычным делом является общение с «приглашенными докладчиками, которые взвешиваются с помощью Skype, сотрудники библиотеки поддерживают поддержку с помощью обмена мгновенными сообщениями, а получают доступ к библиотеке за пределами кампуса ». Это повлияет на использование языка по мере того, как учащиеся и преподаватели начнут использовать все больше этих платформ CMC.

На уровне компании часто используют свои компьютеры и ноутбуки, подключенные к Интернету. (через проводное и беспроводное подключение к Интернету ), а также для сотрудников иметь индивидуальные учетные записи электронной почты. Это значительно облегчает внутреннее (среди сотрудников компании) и внешнее (с другими сторонами за пределами организации) общение. Мобильная связь, такая как смартфоны, все больше проникает в корпоративный мир. Например, в 2008 году Apple объявила о своем намерении активизировать свои усилия, чтобы помочь интегрировать iPhone в свою корпоративную среду, чему способствовали технологии разработки интегрированных функций (push-электронная почта, календарь и управление контактами) с помощью ActiveSync.

В целом, эти новые ОМЦ, которые стали возможными благодаря Интернету, изменили способ использования языка людьми - повысилась неформальность и, как следствие, растут опасения, что он плохо использует. Однако, как выразился Дэвид Кристал, их следует рассматривать в позитивном ключе, поскольку они отражают силу творческого языка.

Темы

Социолингвистику Интернета можно также исследовать через пять взаимосвязанных тем.

  1. Многоязычие - Рассматривается распространенность и статус различных языков в Интернете.
  2. Изменение языка - С социолингвистической точки зрения на изменение языка влияют физические технологии ограничения (например, печатный текст) и меняющиеся социально-экономические приоритеты, такие как глобализация. В нем исследуются лингвистические изменения с течением времени, акцентом на Интернет-жаргон.
  3. Дискурс разговора - Исследуются изменения в моделях социального взаимодействия и коммуникативной практики в Интернете.
  4. Распространение стилистики - Он включает изучение распространения интернет-жаргонов и связанных с ними языковых форм в обычном употреблении. По мере изменения языка разговорный дискурс и стилистическое распространение пересекаются с аспектом языковой стилистики.
    См. Ниже: Стилистическая перспектива
  5. Метаязык и народная лингвистика - включает рассмотрение того, как эти лингвистические и изменения в Интернете обозначаются и обсуждаются (например, влияние интернет-жаргона привело к «смерти» »Апострофа и потере заглавных букв.)

Образовательная перспектива

Образовательная перспектива Интернет-лингвистики исследует влияние на формальный язык использовать, в частности, Стандартный английский, что, в свою очередь, влияет на языковое образование. Рост и быстрое распространение использования Интернета: введение к появлению новых лингвистических функций, характерных только для Интернет-платформы. К ним относятся, помимо прочего, более широкое использование неофициальной письменной речи, несоответствие письменных стилей и стилистики, а также сокращений в интернет-чатах и ​​обмене текстовыми SMS-сообщениями, где технологические ограничения количества слов способствовало появлению новых сокращений. Такие аббревиатуры существуют в основном по основным практическим соображениям - чтобы сократить время и усилия, необходимые для общения через эти носители, дополнительные технологические ограничения. Примеры распространенных аббревиатур: lol (для громкого смеха; общее выражение смеха), omg (о боже) и gtg (нужно идти).

Образовательная перспектива была в степени определена в исследовании влияния Интернета на языковое образование. Это важный и решающий аспект, как он влияет на обучение нынешнего и будущих поколений студентов правильного и своевременного использования неформального языка в результате использования Интернета. Использование случайных слов, таких как «парень», или выбор слова «препятствовать» вместо «предшествовать» в научных статьях. студентами. Также есть проблемы с орфографией и грамматикой, которые чаще всего встречаются в академических работах учащихся, как отмечают преподаватели, наиболее распространенными такими сокращениями, как «u» для «вы» и «2» для «to».

Лингвисты и профессора, такие как Элеонора Джонсон, подозревают, что широко распространенные ошибки используются через Интернет, где преподаватели аналогичным образом сообщают о новых орфографических и грамматических ошибок в студенческих работах. Однако нет научных доказательств, подтверждающих предполагаемую связь. Наоми С. Барон (2008) утверждает в Always On, что студенческие труды мало влияют на использование Интернет-опосредованных (IMC), такое как интернет-чат, текстовые SMS-сообщения и электронная почта. Исследование, опубликованное в 2009 г. в Британском журнале психологии развития, показало, что учащиеся, которые регулярно писали текстовые сообщения (отправляли сообщения через SMS с помощью мобильного телефона), использовали более широкий словарный запас, и это может положительно повлиять на их развитие чтения.

Использование Интернет-методов использования методов стилистики неприемлемой для академического и формального использования языка, использования Интернета может не препятствовать языковому образованию, а, наоборот, ему. Интернет разными способами доказал, что может быть потенциальные преимущества в улучшении языка, особенно при изучении второго иностранного языка. Языки через Интернет в связи с Интернет-лингвистикой, наиболее широкое применение через аспект общения (использование электронной почты, дискуссионных форумов, чатов, блогов и т. Д.). IMC обеспечивает более тесное взаимодействие между изучающим языком и носителями языка, обеспечивает большее исправление ошибок и лучшие возможности изучения стандартного языка, в процессе позволяя приобретать навыки, такие как переговоры и убеждение.

Стилистическая перспектива

Эта перспектива исследует, как Интернет и связанные с ним технологии способствовали развитию новых и различных форм творчества на языке, особенно в литературе. Он рассматривает Интернет как среду, посредством которой возникли новые языковые явления. Этот новый способ языка интересно изучать, потому что он представляет собой смесь устного и письменного языков. Например, традиционное письмо статично по с динамической природой нового языка в Интернете, где слова могут быть на экране компьютера в разных цветах и ​​размерах шрифта. Тем не менее, этот новый способ языка также содержит другие элементы, которых нет на естественных языках. Одним из примеров концепции кадрирования, встречающаяся в электронной почте и на дискуссионных форумах. Отвечая на электронные письма, люди обычно используют электронное сообщение отправителя фрейм для написания своих сообщений. Они могут выбрать ответ на часть сообщения электронной почты, оставив при этом другие части. На дискуссионных форумах можно начать новую беседу, и любой независимо от своего физического местоположения, может ответить на идею или мысль, высказанную через Интернет. Это то, что обычно не встречается в письменной речи.

Будущие исследования также включают новые разновидности, различные технологии, постоянно, и их влияние не только на письменные языки, но и на их устные формы. Коммуникативный стиль Интернет-языка лучше всего прослеживается в канале CMC ниже, как часто предпринимаются попытки преодолеть технологические ограничения, такие как задержки во времени передачи, и восстановить социальные сигналы, которые часто расплывчаты в письменном тексте.

Мобильные телефоны

Мобильные телефоны (также называемые сотовыми телефонами) обладают мощным потенциалом, выходящим за рамки их основных коммуникативных функций. Это можно увидеть на конкурсе поэзии с текстовыми сообщениями, например, проводимом The Guardian. Ограничение в 160 символов, наложенное мобильным телефоном, побудило пользователей проявить свои лингвистические способности, их преодолеть. Аналогичным примером новой технологии является ограничение символов Twitter, который имеет ограничение в 280 символов. Были споры о том, являются ли эти новые сокращенные формы, представленные в твитах пользователей «ленивыми», или они являются творческими фрагментами общения. Несмотря на продолжающиеся дебаты, нет никаких сомнений в том, что Twitter внес свой вклад в лингвистический ландшафт новыми языками, а также открыл новое измерение общения.

Сотовый телефон также создал новый литературный жанр - романы на сотовом телефоне. Типичный роман на сотовом телефоне состоит из нескольких глав, читатели скачивают небольшие партии. Эти романы находятся в «сырой форме», поскольку они не проходят процесс редактирования, как традиционные романы. Они написаны короткими предложениями, похожими на текстовые сообщения. Авторы таких романов также могут получать отзывы и новые идеи от своих читателей по электронной почте или через канал обратной связи в Интернете. В отличие от традиционного романов, идеи иногда включаются в сюжетную линию, или авторы также решают сюжет своего рассказа в зависимости от спроса и использования своего романа (обычно оценивается по количеству просмотров). Несмотря на их популярность, также была критика в отношении романов «недостаток разнообразной лексики» и плохая грамматика.

Блоги

Ведение блогов привело к появлению новых ведения дневников с лингвистической точки зрения., язык, используемый в блогах, - «в его наиболее« голой »форме», публикуемый для всеобщего обозрения без прохождения формального редактирования. Это то, что выделяет блоги, потому что почти все формы печатного языка претерпели те или другие формы редактирования и стандартизации. Дэвид Кристал заяв, что блоги начала нового этапа в эволюции письменности ». Блоги стали популярными, что вышли за рамки письменных блогов с появлением фотоблога, видеоблога, аудиоблога и моблога. Эти разработки в области интерактивного развития блогов приводят к созданию новых лингвистических соглашений и стилей, что в появятся новые.

Виртуальные миры

Виртуальные миры позволяют понять, как адаптируют использование естественного языка для общения в этих новых средах. Интернет-язык, возникший в результате взаимодействия пользователей в текстовых чатах и ​​компьютерных мирах, привел к развитию сленгов в цифровых сообществах. Примеры: pwn и noob. Смайлики - это еще один пример того, как адаптировали различные выражения, чтобы соответствовать ограничениям общения в киберпространстве, одним из «потеря эмоциональности».

Общение в таких нишах, как Ролевые игры (RPG) Многопользовательские домены (MUD) и виртуальные миры очень интерактивны, с упором на скорость, краткость и непосредственность. В результате CMC, как правило, более яркая, летучая, неструктурированная и открытая. Часто наблюдаемая последовательность последовательностей и структур обмена, очевидная в разговорных цепочек и коротких поворотов. Некоторые из используемых стратегий CMC включают использование заглавных букв для таких слов, как EMPHASIS, использование символов, таких как звездочка, для заключения слов, как показано в * ударении *, и творческое использование пунктуации, например ???!?!?!?. Символы также используются для функций дискурса, например звездочка в качестве маркера разговорного ремонта и стрелок и каратов в качестве маркеров deixis и референт. Помимо вклада в эти новые языковые формы, виртуальные миры также используются для обучения языкам. Изучение языка в виртуальном мире предоставляет учащимся моделирование реальной жизни, что позволяет им находить творческие способы улучшить свои языковые навыки. Виртуальные миры - хорошие инструменты для изучения языка среди младших школьников, потому что они уже рассматривают такие места как «естественное место для обучения и игр».

Электронная почта

Один из самых популярных в Интернете Связанные с этим технологии, которые следует изучить с этой точки зрения, - это электронная почта, которая во многих отношениях расширила стилистику языков. Исследование лингвистического профиля электронной почты показало, что существует гибрид стилей речи и письма с точки зрения формата, грамматики и стиля. Электронная почта быстро заменяет традиционное написание писем благодаря своему удобству, скорости и спонтанности. Это часто связано с неформальностью, поскольку кажется временным и легко удаляется. Однако по мере развития этого средства коммуникации электронная почта больше не ограничивается отправкой неформальных сообщений между друзьями и родственниками. Вместо этого деловая переписка все чаще ведется по электронной почте. Соискатели также используют электронную почту для отправки своих резюме потенциальным работодателям. Результатом перехода к более формальному использованию станет среда, представляющая диапазон формальной и неформальной стилистики.

В то время как электронную почту обвиняли в более частом использовании учащимися неформального языка в их письменной работе, Дэвид Кристалл утверждает, что электронная почта «не представляет угрозы для языкового образования», потому что электронная почта с ее набором стилистической выразительности может выступать в качестве области, в которой изучающие язык могут ответственно делать свой собственный лингвистический выбор. Кроме того, высокая склонность молодого поколения к использованию электронной почты может улучшить их письменные и коммуникативные навыки благодаря усилиям, которые они прилагают для формулирования своих мыслей и идей, хотя и с помощью цифровых носителей.

Обмен мгновенными сообщениями

Как и другие формы онлайн-общения, для обмена мгновенными сообщениями также разработаны собственные сокращения и короткие формы. Однако обмен мгновенными сообщениями сильно отличается от электронной почты и чат-групп, поскольку он позволяет участникам взаимодействовать друг с другом в режиме реального времени, разговаривая наедине. Обмен мгновенными сообщениями делает участников еще более знакомыми. Эта повышенная степень близости допускает большую непринужденность в языке и «типографские особенности». Также чаще встречаются стилистические различия, потому что между участниками может быть очень большой разрыв в возрасте. Например, внучка может связаться с бабушкой через мгновенные сообщения. В отличие от чат-групп, где участники объединяются с общими интересами, здесь нет необходимости соответствовать языку.

Прикладная перспектива

Источник: Статистика мира Интернета

Прикладная точка зрения рассматривает лингвистическое использование Интернет с точки зрения его коммуникативных возможностей - хорошие и плохие. Интернет предоставляет платформу, на которой пользователи могут испытать многоязычие. Хотя английский по-прежнему является доминирующим языком в Интернете, число пользователей других языков постепенно увеличивается. Страница Использование Интернета в мире использует некоторую информацию о количестве пользователей по языку, национальности и географии. Эта многоязычная среда продолжает расширяться в разнообразии по мере того, как все больше языковых сообществ подключаются к Интернету. Таким образом Интернет представляет собой платформу, находящиеся под угрозой исчезновения, могут стремиться возродить использование своего языка и / или повысить осведомленность. Это можно увидеть в двух случаях, когда он использует этим языкам возможности для прогресса в двух важных отношениях - языковая документация и возрождение языка.

языковая документация

Во-первых, Интернет облегчает языковая документация. Цифровые архивы средств массовой информации, такие как аудио- и видеозаписи, не только позволяют сохранить языковую документацию, но также позволяют ее глобальное распространение через Интернет. Публичность о языках, находящихся под угрозой исчезновения, таких как Webster (2003), помогла пробудить во всем мире интересной документации.

Такие фонды, как проект Ханса Раузинга по исчезающим языкам (HRELP), финансируемый Аркадия, также помогают развить интерес к лингвистической документации. HRELP - это проект, направленный на документирование языков, под угрозой исчезновения, сохранение и распространение материалов среди других. Собранные материалы доступны в Интернете в программе архива языков, находящихся под угрозой исчезновения (ELAR).

Другие онлайн-материалы, поддерживающие языковую документацию, включая бюллетень Language Archive Newsletter, который предоставляет новости и статьи по темам на темам на исчезающих языках. Интернет-версия Ethnologue предоставляет также краткую информацию обо всех известных языках мира. Делая ресурсы и информацию о языках, находящихся под угрозой исчезновения, языковую документацию в Интернете, он позволяет исследователям использовать эти материалы, следовательно, язык языков, находящиеся под угрозой исчезновения.

Оживление языка

Во-втором, Интернет поставлении языка. На практике используются различные изощренные средства, которые осуществляют виртуальный контакт. От электронной почты, чатов до обмена мгновенными сообщениями - эти виртуальные среды помогли преодолеть расстояние между коммуникаторами электронной почты. Использование электронной почты было принято на языковых курсах для поощрения студентов к общению в различных стилях, как форматы конференций, а также для проведения дискуссий. Точно так же использование электронной почты для возмещения языка в смысле, что носители языка меньшинства, которые используются для общения со своей семьей и другими пользователями, тем самым поддерживая использование родного языка. С развитием и все более широким использованием телефонной широкополосной связи, такой как Skype, возрождение языка через Интернет больше не ограничивается грамотными пользователями.

Гавайские преподаватели используют Интернет в своих языковые программы оживления. Система графических объявлений Leoki (Powerful Voice) была создана в 1994 году. Содержимое, интерфейс и меню системы полностью на гавайском языке. Он установлен во всей системе иммерсивной школы и включает в себя, среди компонентов электронной почты, чата, словаря и онлайн-газеты. В высших учебных заведениях, таких как колледжи и университеты, где система Leoki еще не установлена, преподаватели используют другое программное обеспечение и Интернет-инструменты, такие как Daedalus Interchange, электронную почту и Интернет, связать студентов, изучающих гавайский язык, с более широким сообществом.

Еще одно использование Интернета включает в себя то, что учащиеся, говорящие на языках меньшинств, пишут о родных языках на своих родных языках для удаленной аудитории. Кроме того, в попытке сохранить свой язык и культуру люди, говорящие на окситанском, пользоваться Интернетом, чтобы общаться с другими носителями окситанского языка со всего мира. Эти методы используются для использования языков меньшинств, общаясь на нем. Кроме того, использование цифровых технологий, которые молодое поколение считает «крутыми», привлечет их внимание и в свою очередь, поддержит их интерес и использование их родных языков.

Использование Интернета

См. Также: Судебная лингвистика

Интернет также может быть использован для таких действий, как терроризм, интернет-мошенничество и педофилия. Наблюдается рост преступлений, связанных с использованием Интернета, ретрансляционный чат в Интернете (IRC), поскольку остается анонимным относительно легко. Эти заговоры несут в себе заботу о безопасности и защите. С судебно-лингвистической точки зрения существует множество областей для исследования. Несмотря на то, что разработка чат-комнаты процедура детей на основе поиска поисковых запросов терминов эффективна, все еще существует минимальный лингвистически ориентированный объем литературы для облегчения этой задачи. В других областях присутствует, что Семантическая сеть участвует в таких задачах, как защита личных данных, что помогает предотвратить мошенничество.

Измерения

Параметры, рассматриваемые в этом разделе, включая рассмотрение как совокупности, а также вопросы идентификации и нормализации языка. Влияние интернет-лингвистики на повседневную жизнь исследуется с учетом распространения и влияния интернет-стилистики, тенденций изменений языка в Интернете и разговорного дискурса.

Интернет как корпус

Интернет-огромным резервуаром данных и ресурсов, лингвисты и технологи все чаще обращаются к Интернету за языковыми данными. Корпорации впервые были упомянуты в области компьютерной лингвистики на встрече ACL 1989 года в Ванкувере. Это вызвало много споров, поскольку им не хватает теоретической целостности, что приводит к большому скептицизму их роли в области, до публикации журнала «Использование больших корпусов» в 1993 году, в котором связь между компьютерной лингвистикой и корпусами стала широко признанной.

Чтобы установить, обратиться к определению, установленному McEnery and Wilson (1996, стр. 21).

В принципе, любое собрание более чем одного текста можно назвать корпусом.... Но термин «корпус», когда он используется в контексте современной лингвистики, чаще всего имеет более специфические коннотации, чем дает это простое определение. Их можно рассматривать под четырьмя возникающими заголовками: выборка и репрезентативность, конечный размер, машиночитаемая форма, стандартная справочная информация.

— Тони МакЭнери и Эндрю Уилсон, Corpus Linguistics

Отношение к Интернету как к корпусу, Manning и Schütze (1999, стр. 120) обычное определение:

статистический НЛП [Обработка естественного языка] обычно получают в виде корпуса объем данных из данной интересующей области, не имея любое слово в том, как это слово. В таких случаях наличие большего количества обучающих данных обычно более выгодно, чем любые проблемы баланса, и нужно просто использовать весь доступный текст.

— Кристофер Мэннинг и Хинрих Шютце, Основы статистической обработки языка

Подсчет попаданий был использован для составления поисковых систем определения ранжирования по частотам смыслового значения в качестве входных данных для механизма устранения неоднозначности. Эти методы используются через использование параллельных языков. Было предусмотрено, что можно построить корпус для конкретного языка из одного документа на этом конкретном языке.

Темы

Было много дискуссий о преступках на арене Сеть как корпус. Использование Интернета в качестве источника данных для устранения неоднозначности смысла слов было выдвинуто в рамках проекта EU MEANING в 2002 году. Он основывался на предположении, что внутри домена слова часто имеют одно значение и что домены идентифицируются в Интернете. Это было также изучено с использованием веб-технологий для ручного сбора текстовых аннотаций на веб-сайте Word Expert.

В областях языкового моделирования Использовался для решения проблемы разреженности данных. Лексическая статистика была собрана для разрешения вложений предложенных фраз, а веб-документ использовался для поиска баланса в корпусе.

В области поиска информации веб-трек был интегрирован в качестве компонента в инициативу сообщества по оценке TREC. Образец Интернета, используемый для этого упражнения, составляет около 100 ГБ, в основном в домене верхнего уровня.gov.

Британский национальный корпус

Британский национальный корпус содержит обширную информацию о преобладающих значениях и образцах использования 10 000 слов, составляющих основу английского языка.

Количество слов в Британском национальном корпусе (около 100 миллионов) достаточно для многих эмпирических стратегий изучения языка лингвистами и лексикографами и удовлетворительно технологий, которые используют количественную информацию о поведении слов как ввод (синтаксический анализ).

Однако для некоторых других целей этого недостаточно из-за Zipfian природы частот слов. Используется основная часть лексического запаса в Британском национальном корпусе менее 50 раз, этого недостаточно для статистически стабильных выводов о таких словах. Кроме того, по некоторым более редким словам, редким значениям общеупотребительных слов и сочетаниям слов было найдено каких-либо данных. Исследователи считают, что вероятностные модели языка, основанные на очень больших объемах данных, лучше, чем модели, основанные на более оценках из меньших, чистых наборов данных.

Многоязычный Интернет

Интернет явно представляет собой многоязычный корпус. По оценкам, 71% страниц (453 миллиона из 634 миллионов веб-страниц, проиндексированных движком Excite) были написаны на английском языке, за которым следуют японский (6,8%), немецкий (5,1%), французский (1,8 %), китайский (1,5%), испанский (1,1%), итальянский (0,9%) и шведский (0,7%).

Тест на поисковых словах, таких как «глубокий вдох», выявил 868 631 веб-страницу, содержащую термины в AlltheWeb. Число, найденное с помощью поисковых систем, более чем в три раза большее число, произведенное Британским национальным корпусом, указывает на значительный размер корпуса английского языка, доступного в сети.

Огромный размер текста, доступного в сети, можно увидеть при анализе контролируемых данных, в которых корпуса разных языков были смешаны в различных пропорциях. По оценке AltaVista объем Интернета в словах, английский язык возглавлял список с 76 598 718 000 слов. Следующим идет немецкий язык, содержащий 7 035 850 000 слов, а также 6 других языков с более чем миллиардом обращений. Даже на языках с меньшим количеством посещений в Интернете, таких как словенский, хорватский, малайский и турецкий, в Интернете более ста миллионов слов. Это свидетельствует о потенциальной силе и точности использования Интернета в качестве Корпуса, учитывая его значительный размер, что требует проведения дополнительных исследований, таких как проект, который в настоящее время выполняется Британским национальным корпусом для использования его масштаба.

Проблемы

В областях языкового моделирования существуют ограничения на применимость любой языковой модели, поскольку статистика для разных типов текста будет разной. Когда приложение языковой технологии вводится в действие (применяется к новому типу текста), нет уверенности, что языковая модель будет работать так же, как при применении к корпусу обучения. Обнаружено, что при изменении обучающего корпуса производительность модели существенно различается. Отсутствие теоретических типов ограничивает оценку полезности работы по языковому моделированию.

Поскольку веб-тексты легко создавать (с точки зрения затрат и времени), и над ними работают много разных авторов, часто мало внимания уделяется точности. Грамматические и типографские ошибки считаются «ошибочными» формами, из-за которых Интернет становится грязным корпусом. Тем не менее, это может быть полезно даже с некоторым шумом.

Вопрос о том, следует ли включать подъязыки, остается нерешенным. Его сторонники утверждают, что удаление всех подъязыков приведет к обеднению представления о языке. Поскольку язык состоит из лексиконов, грамматики и большого количества различных подъязыков, их следует включить. Однако только недавно это стало жизнеспособным вариантом. Поиск компромисса путем включения некоторых подъязыков является спорным, потому что это произвольный вопрос, что включать, а какие нет.

Решение о том, что включать в корпус, остается за разработчиками корпуса, и это было сделано с прагматизм. Необходимые критерии и критерии, используемые для Британского национального корпуса, служат хорошей моделью для универсального корпуса с общими языками с акцентом на репрезентативность и замену сбалансированности.

Поисковые системы, такие как Google служит средством доступа к сети по умолчанию и широким спектром лингвистических ресурсов. Однако перед лингвистами, работающими в области корпусов, возникают ряд проблем. Сюда входят ограниченные экземпляры, представленные поисковыми системами (максимум 1000 или 5000); недостаточный контекст для каждого экземпляра (Google предоставляет фрагмент примерно из десяти слов); результаты, выбранные в соответствии с критериями, которые искажены (с лингвистической точки зрения), поскольку поисковый запрос занимает в заголовках и заголовках часто первые места в результатах; указать поисковые запросы в соответствии с лингвистическими критериями, такими как форма цитирования для слова или класса слов; ненадежность статистики, когда результаты меняются в зависимости от загрузки поисковой системы и многих других факторов. В настоящее время, ввиду конфликта между различными сторонами, решение для лингвистов - попытка исправить эти проблемы самостоятельно. Затем это приведет к большому количеству возможностей.

Представление

Несмотря на огромный размер Интернета, он все же может быть не репрезентативным всех языков и доменов в мире, и ни то, ни другое. Тем не менее, огромное количество языков на множестве различных типов по огромному кругу тем делает его множеством возможностей в изучении корпусов.

Воздействие его распространение и влияние

Стилистика, связанная с использованием Интернета, распространилась за пределы новых медиа в других областях и платформы, включая, помимо прочего, фильмы, музыка и литературные произведения. Проникновение интернет-стилистики важно, поскольку СМИ публикуют, усиливая языковые стили, характерные для Интернета, которые могут быть неприемлемыми в стандартных или более формальных формах языка.

Помимо интернет-сленга, грамматические ошибки и опечатки являются особенностями написания в Интернете и других каналов CMC. По мере того, как пользователи Интернета привыкают к этим ошибкам, постепенно в повседневном использовании языка как в письменной, так и в устной форме. Также часто можно увидеть такие ошибки в средствах массовой информации, от опечаток в новостных статьях до грамматических ошибок в рекламе и даже интернет-сленга в драматических диалогах.

Чем больше Интернет становится повседневной жизни, тем сильнее он влияет на формальный язык. Это особенно актуально на уроках современного языка с использованием смартфонов, планшетов и социальных сетей. Студенты знакомятся с языком Интернета больше, чем когда-либо, и поэтому грамматическая структура и сленг Интернета проникают в их формальную письменную речь. Полное погружение в язык - всегда лучший способ его выучить. Марк Лестер в своей книге Обучение грамматике и ее использованию заявляет: «Самая большая проблема, с которой сталкиваются писатели-основатели разработки успешных стратегий с ошибками, - это просто отсутствие у них знакомства с формальным письменным языком.... Мы бы могли подумать абсурдно, что ученик мог овладеть иностранным языком без обширного знакомства с ним ». Студенты переводятся на английский язык в интернет-языке, они отражают его форму и структуру.

СМИ

Были случаи, когда телевизионная реклама использовалась интернет-сленг, что усиливало проникновение интернет-стилистики в обиход. Например, в рекламе Cingular в США использовались такие сокращения, как «BFF Jill» (что означает «Лучший друг навсегда, Джилл»). Все больше компаний используют Интернет-сленг в своей рекламе, используя все больше людей, используя другие платформы CMC, пытаясь установить с ними более тесные отношения. Такие рекламные ролики получили относительно восторженные отклики от аудитории.

Использование интернет-жаргона также распространилось на музыкальную арену, что особенно заметно в популярной музыке. Недавний пример - слова Трея Сонгза для "LOL :-)", которые включают в себя много интернет-жаргона, упоминания Twitter и текстовых сообщений.

Распространение интернет-лингвистики также присутствует в фильмах, снятых как коммерческими, так и независимыми режиссерами. Хотя в основном они демонстрируются на кинофестивалях, DVD-диски с независимыми фильмами часто доступны для покупки через Интернет, включая платные прямые трансляции, что упрощает доступ к фильмам для публики. Сама природа коммерческих фильмов, показываемых в их публичных кинотеатрах, позволяет широкому распространению среди основной массы аудитории, что приводит к более быстрому и широкому распространению интернет-сленгов. Последний коммерческий фильм называется «LOL» (аббревиатура от Laugh Out Loud или Laughing Out Loud), в главных ролях: Майли Сайрус и Деми Мур. Этот фильм представляет собой ремейк 2011 года популярного французского фильма Лизы Азуэлос 2008 года с аналогичным названием «LOL (Laughing Out Loud) ".

Использование интернет-сленгов не ограничивается английским языком, но распространяется и на другие другие другие языков. Корейский язык включил английский алфавит в формирование своего сленга, в то время как другие были сформированы из обычных орфографических ошибок, возникающих в результате быстрого набора текста. Новый корейский сленг - это усиленное и введен в повседневном использовании языка в телевизионных шоу, таких как мыльные оперы или комедийные драмы, такие как «High Kick Through the Roof », Выпущенный в 2009 году.

Лингвистическое будущее Интернета

Ожидается, что с появлением больших компьютерных / Интернет-опосредованных систем связи, в сочетании с готовностью людей адаптироваться к новым требованиям более технологически сложного мира, пользователи будут продолжать оставаться под давлением, чтобы изменить их языка в соответствии с новыми измерениями общения.

Интернет-пользователи Интернета быстро растут, языковые привычки и языковые привычки переносятся в Интернете быстрее. Предполагается, что эти индивидуальные пользователи интернета используют будущее Интернет-лингвистики, особенно в аспекте многоязычной сети. Как видно из данных с 2000 по 2010 год, проникновение в ситуацию наибольшего роста в неанглоязычных странах, таких как Китай и страны Африки, в результате чего большее количество языков, помимо английского, проникло в Интернет.

Кроме того, что взаимодействие между английским и другими языками, станет основным направлением изучения. По мере того, как глобальные пользователи взаимодействуют друг с другом, количество источников на разных языках продолжает расти, что приводит к формированию новой стилистики. Китайский и корейский языки уже испытали проникновение английского языка, что привело к формированию их многоязычного Интернет-жаргона.

В нынешнем состоянии Интернет обеспечивает форму обучения и продвижения языков меньшинств. Подобное тому, как межъязыковое взаимодействие используется в Интернете (например, английский и испанский), использование в Интернете новых сленгов, языков меньшинств, используемых в Интернете. В то время как языковое взаимодействие может привести к трансляции подлинного стандарта языков языков. Например, пользователи, пытающиеся выучить язык меньшинства, могут читать и понимать его на языке программирования и языка меньшинства, что приводит к увеличению числа представителей языка меньшинства. Кроме того, носителей языков меньшинств можно побудить к изучению более распространенных языков, которые используются в сети, чтобы получить доступ к большему количеству ресурсов, что, в свою очередь, приведет к снижению использования ими своего собственного языка. Будущее языков языков находится под угрозой исчезновения.

См. Также
Ссылки
Дополнительная литература
  • Aitchison, J., Lewis, DM (Ред.). (2003). Язык новых медиа. Лондон и Нью-Йорк: Рутледж. ISBN 0-415-28303-5
  • Барон, Н.С. (2000). От алфавита к электронной почте: как эволюционировал письменный английский и к чему он идет. Лондон и Нью-Йорк: Рутледж. ISBN 0-415-18685-4
  • Борода, А. (2004). Изменение языка. Лондон и Нью-Йорк: Рутледж. ISBN 0-415-32056-9
  • Бивер, К., Нессельхаф, Н., Хундт, М. (ред.). (2006). Корпусная лингвистика и Интернет. Нидерланды: Родопи. ISBN 90-420-2128-4
  • Бордман, М. (2005). Язык веб-сайтов. Нью-Йорк и Лондон: Рутледж. ISBN 0-415-32854-3
  • Кристалл, Д. (2004). Глоссарий Netspeak и Textspeak. Эдинбург: Издательство Эдинбургского университета. ISBN 0-7486-1982-8
  • Кристалл, Д. (2004). Языковая революция (Темы 21 века). Соединенное Королевство: Polity Press Ltd. ISBN 0-7456-3312-9
  • Crystal, D. (2006). Язык и Интернет (2-е изд.). Кембридж: Издательство Кембриджского университета. ISBN 978-0-521-86859-4
  • Кристалл, Д. (2011). Интернет-лингвистика: Руководство для студентов. Нью-Йорк: Рутледж. ISBN 978-0-415-60271-6
  • Дитер, Дж. (2007). Webliteralität: Lesen und Schreiben im World Wide Web. ISBN 3-8334-9729-7
  • Энтин, Дж. (2010). Виртуальный английский: Интернет использование, язык и глобальные темы. Лондон и Нью-Йорк: Рутледж. ISBN 0-415-97724-X
  • Герранд П. (2009). Языки меньшинств в Интернете: продвижение региональных языков Испании. ВДМ Верлаг. ISBN 3-639-19111-0
  • Гиббс, Д., и Краузе, К. (ред.). (2006). Cyberlines 2.0: языки и культуры Интернета. Австралия: Джеймс Николас Паблишерс. ISBN 1-875408-42-8
  • Дженкинс, Дж. (2003). World Englishes: Справочник для студентов. Лондон и Нью-Йорк: Рутледж. ISBN 0-415-25806-5
  • Макфадьен, Л. П., Рош, Дж., И Дофф, С. (2005). Общение между культурми в киберпространстве: библиографический обзор межкультурного общения в Интернете. Lit Verlag. ISBN 3-8258-7613-6
  • Терлоу, К., Ленгель, Л. Б., и Томич, А. (2004). Компьютерное опосредованное общение: социальное взаимодействие и Интернет. Лондон: Sage Publications. ISBN 0-7619-4954-2
Последняя правка сделана 2021-05-24 05:01:55
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте