Лексическое разнообразие является одним аспект «лексического богатства» и относится к соотношению различных уникальных основ (типов) слов к общему количеству слов (токенов ). Термин используется в прикладной лингвистике и является количественно рассчитывается с использованием множества различных показателей, включая соотношение типов текста (TTR), voiced и показатель лексического разнообразия текста (MTLD).
Общая проблема с показателями лексического разнообразия, особенно TTR, заключается в том, что образцы текста, содержащие Большое количество токенов дает более низкие значения для TTR, поскольку писателю или говорящему часто необходимо повторно использовать несколько функциональных слов. Одним из следствий этого является то, что lex Такое разнообразие лучше использовать для сравнения текстов одинаковой длины. Новые меры лексического разнообразия пытаются учесть чувствительность к длине текста.
В статье 2013 года Скотт Джарвис предположил, что лексическое разнообразие, как и разнообразие в экологии, является перцептивным феноменом. Лексическая избыточность - это позитивный аналог лексического разнообразия, точно так же, как лексическая изменчивость является зеркальным отражением повторения. Согласно модели Джарвиса, лексическое разнообразие включает изменчивость, объем, равномерность, редкость, дисперсию и несоответствие.
Согласно Джарвису, шесть свойств лексического разнообразия следует измерять следующими показателями.
Свойство | Мера |
---|---|
Изменчивость | Мера текстового лексического разнообразия (MTLD) |
Объем | Общее количество слов в тексте |
Ровность | Стандартное отклонение токенов по типу |
Редкость | Среднее BNC ранг |
Дисперсия | Среднее расстояние между токенами типа |
Несоответствие | Среднее количество слов в одном смысле или Скрытый семантический анализ |