A описательная статистика (в count noun смысл) - это сводная статистика, которая количественно описывает или суммирует характеристики из набора информации, а описательной статистики (в массовое существительное смысл) - это процесс использования и анализа этой статистики. Описательная статистика отличается от выводимой статистики (или индуктивной статистики) своей целью суммировать образец, а не использовать данные для изучения совокупности, которую Предполагается, что образец данных представляет. Обычно это означает, что описательная статистика, в отличие от статистики вывода, не разрабатывается на основе теории вероятностей и часто является непараметрической статистикой. Даже когда анализ данных делает свои основные выводы с использованием статистических выводов, обычно также представлена описательная статистика. Например, в статьи, посвященные людям, обычно включается таблица с указанием общего размера выборки, размеров выборки в важных подгруппах (например, для каждой группы лечения или воздействия) и демографической или клинические характеристики, такие как средний возраст, доля субъектов каждого пола, доля субъектов с соответствующими сопутствующими заболеваниями и т. д.
Некоторые показатели для описания набора данных обычно используются меры центральной тенденции и меры изменчивости или дисперсии. Меры центральной тенденции включают среднее, медианное и режим, тогда как меры вариабельности включают стандартное отклонение (или дисперсию ), минимальные и максимальные значения переменных, эксцесс и асимметрия.
Описательная статистика предоставляет простые сводки об образце и о сделанных наблюдениях. Такие сводные данные могут быть либо количественными, т.е. сводными статистическими данными, либо визуальными, то есть простыми для понимания графиками. Эти сводки могут либо лечь в основу первоначального описания данных в рамках более обширного статистического анализа, либо их самих может хватить для конкретного исследования.
Например, процент бросков в баскетбол - это описательная статистика, которая суммирует результативность игрока или команды. Это число представляет собой количество сделанных снимков, деленное на количество сделанных снимков. Например, игрок, который забивает 33%, делает примерно один бросок из каждых трех. Процент суммирует или описывает несколько дискретных событий. Также учитывайте средний балл. Это единственное число описывает общую успеваемость студента по всему спектру их курсового опыта.
Использование описательной и сводной статистики имеет обширную историю, и, действительно, простое табулирование совокупностей и экономических данных было Впервые появилась тема статистики. Совсем недавно набор методов резюмирования был сформулирован под заголовком исследовательский анализ данных : примером такого метода является прямоугольная диаграмма.
В мире бизнеса описательная статистика обеспечивает полезное резюме многих типов данных. Например, инвесторы и брокеры могут использовать исторический отчет о поведении доходности, выполняя эмпирический и аналитический анализ своих инвестиций, чтобы принимать более обоснованные инвестиционные решения в будущем.
Одномерный анализ включает описание распределения одной переменной, включая ее центральную тенденцию (включая среднее, медианное значение и режим ) и дисперсию (включая диапазон и квартили набора данных, а также меры разброса, такие как дисперсия и стандартное отклонение ). Форма распределения также может быть описана с помощью таких индексов, как асимметрия и эксцесс. Характеристики распределения переменной также могут быть изображены в графическом или табличном формате, включая гистограммы и отображение по принципу «стебель и лист».
Когда выборка состоит из Для более чем одной переменной описательная статистика может использоваться для описания взаимосвязи между парами переменных. В данном случае описательная статистика включает:
Основная причина разграничения одномерного и двумерного анализа заключается в том, что двумерный анализ - это не только простой описательный анализ, но также он описывает взаимосвязь между двумя разными переменными. Количественные показатели зависимости включают корреляцию (например, r Пирсона, если обе переменные непрерывны, или rho Спирмена, если одна или обе переменные не являются) и ковариация (которая отражает масштабные переменные измеряются на). Наклон в регрессионном анализе также отражает взаимосвязь между переменными. Нестандартизованный наклон указывает изменение единицы в переменной критерия для изменения единицы в предсказателе . Стандартизированный наклон указывает это изменение в стандартизированных (z-баллах ) единиц. Сильно искаженные данные часто преобразуются путем логарифмирования. Использование логарифмов делает графики более симметричными и более похожими на нормальное распределение, что упрощает их интуитивную интерпретацию.