Одна из основных целей стат. обработки данных состоит в том, чтобы заменить исходное множество данных небольшим количеством характеристик. При этом важно, чтобы такое сжатие данных сохраняло по возможности в выбранных характеристиках всю существенную информацию, относящуюся к исследуемому объекту и содержащуюся в исходных данных. Упомянутые сводные характеристики являются функциями от исходных результатов наблюдения и называются статистиками.
В качестве характеристик центра группирования значений исследуемого признака в статистической практике используют несколько видов средних значений. Наиболее распространенной средней величиной является выборочная средняя
Основной и наиболее употребительной характеристикой степени рассеяния значений исследуемого признака относительно центра группирования является выборочная дисперсия
Выборочное среднеквадратическое отклонение имеет вид
Задача 1.
Вычислить выборочную среднюю, дисперсию и среднеквадратическое отклонение тарифного разряда рабочих механического цеха по данным таблицы
Тарифный разряд | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
Количество рабочих | 4 | 6 | 12 | 16 | 44 | 18 |
Решение.
Задача 2.
Вычислить выборочную среднюю, дисперсию и среднеквадратическое отклонение выработки рабочего-станочника механического цеха в отчетном году ( в процентах к предыдущему) по данным таблицы
Выработка (в %) | 80-90 | 90-100 | 100-110 | 110-120 | 120-130 | 130-140 | 140-150 |
---|---|---|---|---|---|---|---|
Серед. интерв. | 85 | 95 | 105 | 115 | 125 | 135 | 145 |
Колич. рабочих | 8 | 15 | 46 | 29 | 13 | 3 | 3 |
Решение.
Оценка параметра называется несмещенной, если математическое ожидание совпадает с самим оцениваемым параметром. В противном случае оценка называется смещенной.
Интервальной называется статистическая оценка, определяемая двумя числовыми значениями – концами исследуемого интервала.
Доверительным называется интервал, который с заданной вероятностью покрывает неизвестное значение параметра .
Надежностью, или доверительной вероятностью, оценки называется вероятность , с которой выполняется неравенство ; , где - статистическая оценка параметра,
Чаще всего доверительную вероятность задают заранее и на нее накладывают требования быть близкой к единице. Общепринятые значения надежности: 0,95; 0,99; 0,999, которые определяются в зависимости от конкретных условий. Например, надежность означает, что мы пренебрегаем вероятностью совершить ошибку. Вероятность называют вероятностью ошибок, или уровнем значимости. Границы доверительного интервала называют доверительными границами, или критическими значениями.
, где находится с помощью таблиц функции Лапласа (Табл.П.3 Стр. 267 Спирины). Тогда с вероятностью можно утверждать, что искомое генеральное среднее принадлежит интервалу , где есть точность оценки.
Задача 3.
Произведены некоторые испытания, результаты которых занесены в таблицу:
1 | 2 | 3 | 4 | 5 | |
---|---|---|---|---|---|
-25 | 34 | -20 | 10 | 21 |
Известно, что они подчиняются нормальному закону распределения с . Найти оценку для математического ожидания , построить для него 90% доверительный интервал.
Решение.
Ответ: ϵ(2,53 ; 5,47).
Задача 4.
По известным и с помощью функции Лапласа найдите доверительный интервал для оценки неизвестного математического ожидания с заданной надежностью, предполагая, что измеряемая величина распределена нормально: ; ; = 50 = 0,95.
Решение.
По доверительной вероятности определим аргумент функции Лапласа (Табл.П.3 Стр. 267 Спирины) ,
.
Ответ: ϵ(3,47; 8,73).
Что значит «дать точечную оценку параметра»?
Интервал, который с заданной вероятностью γ покрывает неизвестное значение параметра, называется ...
Для нахождения точности оценки параметра применяется таблица ...
Выборочная средняя находится по формуле:
С помощью функции Лапласа найдите доверительный интервал для оценки неизвестного математического ожидания с заданной надежностью , если ; ; , предполагая, что измеряемая величина распределена нормально.