ReferatWorld.ru
» » » ЛИСП-реализация методов проверки статистических гипотез
Вернуться назад

ЛИСП-реализация методов проверки статистических гипотез

Содержание
Введение........................................................................................................... 2
1 Постановка задачи....................................................................................... 3
2 Математические и алгоритмические основы решения задачи................... 8
2.1 Общие понятия статистической проверки гипотез.................................. 8
2.2 t-критерий Стьюдента............................................................................. 13
3 Функциональные модели решения задачи................................................ 16
4 Программная реализация решения задачи............................................... 19
5 Пример выполнения программы............................................................... 23
Заключение.................................................................................................... 26
Список использованных источников и литературы.................................... 27

Введение
Статистическая проверка гипотез – система приёмов в математической статистике, предназначенных для проверки соответствия опытных данных некоторой статистической гипотезе. Процедуры статистической проверки гипотез позволяют принимать или отвергать статистические гипотезы, возникающие при обработке или интерпретации результатов измерений во многих практически важных разделах науки и производства, связанных с экспериментом. Правило, по которому принимается или отклоняется данная гипотеза, называется статистическим критерием. Построение критерия определяется выбором подходящей функции Т от результатов наблюдений, которая служит мерой расхождения между опытными и гипотетическими значениями. Эта функция, являющаяся случайной величиной, называется статистикой критерия, при этом предполагается, что распределение вероятностей Т может быть вычислено при допущении, что проверяемая гипотеза верна. По распределению статистики Т находится значение Т0, такое, что если гипотеза верна, то вероятность неравенства T >T0 равна α, где α — заранее заданный Значимости уровень. Если в конкретном случае обнаружится, что Т > T0, то гипотеза отвергается, тогда как появление значения Т ≤ T0 не противоречит гипотезе.
Целью данной курсовой работы является ЛИСП-реализация методов проверки статистических гипотез.

1 Постановка задачи
Требуется реализовать программу проверки статистических гипотез. Для реализации воспользуемся t-критерием Стьюдента.
Пример 1. Проверка гипотезы при наличии одной выборки
Имеются данные о заработной плате, полученные в ходе опроса: 450,680,850,1500,3500,1200,1000,700. Необходимо определить, является средняя заработная плата в регионе равной 1500 рублей.
Сформулируем нулевую и альтернативную гипотезу.
H0: - средняя заработная плата равна 1500 рублей.
H1: - средняя заработная плата не равна 1500 рублей
Выбор уровня значимости (вероятности ошибки).
.
Выбор теста.
t критерий Стьюдента:
,
где
,
где - среднее значение выборки, - среднее значение нулевой гипотезы, - среднеквадратическое отклонение, n – количество данных в выборке.
Определение критической области.
Так как альтернативная гипотеза имеет следующий вид: H1: , то необходимо применять двусторонний тест. Для определения критической области рассчитаем t (7, 0.005)=4.029 [t(n-1, /2)].
Правило принятия (отвержения) гипотезы: если TR4.029, то отвергается H0 и принимается H1.
Выполнение необходимых вычислений.
Вычислим t расчетное (TR) :
Таблица 1 – Вспомогательные расчеты
450 -785 616225
680 -555 308025
850 -385 148225
1500 265 70225
3500 2265 5130225
1200 -35 1225
1000 -235 55225
700 -535 286225
6615600
Таким образом имеем:
==972,15
==-0,77
Принятие статистического решения.
Так как -4.029<TR<4.029, тогда с =0.01 гипотеза Н0 о равенстве среднего значения заработной платы в размере 1500 р. принимается при =0.01. Следовательно, средняя заработная плата составляет 1500 рублей.
Если мы хотим узнать, является ли заработная плата выше чем 1500 рублей, то необходимо сформулировать новые гипотезы:
H0: - средняя заработная плата равна 1500 рублей.
H1: - средняя заработная плата не равна 1500 рублей
Так как альтернативная гипотеза имеет следующий вид: H1: , то необходимо применять односторонний тест. Для определения критической области рассчитаем t (7, 0.01)=3.499 [t(n-1, )].
, то гипотеза H0 о равенстве среднего значения заработной платы 1500 рублей принимается при =0.01. Следовательно, нельзя говорить о том, что средняя заработная плата выше 1500 рублей.
Пример 2. Проверка гипотез по двум выборкам
Пусть, после проведения экономических реформ снова был произведен опрос о заработной плате. Получены новые данные: 600,600,1300,1100,3700,1600,1100,800.
Необходимо выяснить, привели ли реформы к росту благосостояния населения.
Сформулируем гипотезы:
H0: - средняя заработная плата до реформ равна средней зарплате после реформ.
H1: - средняя заработная после реформ больше, чем средняя зарплата до реформ
Выбор уровня значимости (вероятности ошибки).
.
Выбор теста.
t критерий Стьюдента для двух выборок:
.
Число степеней свободы:
,
где - среднее значение выборки, - среднеквадратическое отклонение, n – количество данных в выборке.
Выполнение необходимых вычислений.
Вычислим t расчетное (TR) :
Число степеней свободы:
Определение критической области.
Для определения критической области рассчитаем число степеней свободы t (14, 0.01)=2.977 [t(n-1, /2)].
Правило принятия (отвержения) гипотезы: если TR-2.977, то нулевая гипотеза не отвергается, по вероятности ошибки 0.01. Следовательно, средняя заработная плата до проведения реформ равна средней заработной плате после проведения реформ. Таким образом, проведенные реформы не привели к существенному росту благосостояния населения.

2 Математические и алгоритмические основы решения задачи
2.1 Общие понятия статистической проверки гипотез
Статистическая гипотеза обычно представляет собой некоторое предположение об одном или нескольких параметрах функции распределения случайной величины.
Пример статистической гипотезы: «генеральная совокупность распределена по нормальному закону», «различие между дисперсиями двух выборок незначимо» и т.д.
В теории статистического вывода обычно проверяются гипотезы на основе выборочной информации. В практике статистической работы чаще всего имеют дело с двумя конкурирующими гипотезами: нулевой гипотезой, обозначаемой H0; и альтернативной гипотезой, обозначаемой H1. Нулевая гипотеза используется при статистической проверке гипотез об отсутствии существующих различий между несколькими выборочными совокупностями, для суждения о близости фактического распределения к теоретическому (нормальному), об отсутствии зависимости между признаками. Суть нулевой гипотезы состоит в признании того, что выборки взяты из одной совокупности, фактическое распределение укладывается в теоретическое, зависимость между признаками отсутствует и т. д. Следовательно, нулевая гипотеза - это гипотеза, подлежащая проверке. И если отвергается нулевая гипотеза как неподходящая в каком-то статистическом смысле, то принимается альтернативная гипотеза.
Так как мы имеем дело с неизвестной генеральной совокупностью и выносим суждения о ней на основе выборочной информации, то мы можем и не прийти к правильному выводу. Мы сделаем неправильный вывод, если отвергнем нулевую гипотезу, когда она справедлива (ошибка I рода), или примем нулевую гипотезу, когда она ошибочна (ошибка II рода).
В большинстве случаев при проведении проверки гипотез в экономике задается некоторый допустимый уровень вероятности совершения ошибки I рода () и осуществляется проверка на основе выборочной информации. В классическом статистическом выводе существует два общих правила для определения величины :
чем больше степень уверенности в нулевой гипотезе, тем меньше должно быть значение .
чем больше цена отбрасывания справедливой нулевой гипотезы, тем меньше значение должно иметь .
Сформулируем общий алгоритм проверки статистических гипотез. Процедуру проверки можно описать следующими шагами:
1) формулировка гипотезы. Гипотеза формулируется в терминах различия величин. Например, есть случайная величина х и константа a. Они не равны (арифметически), но нужно установить, значимо ли статистически между ними различие. Существует два типа критериев:
а) двухсторонний критерий вида: х a;
б) односторонний критерий вида: х< a или х, <, = здесь используются не в арифметическом, а в «статистическом» смысле. Их необходимо читать «значимо больше», «значимо меньше», «различие незначимо».
2) Установка закона распределения. Далее необходимо установить или постулировать закон распределения. Существуют также критерии, которые не зависят от вида распределения - так называемые непараметрические критерии.
3) Вычисление тестовой статистики. Тестовая статистика - некоторая функция от рассматриваемых величин, закон распределения которой точно известен и ее можно сравнить с табличным значением.
4) Сравнение с табличным значением. Затем тестовая статистика сравнивается с табличным значением. Тестовая статистика всегда зависит от доверительной вероятности, и, в некоторых случаях, от дополнительных параметров. Так, в приведенном выше примере сравнения двух дисперсий тестовая статистика сравнивается с табличным значением критерия Фишера («критическим» значением), которое зависит от доверительной вероятности и числа степеней свободы дисперсий.
5) Вывод. На основании сравнения делается вывод о том, выполняется ли гипотеза (например, значимо ли различие и т.д.).
Уровень значимости - это такое малое значение вероятности попадания критерия в критическую область при условии справедливости гипотезы, что появление этого события может расцениваться как следствие существующего расхождения выдвинутой гипотезы и результатов выборки.
Допустим, рассчитанное по эмпирическим данным значение критерия попало в критическую область. Тогда при условии верности проверяемой гипотезы H0 вероятность этого события будет не больше уровня значимости . Поскольку выбирается достаточно малым, то такое событие является маловероятным, и, следовательно, проверяемая гипотеза может быть отвергнута. Если же наблюдаемое значение характеристики не принадлежит к критической области, и, следовательно, находится в области допустимых значений, то проверяемая гипотеза H0 не отвергается. Вероятность попадания критерия в область допустимых значений при справедливости проверяемой гипотезы H0 равна . Чем меньше уровень значимости, тем меньше вероятность забраковать проверяемую гипотезу, когда она верна, то есть меньше вероятность совершить ошибку первого рода. Но при этом расширяется область допустимых значений и, значит, увеличивается вероятность совершения ошибки II рода.

Внимание, отключите Adblock

Вы посетили наш сайт со включенным блокировщиком рекламы!
Ссылка для скачивания станет доступной сразу после отключения Adblock!

Скачать полную версию
Курсовые работы по информатике Содержание Введение........................................................................................................... 2 1 Постановка
Оценок: 362 (Средняя 5 из 5)

Одними из наиболее популярных услуг на рынке IT-технологий являются создание и продвижение лендингов. Они способны положительно влиять на деятельность любого бизнес-проекта в интернете. Судя по многочисленным отзывам, заказавшие создание лендингов люди ни разу не пожалели о потраченных деньгах. Они вложили в будущее, которое неразрывно связано с интернетом. Всё больше и больше предпринимателей обращаются к услугам разных агентств, веб-студий, чтобы заказать создание лендинга у профессионалов.

© 2017 - 2022 ReferatWorld.ru