стьюдент



























Госсет, Уильям Сили


[ Cкачайте файл, чтобы посмотреть ссылку ]








Уи
·льям Си
·ли Го
·ссет ([ Cкачайте файл, чтобы посмотреть ссылку ] [ Cкачайте файл, чтобы посмотреть ссылку ] г. [ Cкачайте файл, чтобы посмотреть ссылку ] [ Cкачайте файл, чтобы посмотреть ссылку ] г.) известный учёный-[ Cкачайте файл, чтобы посмотреть ссылку ], более известный под своим псевдонимом Стьюдент и за свои работы по исследованию т.н. [ Cкачайте файл, чтобы посмотреть ссылку ].
Госсет родился 13 июня 1876 г. в Английском городе Кантербури, Англия, где он был самым старшим из пяти детей. Он умер в возрасте 61 года в Английском городе Биконсфилде 16 октября 1937 г. Он посещал Королевскую Военную Академию в Вулидже для того, чтобы стать инженером прежде, чем он был отклонен из-за плохого зрения. Уильям Госсет никогда не работал как статистик. Он пошел в школу в Уинчестере и был хорошо образован перед поступлением в Новый Колледж в Оксфорде. Здесь он завоевал первую степень по химии в 1899 году. После получения своей степени химика он получил работу в пивоваренном заводе Гуиннеса в Дублине в 1899, где он выполнял важную статистическую работу, но на которую никогда не нанимали статиста. Именно окружающая среда в Гуиннессе сделала его статистом. Пивоваренный завод был заинтересован в том, чтобы они могли делать лучшее пиво. В 1900 году была открыта Научно-исследовательская лаборатория Гуиннесса, которую возглавил наиболее выдающийся молодой химик Хорас Броун. Хорас Броун наряду с другими варевами задавался вопросом, как получить сырье для назревающего пива наиболее дешево, но получить при этом максимум. Было много факторов, которые они были должны принять во внимание типа множества видов ячменя и хмеля, какие условия изготовления, факторы культивирования и назревания. После нескольких лет исследования, учитывая что им давали свободу в исследовании условий назревания. Это дало Госсету шанс, чтобы работать как статистик. Он был способен брать данные от различных примеров назревания, что помогало ему выяснить, который путь был лучшее. Поскольку молодые пивовары работают вместе, это казалось естественным для них, чтобы собирать данные для Госсета, чтобы решить числовые проблемы. Госсет в 1903 году мог вычислять стандартные ошибки. В 1904 он написал о назревании пива. Этот рапорт привел к Карлу Пирсону, консультирующему Госсета. Госсет встретил Пирсона в июле 1905, когда они долго вместе говорили. Пирсон за полтора часа заставил Госсета понимать теорию стандартных ошибок. Госсет возвратился к пивоваренному заводу и занимался тем методом в течение следующего года. Встреча была также успешна, в котором Пеарсон заставил Госсета взяться за изучение закона ошибок.
«Ги
·ннесс» ([ Cкачайте файл, чтобы посмотреть ссылку ] Guinness)  пивной бренд, принадлежащий компании [ Cкачайте файл, чтобы посмотреть ссылку ] (со штаб-квартирой в [ Cкачайте файл, чтобы посмотреть ссылку ]), изначально относившийся к ирландской компании Arthur Guinness Son & Co, основанной в [ Cкачайте файл, чтобы посмотреть ссылку ] пивоваром [ Cкачайте файл, чтобы посмотреть ссылку ] (Arthur Guinness). Пиво «Гиннесс»  самое известное и потребляемое ирландское пиво, ставшее легендой [ Cкачайте файл, чтобы посмотреть ссылку ] и символом [ Cкачайте файл, чтобы посмотреть ссылку ]
Отличительной особенностью пива долгое время являлся жжёный аромат, который получался из-за использования жареного ячменя. Пиво производится из ячменя (в Нигерии его заменяют на [ Cкачайте файл, чтобы посмотреть ссылку ][ Cкачайте файл, чтобы посмотреть ссылку ]), воды, хмеля и дрожжей[ Cкачайте файл, чтобы посмотреть ссылку ]. На протяжении многих лет отстоявшееся пиво смешивали со свежесваренным, что придавало резкий молочный привкус и характерную пену. Позже компания Гиннесса отказалась от смешивания отстоявшегося и свежесваренного пива, и теперь для создания пены при разливе пиво обогащают азотом[ Cкачайте файл, чтобы посмотреть ссылку ]; кроме того, в качестве основы производства пива компании по лицензии сейчас зачастую служит концентрированный экстракт «FES», который можно разводить на основе [ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ] был передовым предприятием пищевой промышленности, и Госсет мог применить свои знания в области статистики как при варке пива, так и на полях  для выведения самого урожайного сорта [ Cкачайте файл, чтобы посмотреть ссылку ]. Госсет приобретал эти знания путём изучения, [ Cкачайте файл, чтобы посмотреть ссылку ], проведя два года (19061907 гг.) в биометрической лаборатории [ Cкачайте файл, чтобы посмотреть ссылку ]. Госсет и Пирсон были в хороших отношениях, и Пирсон помогал Госсету в математической части его исследований. Так, Пирсон был причастен к публикациям 1908 года (принёсших славу Стьюденту), но придавал мало значения этому открытию. Исследования были обращены к нуждам пивоваренной компании и проводились на малом количестве наблюдений. Биометристы же обычно имели дело с сотнями наблюдений и не испытывали необходимости в развитии методов, основанных на малом их количестве.
Ранее другой исследователь, работавший на [ Cкачайте файл, чтобы посмотреть ссылку ], опубликовал в своих материалах сведения, составлявшие коммерческую тайну этой пивоваренной компании. Чтобы предотвратить дальнейшее раскрытие конфиденциальной информации, Гиннесс запретил своим работникам публикацию любых материалов, независимо от содержавшейся в них информации. Это означало, что Госсет не мог опубликовать свои работы под своим именем. Поэтому он избрал себе псевдоним Стьюдент, чтобы скрыть себя от работодателя. Поэтому его самое важное открытие получило название [ Cкачайте файл, чтобы посмотреть ссылку ], иначе бы оно могло называться теперь распределением Госсета.












Распределение.
Типы распределений.
Различают дискретные и непрерывные вероятностные распределения. Дискретное распределение характеризуется тем, что оно сосредоточено в конечном или счетном числе точек. Непрерывное распределение "размазано" по некоторому вещественному интервалу.
Характеристики распределений
Вероятностное распределение может быть описано несколькими эквивалентными способами. Здесь приведены лишь некоторые из них.
Функция распределения. Определена для любого вещественного распределения. Для случайной величины X ее функцией распределения называется
, .
Плотность распределения. Определена для непрерывных распределений. Представляет собой производную от функции распределения:
, .
Функция вероятности. Альтернативный способ описания дискретных распределений. Если распределение случайной величины X сосредоточено в конечном или счетном числе точек x1, x2,..., xn,... то его можно описать вероятностями принятия случайной величиной X соответствующих значений:
Значение
x1
x2
...
xn
...

Вероятность
p1
p2
...
pn
...

Здесь pk = f(xk) = P(X = xk), k=1,2,...,n,...
Параметры распределений
Опишем некоторые параметры распределения.
Математическое ожидание (среднее значение) E
X случайной величины X. Представляет собой интеграл вида
.
Для непрерывной случайной величины может быть выражено также через плотность ее распределения
,
а для дискретной случайной величины - через функцию вероятности:
.
Дисперсия (рассеяние) случайной величины X имеет вид
.
В классических методах теории риска дисперсия часто использовалась в качестве [ Cкачайте файл, чтобы посмотреть ссылку ], измерителя рискованности проектов.
Стандартное отклонение случайной величины X задается выражением
.
Асимметрия распределения случайной величины X:
.
характеризует различие "хвостов" распределения; асимметрия положительна при более тяжелом правом хвосте, и отрицательна при более тяжелом левом хвосте. Для симметричных распределений асимметрия равна 0.
Островершинность распределения случайной величины X:
.
характеризует тяжесть "хвостов" распределения; положительные значения этого параметра соответствуют распределениям с более тяжелыми хвостами, чем у нормального распределения.
Медианой a = med(X) распределения случайной величины X называется корень уравнения
.
Медиана является средней характеристикой распределения в том смысле, что X с равными вероятностями принимает значения, лежащие справа и слева от a. Преимуществом медианы перед математическим ожиданием является тот факт, что математическое ожидание может быть неопределенным, если задающий его интеграл (в дискретном случае - ряд) расходится, как, например, в случае [ Cкачайте файл, чтобы посмотреть ссылку ]. Недостатком медианы является ее возможная неоднозначность для дискретных распределений. Медиана симметричного распределения совпадает с его средним значением (если последнее существует).
Модой распределения называется наиболее вероятное значение случайной величины: в непрерывном случае - точка максимума плотности распределения, в дискретном случае - точка максимума функции вероятности. Мода распределения может быть неоднозначной, и использование этого параметра в теории риска ограничено.
В разделе иллюстраций можно познакомиться с визуальным представлением [ Cкачайте файл, чтобы посмотреть ссылку ] треугольного распределения.
Другие характеристики распределений
Вероятностное распределение может быть описано и другими характеристиками. Среди них:
Характеристическая функция. Определена для произвольных распределений.
, .
Здесь i - мнимая единица. Для непрерывного распределения характеристическую функцию можно также выразить через [ Cкачайте файл, чтобы посмотреть ссылку ]:
, ,
а для дискретного распределения - через [ Cкачайте файл, чтобы посмотреть ссылку ]
, .

Применение распределения Стьюдента
Распределение Стьюдента используется в [ Cкачайте файл, чтобы посмотреть ссылку ] для [ Cкачайте файл, чтобы посмотреть ссылку ], построения [ Cкачайте файл, чтобы посмотреть ссылку ] и [ Cкачайте файл, чтобы посмотреть ссылку ], касающихся неизвестного [ Cкачайте файл, чтобы посмотреть ссылку ] статистической [ Cкачайте файл, чтобы посмотреть ссылку ] из нормального распределения. В частности, пусть независимые случайные величины, такие что . Обозначим [ Cкачайте файл, чтобы посмотреть ссылку ] этой выборки, а S2 её [ Cкачайте файл, чтобы посмотреть ссылку ]. Тогда
.



Функции распределения Стьюдента
В следующей таблице приведены значения функции распределения Стьюдента Fn(x) с n степенями свободы для некоторых значений аргумента x в диапазоне от 0 до 20. В заголовках строк указано значение аргумента x, а в заголовках столбцов - количество степеней свободы n. Так, например, F5(0.9) = 0.795. Для отрицательных x можно вычислить значение функции по формуле Fn(x) = 1 - Fn(-x). Например, F10(-1.2) = 1 - F10(1.2) = 1 - 0.871 = 0.129.
x
1
2
5
10
20
50

0
0.500
0.500
0.500
0.500
0.500
0.500

0.1
0.532
0.535
0.538
0.539
0.539
0.540

0.2
0.563
0.570
0.575
0.577
0.578
0.579

0.3
0.593
0.604
0.612
0.615
0.616
0.617

0.4
0.621
0.636
0.647
0.651
0.653
0.655

0.5
0.648
0.667
0.681
0.686
0.689
0.690

0.6
0.672
0.695
0.713
0.719
0.722
0.724

0.7
0.694
0.722
0.742
0.750
0.754
0.756

0.8
0.715
0.746
0.770
0.779
0.783
0.786

0.9
0.733
0.768
0.795
0.805
0.811
0.814

1
0.750
0.789
0.818
0.830
0.835
0.839

1.2
0.779
0.823
0.858
0.871
0.878
0.882

1.4
0.803
0.852
0.890
0.904
0.912
0.916

1.6
0.822
0.875
0.915
0.930
0.937
0.942

1.8
0.839
0.893
0.934
0.949
0.957
0.961

2
0.852
0.908
0.949
0.963
0.970
0.975

2.5
0.879
0.935
0.973
0.984
0.989
0.992

3
0.898
0.952
0.985
0.993
0.996
0.998

3.5
0.911
0.964
0.991
0.997
0.999
1.000

4
0.922
0.971
0.995
0.999
1.000
1.000

4.5
0.930
0.977
0.997
0.999
1.000
1.000

5
0.937
0.981
0.998
1.000
1.000
1.000

6
0.947
0.987
0.999
1.000
1.000
1.000

7
0.955
0.990
1.000
1.000
1.000
1.000

8
0.960
0.992
1.000
1.000
1.000
1.000

9
0.965
0.994
1.000
1.000
1.000
1.000

10
0.968
0.995
1.000
1.000
1.000
1.000

12
0.974
0.997
1.000
1.000
1.000
1.000

14
0.977
0.997
1.000
1.000
1.000
1.000

16
0.980
0.998
1.000
1.000
1.000
1.000

18
0.982
0.998
1.000
1.000
1.000
1.000

20
0.984
0.999
1.000
1.000
1.000
1.000

Госсет практически все свои работы, включая работу «Вероятная ошибка среднего» ([ Cкачайте файл, чтобы посмотреть ссылку ] The probable error of a mean) опубликовал в журнале [ Cкачайте файл, чтобы посмотреть ссылку ] «Биометрика» под псевдонимом Стьюдент. Первым, кто понял значение работ Госсета по оценке параметров малой выборки, был биолог [ Cкачайте файл, чтобы посмотреть ссылку ]. Госсет написал ему: «Я посылаю вам копию таблиц Стьюдента, поскольку вы, похоже, единственный человек, который когда-либо станет пользоваться ими!» Фишер считал, что Госсет совершил «логическую революцию». По иронии судьбы, t-статистика, благодаря которой знаменит Госсет, была фактически изобретением Фишера. Госсет считал статистику для z = t/
·(n
·1). Фишер предложил вычислять статистику для t, потому что такое представление укладывалось в его теорию [ Cкачайте файл, чтобы посмотреть ссылку ]. Фишер также применил [ Cкачайте файл, чтобы посмотреть ссылку ] в регрессионном анализе.
[ Cкачайте файл, чтобы посмотреть ссылку ] также названы в честь Стьюдента, хотя их предложили другие учёные. Подобно проблемам, которые привели к распределению Стьюдента, в их основе лежит та же идея исправление (adjusting) выборочного [ Cкачайте файл, чтобы посмотреть ссылку ].

















Среднеквадрати
·ческое отклоне
·ние.
Среднеквадрати
·ческое отклоне
·ние (синонимы: среднеквадрати
·чное отклоне
·ние, квадрати
·чное отклоне
·ние; близкие (но не совпадающие) термины: станда
·ртное отклоне
·ние, станда
·ртный разбро
·с)  в [ Cкачайте файл, чтобы посмотреть ссылку ] и [ Cкачайте файл, чтобы посмотреть ссылку ] наиболее распространённый показатель рассеивания значений [ Cкачайте файл, чтобы посмотреть ссылку ] относительно её [ Cкачайте файл, чтобы посмотреть ссылку ].
Измеряется в единицах измерения самой случайной величины. Равно [ Cкачайте файл, чтобы посмотреть ссылку ] из [ Cкачайте файл, чтобы посмотреть ссылку ]. Среднеквадратическое отклонение используют при расчёте [ Cкачайте файл, чтобы посмотреть ссылку ] [ Cкачайте файл, чтобы посмотреть ссылку ], при построении [ Cкачайте файл, чтобы посмотреть ссылку ], при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами.
Среднеквадратическое отклонение:

стандартное отклонение ([ Cкачайте файл, чтобы посмотреть ссылку ] среднеквадратического отклонения случайной величины x относительно её математического ожидания):

где   [ Cкачайте файл, чтобы посмотреть ссылку ];   i-й элемент выборки;   объём выборки;   [ Cкачайте файл, чтобы посмотреть ссылку ] выборки:

Следует отметить отличие стандартного отклонения (в знаменателе n
· 1) от корня из дисперсии (среднеквадратического отклонения) (в знаменателе n). При малом объёме выборки оценка дисперсии через последнюю величину является несколько смещённой, при бесконечно большом объёме выборки разница между указанными величинами исчезает.


Правило трёх сигм
[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ]
График [ Cкачайте файл, чтобы посмотреть ссылку ] [ Cкачайте файл, чтобы посмотреть ссылку ] и процент попадания случайной величины на отрезки равные среднеквадратическому отклонению.
Правило трёх сигм ()  практически все значения [ Cкачайте файл, чтобы посмотреть ссылку ] случайной величины лежат в интервале Более строго  не менее чем с 99,7 % достоверностью значение [ Cкачайте файл, чтобы посмотреть ссылку ] случайной величины лежит в указанном интервале (при условии, что величина истинная, а не полученная в результате обработки выборки).
Если же истинная величина неизвестна, то следует пользоваться не
·, а s. Таким образом, правило 3-х сигм














Т-критерий.
Критерий Стьюдента (или Т-критерий) широко применим в практике проверки статистических гипотез о равенстве средних значений [ Cкачайте файл, чтобы посмотреть ссылку ] или среднего значения выборки с неким значением (целевым показателем). В последнем случае различают [ Cкачайте файл, чтобы посмотреть ссылку ] (предположение о равенстве среднего и целевого значений) и [ Cкачайте файл, чтобы посмотреть ссылку ] (предположение, что среднее арифметическое значение больше или меньше целевого) гипотезы. Использование данного критерия предполагает сравнение распределения наблюдаемой величины с распределением Стьюдента. В простейшем случае табличное значение критерия Стьюдента сравнивается с расчетным и, на основании этого исследователь делает вывод в пользу нулевой или альтернативной гипотезы
Условия использования коэффициента Стьюдента:
Исследуемые данные [ Cкачайте файл, чтобы посмотреть ссылку ]
Равенство дисперсий (при сравнении двух выборо


Интерес Госсета к выращиванию [ Cкачайте файл, чтобы посмотреть ссылку ] привёл его к мысли, что опыт надо планировать с той целью, чтобы не просто повысить среднюю урожайность, но чтобы вывести такие сорта ячменя, чья урожайность была бы устойчива к колебаниям состава почвы или климата. Этот принцип встречается только позднее у Фишера и затем в 1950-х в работе [ Cкачайте файл, чтобы посмотреть ссылку ].
В 1935 году он покинул Дублин, чтобы занять должность главного пивовара, ответственного за научную сторону производственного процесса, в новой пивоварне Гиннесса в [ Cкачайте файл, чтобы посмотреть ссылку ] ([ Cкачайте файл, чтобы посмотреть ссылку ]), в северо-западной части [ Cкачайте файл, чтобы посмотреть ссылку ]. Он скончался от сердечного приступа в городе [ Cкачайте файл, чтобы посмотреть ссылку ] ([ Cкачайте файл, чтобы посмотреть ссылку ]) в Англии.
Госсет был другом Пирсона и Фишера и был достаточно скромным человеком. Известен случай, когда он оборвал речь своего почитателя словами «Фишер всё равно бы сумел открыть всё это сам».



Файл:William Sealy Gosset.jpgРисунок 61Рисунок 63Рисунок 64Рисунок 66Рисунок 68Рисунок 73Рисунок 75Рисунок 76Рисунок 78Рисунок 124Рисунок 125Рисунок 126Рисунок 127Рисунок 129Рисунок 133Рисунок 135Рисунок 150Тђ Заголовок 1Тђ Заголовок 2Тђ Заголовок 315

Приложенные файлы

  • doc 26699184
    Размер файла: 412 kB Загрузок: 0

Добавить комментарий