Ортогональные полиномы и кривые распределения вероятностей
Ортогональные полиномы и кривые распределения вероятностей
Санкт-Петербургский
государственный университет
Факультет прикладной математики – процессов управления
Кафедра математического моделирования
энергетических систем
Карпова
Наталия
Анатольевна
ОРТОГОНАЛЬНЫЕ ПОЛИНОМЫ И КРИВЫЕ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ
Зав. Кафедрой,
профессор, доктор физ.-мат.
наук Захаров В. В.
Научный руководитель,
доцент, кандидат физ.-мат.
наук Свиркин М. В.
Рецензент,
доцент, кандидат физ.-мат.
наук Корников В. В.
Санкт Петербург
2003
Оглавление.
Введение…………………………………………………………………………..3
Глава 1.
Система кривых Пирсона.
§ 1.
Дифференциальное уравнение Пирсона…………………….………5
§ 2. Основные типы
кривых Пирсона…….……………………………...8
§ 3. Переходные типы кривых Пирсона…………………………………17
Глава
2. Применение ортогональных полиномов Чебышева при нахождении кривых
распределения вероятностей.
§ 1. Получение ортогональных полиномов по способу Чебышева…...23
§ 2. Обобщение метода Грамма - Шарлье………………...…………….33
§ 3. Весовые функции и кривые распределения
вероятностей…….….36
Глава
3. Примеры нахождения кривых распределения вероятностей и программное
обеспечение.
§ 1. Примеры нахождения кривых распределения вероятностей……..40
§ 2. Алгоритм
вычислений...................................……...……...………...46
Заключение……………………………………………………………………..47
Литература……………………………………………………………………...48
Введение.
Математическая статистика является наукой, которая изучает
соотношения, столь глубоко проникающие в суть вещей, что их можно встретить при
самых различных обстоятельствах. Результаты исследований, полученные с помощью
аппарата математической статистики, используются в самых различных областях
науки и техники, таких как биология, медицина, анатомия, геология, экология,
экономика, и т.д.
Данная дипломная работа посвящена рассмотрению двух основных
задач математической статистики:
1.
получению кривой распределения
вероятностей по имеющейся выборке;
2.
нахождению
зависимости между двумя случайными величинами, заданными своими выборками.
Для решения первой задачи используются различные методы. В
данной работе рассмотрен метод Карла Пирсона, представителя английской школы
статистики. Им было получено дифференциальное уравнение
,
а так же введен критерий æ (каппа Пирсона), с
помощью которого Пирсон классифицировал решения этого дифференциального
уравнения и представил их в виде двенадцати типов.
Позже в своих теоретических исследованиях Колмогоров А. Н. и
Марков А. А. доказали, что любой закон распределения может быть записан в виде
одного из двенадцати типов кривых Пирсона, поэтому для решения данной задачи
используется метод Пирсона нахождения кривой распределения.
Для решения второй задачи используется метод П.Л. Чебышева,
создателя Санкт – Петербургской математической школы. В статистике имя
знаменитого русского математика П. Л. Чебышева (1821-1894) известно главным
образом по так называемому неравенству Чебышева, которое он предложил для
распределения вероятностей, и которое имеет силу для любого статистического
распределения численностей.
Однако за последнее время в статистике всё большее значение
приобретают ортогональные полиномы Чебышева, которые имеют особое значение при
определении множественной и криволинейной регрессии и при вычислении
коэффициентов обобщённой функции нормального распределения вероятностей.
Чебышев предложил общую интерполяционную формулу, при которой возможно
интерполирование в самых разнообразных случаях. Эта интерполяционная формула
удовлетворяет условиям метода наименьших квадратов и выражена при помощи его
ортогональных полиномов. Общая интерполяционная формула, или, иначе ряд
Чебышева, предложен Чебышевым в 1855 году. Она имеет вид
.
Таким образом в дипломной работе
рассматриваются два метода:
ü метод
Пирсона нахождения кривых распределения вероятностей,
ü метод
Чебышева получения ортогональных полиномов,
которые были положены в основу обобщенного метода Грамма –
Шарлье нахождения кривой распределения вероятностей.
Глава 1.
Система кривых Пирсона.
В данной главе ставится задача нахождения закона распределения случайной
величины в удобном для практического использования виде. Для ее решения
рассматривается подход К. Пирсона, который является выдающимся представителем
английской статистической школы.
§ 1. Дифференциальное уравнение
Пирсона.
Рассмотрим случайную величину, заданную своей выборкой , таким образом, можем
записать - статистической
распределение. Ставится задача нахождения закона распределения случайной
величины в удобном для практического использования виде.
Метод Пирсона заключается в том, что мы рассматриваем
дифференциальное уравнение Пирсона:
(1)
и исследуем,
какие решения можно получить при различных значениях параметров уравнения (1).
Общий интеграл этого уравнения представим в виде:
где
.
Значение этого неопределенного интеграла зависит от корней
уравнения
(2),
следовательно,
от его дискриминанта
который можно
написать в виде
,
вводя
параметр
æ.
Или иначе,
величину æ можно представить в виде:
æ,
где величины представимы через
центральные моменты статистических распределений к-го
порядка, которые определяются по формуле
,
где есть
.
Тогда
, .
Через
величины можно представить и
величины следующим образом [5]:
Величина æ называется критерием Пирсона (каппа
Пирсона) и различные значения ее дают нам следующие выводы о корнях уравнения:
А. Если æ, то и уравнение (1) имеет
вещественные корни различных знаков.
В. Если 0< æ<1,
то и уравнение (1) имеет
комплексные корни.
С. Если æ>1, то и
уравнение (1) имеет вещественные корни одного знака.
Соответственно этим случаям Пирсон различает три главных типа своих
кривых, которые он назвал соответственно типами I, IV и VI. Затем æ может равняться ,
что дает переходные типы кривых. Наконец, присоединяя некоторые дополнительные
условия, мы можем увеличить число переходных типов. Всего система кривых
Пирсона заключает 12 типов и нормальную кривую.
В своих разработках Колмогоров А. Н. и Марков А. А. доказали,
что любой закон распределения может быть записан в виде одного из двенадцати
типов кривых Пирсона, поэтому для решения задачи идентификации используется
метод Пирсона.
§ 2. Основные типы кривых Пирсона.
В этом параграфе будут рассмотрены основные типы кривых распределения
вероятностей, предложенные и классифицированные Пирсоном.
Тип I.
Пусть æ<0. Тогда
и уравнение
(2) имеет вещественные корни различных знаков: ,
так что можем записать
.
Тогда правая
часть уравнения (1) может быть представлена в виде:
,
где
.
Пусть еще
.
Тогда
уравнение (1) перепишется в виде
и общий
интеграл его можно представим в виде
,
где и значения и должны удовлетворять
условиям
.
Тип I получается, если заключается в интервале . Тогда
и
или, как
обычно пишут
.
Так как выражаются
определенным образом через моменты ,
то, очевидно, и также выражаются
через те же моменты. Для этого введем число
.
Тогда простое преобразование дает следующие формулы:
.
Эти формулы
используются вообще при вычислении параметров и других кривых Пирсона.
Далее,
пользуясь этими же формулами,
,
следовательно,
.
Затем
,
или, после
простых подсчетов,
,
где
.
Таким
образом, и представляют корни
уравнения
,
Когда найдены и , и находятся по формулам
,
в которых
, .
Здесь
использовано равенство
,
которое
получается, так мы имеем
,
и
,
следовательно,
,
откуда
(так как ), нужно брать .
Таким образам, и есть корни уравнения
и и по формулам
,
в которых
,
где находится из равенства
.
Остается найти . Оно
находится по равенству
.
При помощи
подстановки
мы находим:
.
Следовательно,
.
Тип IV.
Второй
главный тип кривых Пирсона, соответствующий значениям
0< æ<1, когда уравнение (1) имеет
комплексные корни.
Пусть
эти корни равны
,
где
.
Тогда
уравнение (1) будет
,
откуда
,
и
,
или
,(3)
причем
.
Параметры кривой (3), выражаются следующим образом через моменты и константы :
(здесь , и ),
,
где - функция Пирсона,
определяемая равенством
.
Интеграл в правой части можно привести к другому виду:
подстановка
приводит его
к виду
.
Обычно,
полагая
,
пишут в виде
,
где
.
Тип VI.
Третий главный тип кривых Пирсона, соответствующий значениям критерия æ>1
. В этом случае уравнение (2) имеет вещественные корни одного знака. Не
приводя вывода уравнения кривой типа VI, аналогичного выводу уравнения кривой
типа I [5], прямо приведем уравнение, отнесенное к средней выравниваемого
распределения, как началу координат:
(в нем ). Его параметры
вычисляются по формулам:
,
причем
берется , если и , если ; и дают выражения:
,
причем должно
быть ;
,
и
.
Уравнение кривой типа VI пишут также в виде:
беря за
начало координат точку
.
Параметры вычисляются как выше, а имеет теперь такое
выражение:
.
Кривая простирается от до , если , и от до , если .
§ 3. Переходные типы кривых Пирсона.
Переходные типы кривых Пирсона получаются при специальных значениях
критерия æ и при некоторых условиях, налагаемых
на и .
Тип II.
Получается при æ=0, и имеет уравнение
,
отнесенное к моде, которая теперь равна средней (кривая
симметрична относительно начала). Ее параметры вычисляются по формулам
Кривая простирается от -а до а. На концах распределения , если и , если . Эта кривая имеет так
называемую U-образную форму с антимодой вместо
моды.
Тип VII.
Имеет
уравнение
,
получается
при æ=0, и
имеет параметры
Нчало
координат в средней (средняя равна моде).
Тип III.
Имеет уравнение
с началом
координат в моде и с параметрами
.
Получается при æ
Тип V.
Имеет
уравнение
с параметрами
кривая
получается при æ=1 и бесконечна в одном направлении.
Тип VIII.
Имеет
уравнение
,
простирается
от –а до 0, получается при
æ,
причем зависит от , а параметр т
получается как решение уравнения
и он не
должен быть больше 1 или меньше 0.
Тогда
,
а начало в
точке
Тип IX.
Имеет
уравнение
,
простирается
от –а до 0, получается при
æ
Параметр т
определяется как решение уравнения
Тогда
,
а начало
будет в точке
Тип X.
Имеет
уравнение
с началом
координат в точке ; получается как
специальный случай кривой типа III
при .
Тип XI
Имеет
уравнение
,
получается
при
æ
и
простирается от до , а т находится из
уравнения
и b зависит от m.
Тогда
,
а начало
координат в точке
.
Тип XII.
Имеет уравнение
,
получается
при
æ.
Кривая
простирается от до , начало координат в точке и
.
Тип N.
Тринадцатый тип кривых распределения Пирсона – нормальная
кривая с уравнением
,
которая
получается при условиях
æ.
Типы II, VI, VII, VIII, IX представляют специальные случаи кривой типа I, тип X – специальный случай типа III, а тип XI -
типа VI. [5] (См. приложение 1.)
Глава 2.
Применение ортогональных полиномов Чебышева при нахождении кривых распределения
вероятностей.
В этой главе рассмотрено получение ортогональных полиномов способом,
который разработал П. Л. Чебышев. А именно, через разложение в непрерывную
дробь суммы
и
рассмотрение знаменателей подходящих дробей полученной непрерывной дроби.
Причем показано, что полученные таким образом ортогональные полиномы отвечают
условиям метода наименьших квадратов, а так же показано их применение для
нахождения кривых распределения вероятностей.
§ 1. Получение
ортогональных полиномов по способу Чебышева.
Пусть даны значения интерполируемой функции,
соответствующие
значения аргумента . Каждому значению аргумента ставится в соответствие
частота .
Требуется найти такую целую функцию
,
где , которая удовлетворяла бы
условию наименьшего значения суммы
.
В данной
задаче в качестве веса предлагается
рассмотреть [8]
,
где n есть
или иначе
говоря n - сумма всех испытаний.
Для решения нашей задачи находим коэффициенты ,
которые определяются из следующих уравнений
;
;
……………………
;
;
После
преобразований получаем следующую систему уравнений для нахождения
коэффициентов
;
;
……………………
……………………
;
……………………
;
где
Такой подход к нахождению коэффициентов имеет существенный
недостаток – при повышении степени полинома хотя бы на единицу приходится
переписывать все уравнения и решать систему заново.
Есть другой вариант построения искомого полинома [8].
Пусть будет целая функция от степени , которая обращается в при . Положим
,
где - целые функции степеней , а - коэффициенты.
Пусть теперь сумма первых
членов выражения
равняется
,
т.е. .
Каковы в этом
случае условия относительно и при которых сумма
имеет
наименьшее значение?
Обозначим эту сумму через :
,
и, подставляя
в нее
,
составляем
обычным способом дифференцирования следующие уравнения:
Отсюда
следует:
Так как есть ортогональные
полиномы по построению, следовательно все слагаемые вида будут равняться 0.
В результате преобразований получим выражения для коэффициентов :
;
;
………………
;
………………
.
Теперь можно представить функцию
в таком виде
.
Легко убедиться, что для перехода от найденного выражения интерполируемой
функции к целой функции степени ,
достаточно к левой части полученной функции приписать один новый член
.
Для дальнейшего перехода к целой функции степени , также удовлетворяющей
условию наименьшего значения суммы
,
достаточно
прибавить к найденному выражению функции степени ,
такой новый член
.
Таким образом, решение задачи параболического интерполирования
по способу наименьших квадратов приводится к нахождению ряда
Этот ряд, обладающий свойством давать посредством суммы своих первых членов приближенное
представление интерполируемой функции в виде целой функции степени , удовлетворяющей
требованию наименьших квадратов, называется интерполяционным рядом Чебышева.
Теперь для полного решения задачи остается еще узнать, что представляют
собой функции , определив через
данные величины и коэффициенты при в выражении этих функций.
Далее,
с помощью разложения дроби
по нисходящим
степеням получим, что дробь
,
где
,
дает
приближенное представление функции [7]
с точностью
до членов степени
включительно.
Здесь есть весовая функция,
найденная ранее по методу Пирсона. Но эта дробь, у которой степень числителя на
единицу меньше степени знаменателя, при разложении в непрерывную дробь всегда
будет в своих неполных частных содержать переменную в
первой степени. Следовательно, знаменатели ее подходящих дробей есть функции степеней ; поэтому можно положить
.
Что касается
, то его можно приравнять .
Разлагая
в
непрерывную дробь вида
,
где и - некоторые постоянные,
используем найденные выше свойства функции для
определения этих постоянных через данные значения .
Выражения для
будет иметь вид:
.
Выражения для
коэффициентов будут
следующими:
.
Вводя для
сокращения обозначение
через , запишем выражение для в таком виде:
.
Для выражение будет иметь вид
.
Что касается
величин и , то они равны
соответственно
и .
Теперь перейдем к определению коэффициентов в
выражении
.
Для получим выражение
.
Это выражение весьма упростится, если мы
будем считать отклонениями данных значений аргумента от его средней
арифметической так, что . Тогда , а выражение для будет иметь вид
.
Также
упростятся выражения для
и .
Функция станет равной , функции определяются путем
последовательных подстановок выражений в
формулы
.
При помощи этих формул можно вычислить какой угодно член ряда
Чебышева
.
Оценка результатов интерполирования производится при помощи
среднего квадратического отклонения данных значений интерполируемой функции от
вычисленных по найденному уравнению параболы.
Обозначим сумму квадратов отклонений через .
Тогда можно написать
.
будет равняться
,
а выражать рекуррентно через по формуле
.
Итак,
, ,
,
, ,
, ,
, , , , .
Мы видим, что в зависимости от нашей весовой функции в разложении мы получим
разные системы ортогональных полиномов.
§ 2. Обобщение Грамма - Шарлье.
Пусть по методу Пирсона найден вид кривой распределения вероятностей на соответствующем
интервале. Теперь, для представления в удобном для практического использования
виде, запишем полученную кривую в несколько иной форме. Для этого используем
обобщение Грамма – Шарлье, которое основывается на применении ортогональных
полиномов Чебышева и состоит в том, что кривая распределения вероятностей
представима в виде следующего разложения:
(4)
где - есть к–ая
производная функции . Здесь полагаем,
что
.
Таким
образом, мы получаем кривую распределения вероятностей теперь уже в виде .
Производные функции мы
можем представить в виде [3]
,
тогда можем
записать
где функции должны удовлетворять
следующему свойству:
если (5)
А коэффициенты получаются из
равенства (4) с помощью домножения на любой из ортогональных полиномов и, интегрирования
полученного равенства:
=
=
Отсюда
следует, что
.
На практике в этом разложении мы используем только четыре первых члена,
и коэффициенты перед ними есть:
Коэффициенты имеют четкий
статистический смысл, а именно: коэффициент ,
выраженный через , отвечает за
асимметрию закона распределения, и коэффициент выраженный
через - за эксцесс или дефект
кривой распределения.
Свойство (5) есть свойство ортогональности полиномов, т. е. по определению является
системой ортогональных полиномов, которая получена по способу Чебышева в
предыдущем параграфе [3], [5].
§ 3.
Весовые функции и системы ортогональных полиномов.
В общей теории ортогональных полиномов известно, что система
ортогональных полиномов называется классической, если она ортогональна
относительно весовой функции, которая является решением дифференциального
уравнения Пирсона [2], [6]. То есть, здесь прослеживается связь между теорией
классических ортогональных полиномов и задачами математической статистики
(нахождением закона распределения вероятностей).
Полиномы Чебышева - Эрмита.
Пусть многочлен (2) не имеет корней, тогда уравнение Пирсона
(1) после переноса начала координат запишется в виде
,
тогда решение
этого уравнения запишется в виде
Страницы: 1, 2
|