ГЛАВА 13

MathCAD имеет развитый аппарат работы с задачами математической статистики. С одной стороны, имеется большое количество встроенных специальных функций, позволяющих рассчитывать плотности вероятности идругие основные характеристики основных законов распределения случайных величин (см. разд. 13.1). Наряду с этим, в MathCAD запрограммированосоответствующее количество генераторов псевдослучайных чисел для каждого закона распределения (см. разд. 13.1), что позволяет эффективно проводить моделирование методами Монте-Карло. Имеется возможность строить гистограммы и рассчитывать статистические характеристики выборокслучайных чисел и случайных процессов, таких как средние, дисперсии,корреляции и т. п. (см. разд. 13.2). При этом случайные последовательностимогут как создаваться генераторами случайных чисел, так и вводиться пользователем из файлов.
В заключение главы рассматривается решение средствами MathCAD 2001нескольких типичных примеров из области анализа случайных процессов(см. разд. 13.3) математической статистики (см. разд. 13.4).
13.1. Случайные величины
Для моделирования различных физических, экономических и прочих эффектов широко распространены методы, называемые методами Монте-Карло. Их основная идея состоит в создании определенной последовательности случайных чисел, моделирующей тот или иной эффект, например шумв физическом эксперименте, случайную динамику биржевых индексов ит. п. Для этих целей в MathCAD встроен ряд генераторов псевдослучайныхчисел.
Согласно определению, случайная величина принимает то или иное значение, но какое конкретно, зависит от случайных обстоятельств опыта и зара- нее точно предсказано быть не может. Можно лишь говорить о вероятности р (хк) принятия случайной дискретной величиной того или иного значения хк,или о вероятности попадания непрерывной случайной величины в тот илииной числовой интервал (х,х+Дх). Вероятность Р(хк) или р(х)-(Дх) соответственно может принимать значения от о (такое значение случайной величины совершенно невероятно) до i (случайная величина заведомо примет значение от х до х+Дх). Соотношение р(хк) называют законом распределения случайной величины, а зависимость р(х) между возможными значенияминепрерывной случайной величины и вероятностями попадания в их окрестность называется ее плотностью вероятности (probability density).
В MathCAD имеется ряд встроенных функций, задающих используемые вматематической статистике законы распределения. Они вычисляют как значение плотности вероятности различных распределений по значению случайной величины х, так и некоторые сопутствующие функции. Все они, посути, являются либо встроенными аналитическими зависимостями, либоспециальными функциями. Большой интерес представляет наличие генераторов случайных чисел, создающих выборку псевдослучайных данных с соответствующим законом распределения. Рассмотрим подробно возможностиMathCAD на нескольких наиболее популярных законах распределения, азатем приведем перечень всех распределений, встроенных в MathCAD.
13.1.1. Нормальное (Гауссово) распределение
В теории вероятности доказано, что сумма различных независимых случайных слагаемых (независимо от их закона распределения) оказывается случайной величиной, распределенной согласно нормальному закону (т. н.центральная предельная теорема). Поэтому нормальное распределение хорошо моделирует самый широкий круг явлений, для которых известно, что наних влияют несколько независимых случайных факторов.
Перечислим встроенные функции, имеющиеся в MathCAD для описаниянормального распределения вероятностей:
- dnorm(x,мю,сигма) - плотность вероятности нормального распределения;- рnоrm(х,мю,сигма) - функция нормального распределения;- сnоrm(х) - функция нормального распределения для ц=о,а=1;- qnоrm(р,мю,сигма) - обратная функция нормального распределения;
- rnоrm(м,мю, сигма) - вектор м независимых случайных чисел, каждое из которых имеет нормальное распределение;
 х - значение случайной величины;
 Р - значение вероятности;
 мю - математическое ожидание;
 сигма - среднеквадратичное отклонение.
Математическое ожидание и дисперсия являются, по сути, параметрамираспределения. Плотность распределения для трех пар значений параметровпоказана на рис. 13.1. Напомним, что плотность распределения dnorm задаетвероятность попадания случайной величины х в малый интервал от х дох+Дх. Таким образом, например, для первого графика (сплошная линия) вероятность того, что случайная величина х примет значение в окрестностинуля, приблизительно в три раза больше, чем вероятность того, что онапримет значение в окрестности х=2. А значения случайной величины, большие 5 и меньшие -5, и вовсе очень маловероятны.

Рисунок 13.1
Рис. 13.1. Плотность вероятности нормальных распределений

Рисунок 13.2
Рис. 13.2. Нормальные функции распределения
Функция распределения F(x) (cumulative probability) - это вероятность того,что случайная величина примет значение меньшее или равное х. Как следует из математического смысла, она является интегралом от плотности вероятности в пределах от -°= до х. Функции распределения для упомянутыхнормальных законов изображены на рис. 13.2. Функция, обратная F(x)(inverse cumulative probability), называемая еще квантилем распределения, по зволяет по заданному аргументу р определить значение х, причем случайнаявеличина будет меньше или равна х с вероятностью р.

Примечание
Здесь и далее графики различных статистических функций, показанные на рисунках, получены с помощью MathCAD без каких-либо дополнительных выражений в рабочей области.

Приведем несколько примеров, позволяющих почувствовать математический смысл рассмотренных функций на примере случайной величины х,распределенной по нормальному закону с мю=о и сигма=1 (листинги 13.1-13.5).
Листинг 13.1. Вероятность того, что х будет меньше 1.881
Листинг 13.1
Листинг 13.2. 97%-ный квантиль нормального распределения
Листинг 13.2
Листинг 13.3. Вероятность того, что х будет больше 2
Листинг 13.3
Листинг 13.4. Вероятность того, что х будет находиться в интервале (2,3)
Листинг 13.4
Листинг 13.5. Вероятность того, что |х|<2
Листинг 13.5
Обратите внимание, что задачи двух последних листингов решаются двумяразными способами. Второй из них связан с еще одной встроенной функцией erf, называемой функцией ошибок (или интегралом вероятности, илифункцией Крампа).
- erf (х) - функция ошибок
- erfc(x)=l-erf(х)
Математический смысл функции ошибок ясен из листинга 13.5. Интегралвероятности имеет всего один аргумент, в отличие от функции нормальногораспределения. Исторически, последняя пересчитывалась через табулированный интеграл вероятности по формулам, приведенным в листинге 13.6для произвольных значений параметров ц и а (листинг 13.6).
Листинг 13,6. Вероятность того, что х будет в интервале (2,3)
Листинг 13.6
Если вы имеете дело с моделированием методами Монте-Карло, то в качестве генератора случайных чисел с нормальным законом распределенияприменяйте встроенную функцию rnorm. В листинге 13.7 ее действие показано на примере создания двух векторов по м=500 элементов в каждом с независимыми псевдослучайными числами xli и х21; распределенными согласно нормальному закону. О характере распределения случайных элементов векторов можно судить по рис. 13.3. В дальнейшем мы будем частосталкиваться с генерацией случайных чисел и расчетом их различных средних характеристик.
Листинг 13.7. Генерация двух векторов с нормальным законом распределения
Листинг 13.7

Рисунок 13.3
Рис. 13.3. Псевдослучайные числа с нормальным законом распределения (листинг 13.7)
13.1.2. Равномерное распределение
Самое простое распределение случайной величины - это распределение спостоянной вероятностью. Вероятность p=const=i/(b-a) при хе(а,Ь) и р=о,для х вне интервала (а,Ь). Эту плотность вероятности, наряду с прочимистатистическими характеристиками, задают следующие встроенные функции:
- dunif (x,a,b) - плотность вероятности равномерного распределения;
- punif(x,a,b) - функция равномерного распределения;
- qunif (p,a,b) - квантиль равномерного распределения;
- runif (м, а,Ь) - вектор м независимых случайных чисел, каждое из которых имеет равномерное распределение;
- rnd (x) - случайное число, имеющее равномерную плотность распределения на интервале (0,х);
 х - значение случайной величины;
 Р - значение вероятности;
 (а,b) - интервал, на котором случайная величина распределена равномерно.
Чаще всего в несложных программах применяется последняя функция, которая приводит к генерации одного псевдослучайного числа. Наличие такойвстроенной функции в MathCAD - дань традиции, применяемой в большинстве сред программирования. Пример использования генератора вектораиз м случайных чисел показан на рис. 13.4, который получен заменой вдвух последних строках листинга 13.7 генератора нормальных чисел наrunif (м, 0,1). Плотность вероятности и функция равномерного распределения показаны на рис. 13.5.

Рисунок 13.4
Рис. 13.4. Псевдослучайные числа с равномерным законом распределения

Рисунок 13.5
Рис. 13.5. Плотность вероятностии функция равномерного распределения
13.1.3. Биномиальное распределение
Приведем встроенные функции, описывающие еще одно распределениеслучайной величины, которая, в отличие от двух предыдущих, является ненепрерывной, а может принимать лишь дискретные значения. Биномиальное распределение описывает последовательность независимых испытаний,каждое из которых может приводить к генерации определенного событияс постоянной вероятностью р.
- dbinom(k,n,p) - плотность вероятности биномиального распределения(рис. 13.6);
- pbinom(k,n,p) - функция биномиального распределения;- qbinom(p,n,p) - квантиль биномиального распределения;
- rbinom(M,n,p) - вектор м независимых случайных чисел, каждое из которых имеет биномиальное распределение;
 к - дискретное значение случайной величины;
 Р - значение вероятности;
 п - параметр распределения (количество независимых испытаний);
 р - параметр распределения (вероятность единичного случайного события).
Примером биномиального распределения может служить n-кратное подбрасывание монеты. Вероятность выпадения орла или решки в каждом испытании равна р=о.5, а суммарное количество выпадений, например, орла, задается биномиальной плотностью вероятности. Приведем простой пример:если монета подбрасывалась 50 раз, то наиболее вероятное количество выпадений орла, как видно по максимуму плотности вероятности на рис. 13.6,составляет 25. Вероятность того, что орел выпадет 25 раз, составляетdbinom(25,50,0.5)=о. 112, а, скажем, вероятность того, что 15 разdbinom(15,50,0.5)=0.002.

Рисунок 13.6
Рис. 13.6. Плотность вероятности биномиального распределения
13.1.4. Другие статистические распределения
Как легко заметить по рассмотренным трем распределениям, MathCADимеет четыре основных категории встроенных функций. Они различаютсянаписанием их первой литеры, а оставшаяся часть имени функций (ниже всписке функций она условно обозначена звездочкой) идентифицирует тотили иной тип распределения.
- d*(x,par) - плотность вероятности;- р*(х,раr) - функция распределения;- q*(p,par) - квантиль распределения;
- r*(м,раr) - вектор м независимых случайных чисел, каждое из которыхимеет соответствующее распределение;
 х - значение случайной величины (аргумент функции);
 Р - значение вероятности;
 par - список параметров распределения.
Чтобы получить функции, относящиеся, например, к равномерному распределению, вместо * надо поставить unif и ввести соответствующий списокпараметров par. Он будет состоять в данном случае из двух чисел а,b - интервала распределения случайной величины.
Перечислим все типы распределения, реализованные в MathCAD, вместе сих параметрами, на этот раз обозначив звездочкой * недостающую первуюбукву встроенных функций. Некоторые из плотностей вероятности показаны на рис. 13.7.
-*beta(x,si,s2) - бета-распределение (si,s2>o - параметры, o<x<i).
-*Mnom(k,n,p) - биномиальное распределение (п- целый параметр,o<k<n и о<р<1 - параметр, равный вероятности успеха единичного испытания).

Рисунок 13.7
Рис. 13.7. Плотность вероятности некоторых распределений
- *cauchy(x,i,s) - распределение Коши (1 - параметр разложения, s>o -параметр масштаба).
- *chisq(x,d) - у? ("хи-квадрат") распределение (d>o - число степенейсвободы).
- *ехр(х,г) - экспоненциальное распределение (г>о - показатель экспоненты).
- *F(x,did2) - распределение Фишера (di,d2>o- числа степеней свободы).
- *gainma(x,s) - гамма-распределение (s>o - параметр формы).
- *geom(k,p) - геометрическое распределение (о<р<1 - параметр, равныйвероятности успеха единичного испытания).
- *hypergeom(k,a,b,n) - гипергеометрическое распределение (а,b,n- целые параметры).
- *1nоrm(х,мю,сигма) - логарифмически нормальное распределение (мю - натуральный логарифм математического ожидания, сигма>о - натуральный логарифм среднеквадратичного отклонения).
- *logis(x,i,s) - логистическое распределение (i - математическое ожи- дание, s>o - параметр масштаба).
- *nolnorm(k,n,p) - отрицательное биномиальное распределение (n>о -целый параметр, о<р<1).
- *nоrm(х,мю, о) - нормальное распределение (мю - среднее значение, о>0 -среднеквадратичное отклонение).
- *pois(k,X) - распределение Пуассона (Х>о - параметр).- *t(x,d) - распределение Стьюдента (d>o - число степеней свободы).- *unif (x,a,b) - равномерное распределение (а<b - границы интервала).- *weibuil(x,s) - распределение Вейбулла (s>o - параметр).
Вставку рассмотренных статистических функций в программы удобно осуществлять с помощью диалогового окна Insert Function (Вставка функции).Для этого необходимо выполнить следующие действия:
1. Установите курсор на место вставки функции в документе.
2. Вызовите диалоговое окно Insert Function нажатием кнопки f(x) на стандартной панели инструментов, или командой меню Insert / Function(Вставка / Функция), или нажатием клавиш <Ctrl>+<E>.
3. В списке Function Category (Категория функции) (рис. 13.8) выберите одну из категорий статистических функций. Категория Probability Density(Плотность вероятности) содержит встроенные функции для плотностивероятности, Probability Distribution (Функция распределения) - длявставки функций или квантилей распределения, Random Numbers(Случайные числа) - для вставки функции генерации случайных чисел.
4. В списке Function Name (Имя функции) выберите функцию, в зависимости от требующегося закона распределения. При выборе того или иногоэлемента списка в текстовых полях в нижней части окна будет появляться информация о назначении выбранной функции.
5. Нажмите кнопку ОК для вставки функции в документ.

Рисунок 13.8
Рис. 13.8. Диалоговое окно Insert Function
13.2. Статистические характеристики
В большинстве статистических расчетов вы имеете дело либо со случайнымиданными, полученными в ходе какого-либо эксперимента (которые выводятся из файла или печатаются непосредственно в документе), либо с результатами генерации случайных чисел, рассмотренными в предыдущих разделах встроенными функциями, моделирующими то или иное явление ме тодом Монте-Карло. Рассмотрим возможности MathCAD по оценке функций распределения и расчету числовых характеристик случайных данных.
13.2.1. Построение гистограмм
Гистограммой называется график, аппроксимирующий по случайным данным плотность их распределения. При построении гистограммы областьзначений случайной величины (а,b) разбивается на некоторое количествоbin сегментов, а затем подсчитывается процент попадания данных в каждыйсегмент. Для построения гистограмм в MathCAD 2001 имеется нескольковстроенных функций. Рассмотрим их, начиная с самой сложной по применению, чтобы лучше разобраться в возможностях каждой из функций.
Гистограмма с произвольными сегментами разбиения
- hist(intvis,x) - вектор частоты попадания данных в интервалы гистограммы;
 intvis - вектор, элементы которого задают сегменты построения гистограммы в порядке возрастания a<intvisi<b;
 х - вектор случайных данных.
Если вектор intvis имеет bin элементов, то и результат hist имеет столькоже элементов. Построение гистограммы иллюстрируется листингом 13.8 ирис. 13.9.
Листинг 13.8. Построение гистограммы
Листинг 13.8
Для анализа взято N=1OOO данных с нормальным законом распределения,созданных генератором случайных чисел (третья строка листинга). Далееопределяются границы интервала (upper, lower), содержащего внутри себя все случайные значения, и осуществляется его разбиение на количество(bin) одинаковых сегментов, начальные точки которых записываются в вектор int (предпоследняя строка листинга).
В векторе int можно задать произвольные границы сегментов разбиения так, чтобы они имели разную ширину.

Рисунок 13.9
Рис. 13.9. Построение гистограммы(листинг 13.8)
Обратите внимание, что в последней строке листинга осуществлена нормировка значений гистограммы, с тем чтобы она правильно аппроксимировалаплотность вероятности, также показанную на графике. Очень важно переопределение вектора int в самом верху рис. 13.9, которое необходимо дляперехода от левой границы каждого элементарного сегмента к его центру.
Гистограмма с разбиением на равные сегменты
Если нет необходимости задавать сегменты гистограммы разной ширины, тоудобнее воспользоваться упрощенным вариантом функции hist.
- hist (bin,x) - вектор частоты попадания данных в интервалы гистограммы;
 bin - количество сегментов построения гистограммы;
 х - вектор случайных данных.
Для того чтобы использовать этот вариант функции hist вместо предыдущего, достаточно заменить первый из ее аргументов в листинге 13.8
Недостаток упрощенной формы функции hist в том, что по-прежнему необходимо дополнительно определять вектор сегментов построения гистограммы. От этого недостатка свободна появившаяся в MathCAD 2001 функция histogram.
- histogram (bin, х) - матрица гистограммы размера Ыпх2, состоящая изстолбца сегментов разбиения и столбца частоты попадания в них данных;
 bin - количество сегментов построения гистограммы;
 х - вектор случайных данных.
Примеры использования функции histogram приведены в листинге 13.9 ирис. 13.10. Сравнение с предыдущим листингом подчеркивает простоту построения гистограммы этим способом (стоит отметить, что в листинге 13.9.в отличие от предыдущего, мы не нормировали гистограмму).
Листинг 13.9. Упрощенный вариант построения гистограммы
Листинг 13.9

Рисунок 13.10
Рис. 13.10. График и матрица гистограммы (листинг 13.9)
Создание графика-гистограммы
Для того чтобы создать график в виде гистограммы:
1. Постройте двумерный график, задайте переменные по осям и пределыоси х (в примере из листинга 13.9 это числа lower и upper).
2. Войдите в диалоговое окно Formatting Currently Selected Graph
(Форматирование) выбранного графика (например, двойным щелчкоммыши) и перейдите на вкладку Traces (Графики).
3. Установите для серии данных гистограммы в поле Туре (Тип) элементсписка bar (столбцы) или solidbar (гистограмма) (рис. 13.11).
4. Нажмите кнопку ОК.

Рисунок 13.11
Рис. 13.11. Установка типа графика для построения гистограммы
На рис. 13.9 и 13.10 были применены установки графика bar (столбцы).В MathCAD 2001 появилась новая возможность построения гистограммы вболее привычном виде - закрашенными столбиками (solidbar). Такой типграфика иллюстрируется рис. 13.11.
13.2.2. Среднее значение и дисперсия
В MathCAD 2001 имеется ряд встроенных функций для расчетов числовыхстатистических характеристик рядов случайных данных.
- mean(x) - выборочное среднее значение;
- median (х") - выборочная медиана (median) - значение аргумента, котороеделит гистограмму плотности вероятностей на две равные части;
- var(x) - выборочная дисперсия (variance);
- stdev(x) - среднеквадратичное (или "стандартное") отклонение (standarddeviation);
- max(x), min(x) - максимальное и минимальное значения выборки;
- mode(x) - наиболее часто встречающееся значение выборки;
- Var (x), stdev(x) - выборочная дисперсия и среднеквадратичное отклонение в другой нормировке;
 х - вектор (или матрица) с выборкой случайных данных.
Пример использования первых четырех функций приведен на листинге 13.10.
Листинг 13.10. Расчет числовых характеристик случайного вектора
Листинг 13.10
На рис. 13.12 приведена гистограмма выборки случайных чисел, распределенных согласно закону Вейбулла. Пунктирные вертикальные прямые, показанные на графике, рассчитаны в последней строке листинга и обозначают стандартное отклонение от среднего значения. Гистограмма полученас помощью листинга 13.8, рассмотренного в предыдущем разделе. Обратитевнимание, что поскольку распределение Вейбулла, в отличие, например, отгауссова, несимметричное, то медиана не совпадает со средним значением.

Рисунок 13.12
Рис. 13.12. Гистограмма распределения Вейбулла (листинг 13.10)
Определение статистических характеристик случайных величин приведенов листинге 13.11 на еще одном примере обработки выборки малого объема(по пяти данным). В том же листинге иллюстрируется применение еще двухфункций, которые имеют смысл дисперсии и стандартного отклоненияв несколько другой нормировке. Сравнивая различные выражения, вы безтруда освоите связь между встроенными функциями.
Осторожно относитесь к написанию первой литеры в этих функциях, особеннопри обработке малых выборок (листинг 13.11).
Листинг 13.11. К определению статистических характеристик
Листинг 13.11
13.2.3. Генерация коррелированныхслучайных чисел*
До сих пор мы рассматривали наиболее простой случай применения генераторов независимых случайных чисел. В методах Монте-Карло часто требуется создавать случайные числа с определенной корреляцией. Приведем пример программы, создающей два вектора xi и х2 одинакового размера и одним и тем же распределением, случайные элементы которых попарнокоррелированы с коэффициентом корреляции к (листинг 13.12).
Листинг 13.12. Генерация попарно коррелированных случайных чисел
Листинг 13.12
Результат действия программы для R=о.4 показан на рис. 13.13 (слева).Сравните полученную выборку с правым графиком, полученным для высокой корреляции (R=о.э) и с рис. 13.3 (см. разд. 13.1.1) для независимых данных, т. е. R=о.

Рисунок 13.13
Рис. 13.13. Псевдослучайные числа с корреляцией R=0.4 (листинг 13.12) и R=0.9
13.2.4. Ковариация и корреляция
Функции, устанавливающие связь между парами двух случайных векторов,называются ковариацией и корреляцией (или, по-другому, коэффициентом корреляции). Они различаются нормировкой, как следует из их определения(листинг 13.13).
- соrr(х) - коэффициент корреляции двух выборок- cvar(x) - ковариация двух выборок
 xl, х2 - векторы (или матрицы) одинакового размера с выборкамислучайных данных
Листинг 13.13. Расчет ковариации и корреляции(продолжение листинга 13.12)
Листинг 13.13
13.2.5. Коэффициенты асимметрии и эксцесса
Коэффициент асимметрии задает степень асимметричности плотности вероятности относительно оси, проходящий через ее центр тяжести. Коэффициент асимметрии определяется третьим центральным моментом распределения. В любом симметричном распределении с нулевым математическиможиданием, например, нормальным, все нечетные моменты, в том числе итретий, равны нулю, поэтому коэффициент асимметрии тоже равен нулю.
Степень сглаженности плотности вероятности в окрестности главного максимума задается еще одной величиной - коэффициентом эксцесса. Он показывает, насколько острую вершину имеет плотность вероятности по сравнению с нормальным распределением. Если коэффициент эксцесса большенуля, то распределение имеет более острую вершину, чем распределениеГаусса, если меньше нуля, то более плоскую.
Для расчета коэффициентов асимметрии и эксцесса в MathCAD имеютсядве встроенные функции.
- kurt (x) - коэффициент эксцесса (kurtosis) выборки случайных данных х;
- skew(x) - коэффициент асимметрии (skewness) выборки случайных данных X .
Примеры расчета коэффициентов асимметрии и эксцесса для распределенияВейбулла (см. рис. 13.10) приведены в листинге 13.14.
Листинг 13.14. Расчет выборочных коэффициентов асимметрии и эксцесса
Листинг 13.14
13.2.6. Другие статистические характеристики
В предыдущих разделах были рассмотрены встроенные функции, рассчитывающие наиболее часто используемые статистические характеристики выборок случайных данных. Иногда в статистике встречаются и иные функции,например, помимо арифметического среднего, применяются другие средниезначения.
- gmean(x) - геометрическое среднее выборки случайных чисел;- hmean(x) - гармоническое среднее выборки случайных чисел.
Математическое определение этих функций и пример их использования вMathCAD приведены в листинге 13.15.
Листинг 13.15. Вычисление различных средних значений
Листинг 13.15
13.2.7. Действие статистических функцийна матрицы
Все рассмотренные примеры работы статистических функций относились квекторам, элементы которых были случайными числами. Но точно так жевсе эти функции применяются и по отношению к выборкам случайных дан ных, сгруппированных в матрицы. При этом, статистические характеристики рассчитываются для совокупности всех элементов матрицы, без разделения ее на строки и столбцы. Например, если матрица имеет размерностьMXN, то и объем выборки будет равен м-м.
Соответствующий пример вычисления среднего значения приведен в листинге 13.16. В его первой строке определяется матрица данных х размера4x2. Действие встроенной функции mean матричного аргумента (последняястрока листинга) иллюстрируется явным суммированием элементов матрицы х (предпоследняя строка). Действие прочих встроенных функций на матрицы совершенно аналогично действию их на векторы (листинг 13.17).
Листинг 13.16. Вычисление среднего значения элементов матрицы
Листинг 13.16
Листинг 13.17. Действие различных статистических функций на матрицу
Листинг 13.17

Примечание
Некоторые статистические функции (например, вычисления ковариации) имеютдва аргумента. Они также могут быть матрицами, но, в соответствии со смыслом функции, должны иметь одинаковую размерность.

Большинству статистических функций позволяется иметь в качестве аргументов даже не одну матрицу, а любое количество матриц, векторов и ска ляров. Числовые характеристики будут рассчитаны для всей совокупностизначений аргументов функции. Соответствующий пример приведен в листинге 13.18.
Листинг 13.18. Статистические функции нескольких аргументов
Листинг 13.18
13.3. Случайные процессы*
Встроенные функции для генерации случайных чисел создают выборку изслучайных данных AI. Часто требуется создать непрерывную или дискретную случайную функцию A(t) одной или нескольких переменных (случайный процесс или случайное поле), значения которой будут упорядоченыотносительно своих переменных. Создать псевдослучайный процесс можноспособом, представленным в листинге 13.19.
Листинг 13.19. Генерация псевдослучайного процесса
Листинг 13.19
В первой строке листинга 13.19 определено количество N независимых случайных чисел, которые будут впоследствии сгенерированы, и радиус временной корреляции т. В следующих трех строках определяются моменты времени TJ, которым будут отвечать случайные значения Attj). Созданиенормального случайного процесса сводится к генерации обычным способомвектора независимых случайных чисел х и построению интерполяционнойзависимости в промежутках между ними. В листинге 13.19 используетсясплайн-интерполяция (см. гл. 14).
В результате получается случайный процесс A(t), радиус корреляции которого определяется расстоянием т между точками, для которых строится интерполяция. График случайного процесса A(t> вместе с исходными случайными числами показан на рис. 13.14. Случайное поле можно создать несколько более сложным способом с помощью многомерной интерполяции.

Рисунок 13.14
Рис. 13.14. Псевдослучайный процесс(листинг 13.19)
К случайным процессам, сгенерированным таким способом, как и к даннымэксперимента, применяются любые статистические методы обработки, например, корреляционный или спектральный анализ. Приведем в качествепримера листинг 13.20, показывающий, как организовать расчет корреляционной функции случайного процесса.
Листинг 13.20. Дискретизация случайного процесса
Листинг 13.20 и вычисление корреляционной функции (продолжение листинга 13.19)
Дискретизация интервала (0,ттах) для случайного процесса A(t) произведена с различным элементарным интервалом Д (первая строка листинга).В зависимости от значения А, получается различный объем п выборки случайных чисел УЬ являющихся значениями случайной функции A(t) в точкахдискретизации. В последних четырех строках определяются различные характеристики случайной величины Y, являющиеся, по сути, характеристиками случайного процесса A(t). График рассчитанной в 2-м+1 точках корреляционной функции R(j) показан на рис. 13.15.

Примечание
Внимательному читателю предлагается самостоятельно ответить на вопрос:почему при таком расчете корреляционной функции ее значение R(0) не равно1, как должно быть по определению?


Рисунок 13.15
Рис. 13.15. Корреляционная функция (листинги 13.19-13.20)
13.4. Некоторые примеры*
Приведем два характерных статистических примера, которые легко решаются с помощью MathCAD 2001.
13.4.1. Интервальная оценка дисперсии*
Требуется определить числовой интервал (a,b), внутри которого будет лежать с вероятностью 1-а=75% дисперсия нормальной случайной величины,исходя из объема выборки в N чисел. Эта задача решается в статистике с помощью ^-распределения (листинг 13.21).
Листинг 13.21. Интервальное оценивание дисперсии
Листинг 13.21
Указанный интервал называется (1-а)% доверительным интервалом. Обратитевнимание на использование при решении данной задачи функции stdev(с прописной буквы) для расчета выборочного стандартного отклонения.В статистике часто встречаются выражения, которые более удобно записывать через функции в такой нормировке, именно для этого они и появилисьв MathCAD.
13.4.2. Проверка статистических гипотез*
В статистике рассматривается огромное число задач, связанных с проверкойтех или иных гипотез н. Разберем пример простой гипотезы. Пусть имеетсявыборка N чисел с нормальным законом распределения и неизвестнымидисперсией и математическим ожиданием. Требуется принять или отвергнуть гипотезу н о том, что математическое ожидание закона распределенияравно некоторому числу мюО=о.2.
Задачи проверки гипотез требуют задания уровня критерия проверки гипотезы а, который описывает вероятность ошибочного отклонения истинной н.Если взять а очень малым, то гипотеза, даже если она ложная, будет почтивсегда приниматься; если, напротив, взять а близким к 1, то критерий будеточень строгим, и гипотеза, даже верная, скорее всего, будет отклонена.В нашем случае гипотеза состоит в том, что мюо=о.2, а альтернатива- чтомю0 неравно 0.2. Оценка математического ожидания, как следует из курса классической статистики, решается с помощью распределения Стьюдента с параметром N-I (этот параметр называется степенью свободы распределения).
Для проверки гипотезы (листинг 13.22) рассчитывается (а/2) - квантильраспределения Стьюдента т, который служит критическим значением дляпринятия или отклонения гипотезы. Если соответствующее выборочноезначение t по модулю меньше т, то гипотеза принимается (считается верной). В противном случае гипотезу следует отвергнуть.
Листинг 13.22. Проверка гипотезы о математическом ожиданиипри неизвестной дисперсии
Листинг 13.22
В последней строке листинга вычисляется истинность или ложность условия, выражающего решение задачи. Поскольку условие оказалось ложным(равным не 1, а 0), то гипотезу необходимо отвергнуть.
На рис. 13.16 показано распределение Стьюдента с N-I степенью свободы,вместе с критическими значениями, определяющими соответствующий интервал. Если t (оно тоже показано на графике) попадает в него, то гипотезапринимается; если не попадает (как произошло в данном случае) - отвергается. Если увеличить а, ужесточив критерий, то границы интервала будутсужаться, по сравнению с показанными на рисунке.
В листинге 13.23 приводится альтернативный способ проверки той же самойгипотезы, связанный с вычислением значения не квантиля, а самого распределения Стьюдента.

Рисунок 13.16
Рис. 13.16. К задаче проверки статистических гипотез (листинг 13.22)
Листинг 13.23. Другой вариант проверки гипотезы(продолжение листинга 13.22)
Листинг 13.23
Мы разобрали только два характерных примера статистических вычислений.Однако с помощью MathCAD легко решаются самые разнообразные задачиматематической статистики.

Примечание
Большое количество задач разобрано в Центре Ресурсов в рубрике Statistics(Статистика).


Глава 12 Содержание Глава 14