Министерство общего ипрофессионального образования
Свердловской области
Учебно-технический центр ООО «Омега-1»
КУРСОВАЯ РАБОТА
Использование статистических функцийв математическом пакете MathCAD
Исполнитель: Молчанов Е.Е.
группа ВМ-311
Руководитель: Нечаева М.Г.
Екатеринбург 2010
СодержаниеВведение1. MathCADи основные принципы работы в MathCAD1. Типовыестатистические функции в MathCAD2. Статистическиефункции для векторов и матриц3. Функциивычисления плотности распределения вероятности4. Функциираспределения5. Квантилираспределения6. Функциисоздания векторов с различными законами распределения7. Линейнаярегрессия8. Функциидля линейной регрессии9. Линейнаярегрессия общего вида10. Функциядля линейной регрессии общего вида11. Полиномиальнаярегрессия12. Функциидля одномерной и многомерной полиномиальной регрессии13. ПрактическаячастьЗаключениеСписоклитературы
Введение
В MathCAD имеется ряд встроенныхфункций, задающих используемые в математической статистике законыраспределения. Они вычисляют как значение плотности вероятности различныхраспределений по значению случайной величины х, так и некоторые сопутствующиефункции. Все они, по сути, являются либо встроенными аналитическимизависимостями, либо специальными функциями. Большой интерес представляетналичие генераторов случайных чисел, создающих выборку псевдослучайных данных ссоответствующим законом распределения, что является основой методовМонте-Карло.
Перед автором всталапроблема, выяснения статистических функции в программе MathCAD.
Актуальность проблемыобъясняется следующей причиной:
· Сейчасмного людей работает с компьютерами, занимается программированием и работает в MathCAD,но для успешной работы некоторые не знают таких вещей как статистическиефункции, без них работа не будет такой успешной как хотелось бы.
Автор предложил гипотезу:зная статистические функции, можно успешно работать в MathCAD.
Объект исследования этойтемы: MathCAD.
Предмет исследования этойтемы: статистические функции.
Цель этой работы: выяснитькакие бывают статистические функции в MathCAD.
В соответствии с цельюсформулированы задачи работы:
· узнатьчто такое MathCAD
· узнатькакие бывают статистические функции
Источником информации дляэтой работы является интернет.
Новизна этой работысубъективная, автор раньше этого не знал и не задумывался над этой темой.
1. MathCAD и основные принципы работы в MathCAD
MathCAD — программа для выполнения и документированияинженерных и научных расчётов.
Основные возможности:
· Решение дифференциальных уравнений различными численными методами
· Построение двух- и трёхмерных графиков функций
· Использование греческого алфавита, как в уравнениях, так и втексте
· Выполнение вычислений в символьном режиме
· Выполнение операций с векторами и матрицами
· Символьное решение систем уравнений
· Аппроксимация кривых
· Выполнение подпрограмм
· Поиск корней многочленов и функций
· Проведение статистических расчётов и работа с распределениемвероятностей
· Поиск собственных чисел и векторов
· Вычисления с единицами измерения
· Интеграция с САПР системами, использование результатов вычисленийв качестве управляющих параметров2. Типовые статистические функциив MathCAD
С помощью системы MathCAD можно проводить наиболеераспространенные статистические расчеты с данными, представленными векторами ихзначений. Существует также ряд статистических функций для скалярного аргумента.С них и начнем.
Существуют следующие встроенные статистические функциискалярного аргумента x:
cnorm(x) — функция кумулятивного стандартного нормальногораспределения;
erf(x) — функция ошибок;
rnd(x) — функция генерации случайных чисел;
corr(VX,VY) — коэффициент корреляции двух векторов — VX иVY;
cvar(X,Y) — коэффициент ковариации Xи Y.
Через функцию erf(x) легко вычисляется дополнительнаяфункция ошибок:
erfc(x):= 1- erf(x)
Это одна из дополнительных и хорошо известных статистическихфункций, включенных в состав MathCAD.
Функция rnd(x) при каждом обращении к ней возвращаетслучайное число с равномерным распределением на отрезке [0, 1]. Эта функцияшироко применяется при статистическом моделировании различных физическихпроцессов. Числа являются не строго случайными — в действительности этоповторяющиеся последовательности из большого количества чисел, распределениекоторых близко к равномерному.3. Статистические функции длявекторов и матриц
Следующая группа функций относится к вычислению основныхстатистических параметров одномерного массива данных — вектора:
mean(V) — возвращает среднеезначение элементов вектора V;
median(V) — возвращает медиануэлементов вектора V;
var(V) — возвращает дисперсию(вариацию) для элементов вектора V;
stdev(V) — задает стандартноеотклонение элементов вектора V;
hist(int,V) — возвращает векторчастот попадания данных V в заданные интервалы int (служит для построениягистограмм).
В функции hist(int,V) вектор int должен содержать значения границ,в которых подсчитывается число попаданий данных из вектора V. Если строитсягистограмма из N элементов, то вектор int должен содержать N + 1 элемент.Функция возвращает вектор из N элементов, числовые значения которых можноиспользовать для графического построения гистограмм.
/>
Рис. 1. Работа со случайными числами
На рис. 1. представлен фрагмент документа MathCAD, в котороморганизована генерация вектора X из 1000 случайных чисел, дано их распределениеи вычислены основные статистические параметры массива случайных чисел — вектораX. Этот фрагмент иллюстрирует также применение функции hist.
При достаточно большом числе случайных чисел вид гистограммыприближенно говорит о законе их распределения. Так, если высоты столбцовпримерно равны, то распределение будет равномерным.
Указанные функции могут использоваться и для обработкиданных, представленных элементами (действительными и комплексными) матриц Aразмера m x n.4. Функции вычисления плотностираспределения вероятности
Функции вычисления плотности вероятности распределенияпредставлены следующим набором:
· dbeta(x,s1,s2) — бета-распределение (s1, s2>0 — параметрыформы, 0 dbinom(k,n,p) — биномиальное распределение (возвращает значениевероятности P(x = k), где n и k целые числа, причем 0ЈkЈn и 0ЈpЈ1);
· dcauchy(x,l,s) — распределение Коши (l — параметр разложения,s>0 — параметр масштаба);
· dchisq(x,d) — хи-квадрат-распределение (x, d>0, причем d — число степеней свободы);
· dexp(x,r) — экспоненциальное распределение (r,x>0);
· dF(x,d1,d2) — распределение Фишера (d1, d2>0 — числа степенейсвободы, x>0);
· dgamma(x,s) — гамма-распределение (s>0 — параметр формы, xі0);
· dgeom(k,p) — геометрическое распределение (0
· dlnorm(x,m,s) — логарифмическое нормальное распределение (m — натуральный логарифм среднего значения, s>0 — натуральный логарифмсреднеквадратичного отклонения, x>0);
· dlogis(x,l,s) — логистическое распределение (l — параметрразложения, s>0 — параметр масштаба);
· dnbinom(k,n,p) — отрицательное биномиальное распределение (n>0и k>0 — целые числа, 0
· dnorm(x,m,s) — нормальное распределение (m — среднее значение,s>0 — среднеквадратичное отклонение);
· dpois(k,l) — распределение Пуассона (l>0, k — целоенеотрицательное число);
· dt(x,d) — распределение Стьюдента (d>0 — число степенейсвободы, x — вещественное число);
· dunif(x,a,b) — равномерное распределение (a и b — граничные точкиинтервала, причем a
· dweibull(x,s) — распределение Вейбулла (s>0 — параметр формы).5. Функции распределения
Функции распределения дают вероятность того, что случайнаявеличина будет иметь значения, меньшие или равные определенной величине. Онипредставлены ниже (смысл и значения параметров указаны ранее):
· pbeta(x,s1,s2) — значение в точке x функции бета-распределения;
· pbinom(k,n,p) — значение функции распределения биномиальногозакона для k успехов в серии из n испытаний;
· pcauchy(x,l,s) — значение в точке x функции распределения Коши сошкалой параметров l и s;
· pchisq(x,d) — значение в точке x кумулятивногохи-квадрат-распределения, в котором d — степень свободы;
· pexp(x,r) — значение в точке x функции экспоненциальногораспределения;
· pF(x,d1,d2) — значение в точке x функции распределения Фишера;
· pgamma(x, s) — значение в точке x функции гамма-распределения;
· pgeom(k,p) — значение в точке x функции геометрическогораспределения;
· plnorm(x,m,s) — значение в точке x функции логарифмическогонормального распределения;
· plogis(x,l,s) — значение в точке x функции логистическогораспределения;
· pnorm(x,m,s) — значение в точке x функции нормального распределения;
· pnbinom(k,n,p) — значение в точке x функции отрицательногобиномиального распределения;
· ppois(k,l) — значение для k функции распределения Пуассона;
· pt(x,d) — значение в точке x функции распределения Стьюдента;
· punif(x,a,b) — значение в точке x функции равномерногораспределения;
· pweibull(x,s) — значение в точке x функции распределенияВейбулла.6. Квантили распределения
Следующая группа задает обращения (квантили) функцийраспределения случайных величин. Они позволяют по заданной вероятностивычислить такое значение x, при котором вероятность равна или меньше заданногозначения p:
· qbeta(p,s1,s2) — квантили обратного бета-распределения спараметрами формы s1 и s2;
· qbinom(p,n,q) — количество успешных определений при решенииуравнения Бернулли, если число испытаний равно n, вероятность этого количествауспешных определений равна p, а q — вероятность успеха при однократномиспытании (0JqЈ1 и 0ЈpЈ1);
· qcauchy(p,l,q) — квантили обратного распределения Коши со шкалойпараметров l и s (s>0 и 0
· qchisq(p,d) — квантили обратного xи-квадрат-распределения;
· qexp(p,r) — квантили обратного экспоненциального распределения,при котором параметр r>0 определяет частоту (0Јp
· qF(p,d1,d2) — квантили обратного распределения Фишера, в которомd1 и d2 — степени свободы;
· qgamma(p,s) — квантили обратного гамма-распределения;
· qgeom(p,q) — квантили обратного геометрического распределения;
· qlnorm(p,m,s) — квантили обратного логарифмического нормальногораспределения;
· qlogis(p,l,s) — квантили обратного логистического распределения;
· qnbinom(p,n,q) — квантили обратного отрицательного биномиальногораспределения с размером n и вероятностью ошибки q;
· qnorm(p,m,s) — квантили обратного нормального распределения сосредним значением m и стандартным отклонением s;
· qpois(p,l) — квантили обратного распределения Пуассона;
· qt(p,d) — квантили обратного распределения Стьюдента (dопределяет степени свободы, d>0 и 0 qunif(p,a,b) — квантили обратногоравномерного распределения;
· qweibull(p,s) — квантили обратного распределения Вейбулла.7. Функции создания векторов сразличными законами распределения
Последняя группа статистических функций служит для созданиявекторов с определенными законами распределения значений их элементов:
· rbeta(m,s1,s2) — бета-распределение;
· rbinom(m,n,p) — биномиальное распределение;
· rcauchy(m,l,s) — распределение Коши;
· rchisq(m,d) — хи-квадрат-распределение;
· rexp(m,r) — экспоненциальное распределение,
· rF(m,d1,d2) — распределение Фишера;
· rgamma(m,s) — гамма-распределение;
· rgeom(m,p) — геометрическое распределение;
· rlnorm(m,m,s) — логарифмическое нормальное распределение;
· rlogis(m,l,s) — логистическое распределение;
· rnbinom(m,n,p) — отрицательное биномиальное распределение;
· rnorm(m,m,s) — нормальное распределение;
· rpois(m,l) — распределение Пуассона;
· rt(m,d) — распределение Стьюдента;
· runif(m,a,b) — равномерное распределение;
· rweibull(m,s) — распределение Вейбулла.
На рис. 2. показан фрагмент документа MathCAD с примерамипостроения графиков различных статистических функций и задания наборов чисел сразличным распределением.
/>
Рис. 2. Примеры применения статистических функций
Обилие статистических функций, включенных в систему MathCAD,позволяет с ее помощью выполнять достаточно сложные статистические расчеты.Однако все же надо отметить, что существуют более мощные специализированныепакеты для выполнения статистических расчетов, например Statistica илиStatGraphics, которые заметно превосходят MathCAD в части многовариантностистатистических вычислений.1. Линейная регрессия
/>
Рис.3. Линейная регрессия
Как видно на рис 3. прямая регрессии проходит в «облаке»исходных точек с максимальным среднеквадратичным приближением к ним. Чем ближекоэффициент корреляции к 1, тем точнее представленная исходными точками зависимостьприближается к линейной.2. Функции для линейной регрессии
Другой широко распространенной задачей обработки данныхявляется представление их совокупности некоторой функцией у(х). Задачарегрессии заключается в получении параметров этой функции такими, чтобы функцияприближала облако исходных точек (заданных векторами VX и VY) с наименьшейсреднеквадратичной погрешностью. Чаще всего используется линейная регрессия,при которой функция у(х) имеет вид:
у(х) =а+ Ь*х
и описывает отрезок прямой. К линейной регрессии можносвести многие виды нелинейной регрессии при двухпараметрических зависимостяху(х).
Для проведения линейной регрессии в систему встроен рядприведенных ниже функций:
· corr(VX, VY) — возвращает скаляр — коэффициент корреляцииПирсона;
· intercept(VX, VY) — возвращает значениепараметра а (смещение линии регрессии по вертикали);
· slope(VX, VY) — возвращает значение параметра b (наклона линиирегрессии).3. Линейная регрессия общего вида
/>
Рис. 4. Линейная регрессия общего вида
Расположение координат точек исходного массива может бытьлюбым, но вектор VX должен содержать координаты, упорядоченные в порядке ихвозрастания, а вектор VY ординаты, соответствующие абсциссам в векторе VX.8. Функция для линейной регрессииобщего вида
В MathCAD реализована возможность выполнения линейнойрегрессии общего вида. При ней заданная совокупность точек приближаетсяфункцией вида:
F(x, К1, К2, ., Kn)= K1, F1(x)+K2 F2(x)+ +КnFn(x)
Таким образом, функция регрессии является линейнойкомбинацией функций F1(x), F2(x), …, Fn(x), причем сами эти функции могутбыть нелинейными, что резко расширяет возможности такой аппроксимации ираспространяет ее на нелинейные функции.
Для реализации линейной регрессии общего вида используетсяфункция linfit(VX,VY,F) Эта функция возвращает вектор коэффициентов линейнойрегрессии общего вида К, при котором среднеквадратичная погрешность приближенияоблака исходных точек, если их координаты хранятся в векторах VX и VY,оказывается минимальной Вектор F должен содержать функции F1(x), F2(x),,Fn(x), записанные в символьном виде.9.
Полиномиальная регрессия
/>
Рис. 5. Полиномиальная регрессия
На практике не рекомендуется делать степеньаппроксимирующего поли нома выше четвертой — шестой, поскольку погрешностиреализации регрессии сильно возрастают.
Функция regress создает единственный приближающий полином,коэффициенты которого вычисляются по всей совокупности заданных точек, т еглобально. Иногда полезна другая функция полиномиальной регрессии, дающаялокальные приближения отрезками полиномов второй степени, — loess(VX, VY,span). Эта функция возвращает используемый функцией interp(VS,VX,VY,x) векторVS, дающий наилучшее приближение данных (с координатами точек в векторах VX иVY) отрезками полиномов второй степени Аргумент span>0 указывает размерлокальной области приближаемых данных (рекомендуемое начальное значение — 0,75).
Чем больше span, тем сильнее сказывается сглаживание данных.При больших span эта функция приближается к regress(VX,VY,2).
На рис. 5. показан пример приближения сложной функции сослучайным разбросом ее ординат с помощью совокупности отрезков полиномов второйстепени (функция loess) для двух значений параметра span.
На рис. 5. нетрудно заметить, что при малом значении span,равном 0 05, отслеживаются характерные случайные колебания значений функции,тогда как уже при span=0,5 кривая регрессии становится практически гладкой. Ксожалению, из-за отсутствия простого описания аппроксимирующей.10. Функции дляодномерной и многомерной полиномиальной регрессии
Введена в новую версию MathCAD и функция для обеспеченияполиномиальной регрессии при произвольной степени полинома регрессии
regress(VX,VY, n)
Она возвращает вектор VS, запрашиваемый функциейinterp(VS,VX,VY,x), содержащий коэффициенты многочлена п-й степени, которыйнаилучшим образом приближает «облако» точек с координатами, хранящимися ввекторах VX и VY.11. Практическая часть
Тема: Использованиестатистических функции в математическом пакете MathCAD.
Цель: Создать регрессию.
Программные средства:математический пакет MathCAD.
Ход работы:
1. Задаю вектора экспериментальныхзначений x и y.
2. Присваиваю значение к переменной z иввожу функцию regress(x, y, n)
3. Вывожу результатпеременной z
4. Создаю график, задаю нужныезначения
5. Результат
Заключение
статистический функция регрессияраспределение
В ходе работы были сделаны следующие выводы:
— автор узнал, что такое MathCAD,для чего он используется и узнал какие статистические функции бывают в MathCAD.
— так же автор узнал, по предложенным картинкам как выглядятте или иные функции.
Самооценка: автор считает, что он достиг поставленной цели ипонятно изложил всю тему.
Значимость моей работы заключается в том что, я решил этупроблему, и теперь могу без проблем работать в MathCAD.Так же я узнал новое из этой работы, и те учащиеся, которые заинтересованы вэтой теме тоже узнали нового. Конечно, возникла трудность с поиском литературы,материала для данной работы существует не так много.
Гипотеза автора подтвердилась, автор узнал, какие бываютстатистические функции, и теперь он без проблем может работать в MathCAD.
Цель была достигнута, автор выяснил, какие бываютстатистические функции.
Задачи этой работы были решены, автор узнал, что такое MathCAD и узнал какие бываютстатистические функции/
Список литературы
1. http://www.sistemair.ru/dok/mathcad12/Glava_12/Index03.htm
2. http://www.piter.com/attachment.php?barcode=978531800362&at=exc&n=0
3. http://ru.wikipedia.org/wiki/MathCad