Дифференциальные и интегральные функции распределения

Министерство науки иобразования РФ
Казанский государственныйархитектурно-строительный университет
КафедраТеплогазоснабжения и вентиляции
Реферат
по дисциплине«Метрология, стандартизация и сертификация»
на тему:
Дифференциальные иинтегральные функции распределения
Казань 2010 г.

Содержание
Введение
Глава 1. Вероятностное описаниерезультатов и погрешностей
Глава 2. Числовые параметрызаконов распределения. Центр распределения. Моменты распределений
Глава 3. Оценкарезультата измерения
Глава 4. Характеристикинормального распределения
Заключение
Список использованнойлитературы

Введение
Измерения –один из важнейших путей познания природы человеком. Они играют огромную роль всовременном обществе. Наука, техника и промышленность не могут существовать безних. Каждую секунду в мире производятся многие миллиарды измерительныхопераций, результаты которых используются для обеспечения надлежащего качестваи технического уровня выпускаемой продукции, обеспечения безопасной ибезаварийной работы транспорта, для медицинских и экологических диагнозов идругих важных целей. Практически нет ни одной сферы деятельности человека, гдебы интенсивно не использовались результаты измерений, испытаний и контроля.
Поэтомуследует говорить об измерительных технологиях, понимаемых какпоследовательность действий, направленных на получение измерительной информациитребуемого качества.
Другойфактор, подтверждающий важность измерений, – их значимость. Основой любой формыуправления, анализа, прогнозирования, планирования контроля или регулированияявляется достоверная исходная информация, которая может быть получена толькопутем измерения требуемых физических величин, параметров и показателей.Естественно, что только высокая и гарантированная точность результатовизмерений обеспечивает правильность принимаемых решений.
Задача,которая ставится перед метрологом, желающим приблизиться к истинному значениюизмеряемой величины и оценить вероятность определенного отклонения в единичномопыте или в серии измерений, состоит в отыскании закона распределениявероятности получения определенного результата от какого-либо аргумента,связанного с отклонением результата от истинного значения. Наиболееуниверсальным способом достижения этой цели является отыскание интегральных идифференциальных функций распределения вероятности.

Глава 1. Вероятностное описание результатов и погрешностей
Если приповторных измерениях одной и той же физической величины, проведенных содинаковой тщательностью и в одинаковых условиях получаемые результаты,отличаются друг от друга, то это свидетельствует о наличии случайных погрешностей.Случайные погрешности являются результатом одновременного воздействия наизмеряемую величину многих случайных возмущений. Предсказать результатнаблюдения или исправить его введением поправки невозможно. Можно лишь сопределенной долей уверенности утверждать, что истинное значение измеряемойвеличины находится в пределах разброса результатов наблюдений от xmin до xmax, где xmin, xmax – соответственно, нижняяи верхняя границы разброса.
Однакоостается неясным, какова вероятность появления того или иного значенияпогрешности, какое из множества лежащих в этой области значений величиныпринять за результат измерения и какими показателями охарактеризовать случайнуюпогрешность результата. Для ответа на эти вопросы требуется принципиально иной,чем при анализе систематических погрешностей, подход. Подход этот основываетсяна рассмотрении результатов наблюдений, результатов измерений и случайныхпогрешностей как случайных величин. Методы теории вероятностей и математическойстатистики позволяют установить вероятностные (статистические) закономерностипоявления случайных погрешностей и на основании этих закономерностей датьколичественные оценки результата измерения и его случайной погрешности.
Дляхарактеристики свойств случайной величины в теории вероятностей используютпонятие закона распределения вероятностей случайной величины. Различают двеформы описания закона распределения: интегральную и дифференциальную. Вметрологии преимущественно используется дифференциальная форма – законраспределения плотности вероятностей случайной величины.
Рассмотримформирование дифференциального закона на примере измерений с многократныминаблюдениями. Пусть произведено n последовательных наблюдений одной и той жевеличины x и получена группанаблюдений x1, x2, x,…, xn. Каждое из значений xi содержит ту или инуюслучайную погрешность. Расположим результаты наблюдений в порядке ихвозрастания, от xmin до xmax и найдем размах ряда L = xmax − xmin. Разделив размах ряда на k равных интервалов Δl = L / k, подсчитаем количество наблюдений nk, попадающих в каждыйинтервал. Оптимальное число интервалов определяют по формуле Стерджесса k = 1÷3,3 lg n. Изобразим полученныерезультаты графически, нанеся на ось абсцисс значения физической величины иобозначив границы интервалов, а на ось ординат – относительную частотупопаданий nk/ n.Построив на диаграмме прямоугольники, основанием которых является ширинаинтервалов, а высотой nk / n, получим гистограмму, дающую представление о плотностираспределения результатов наблюдений в данном опыте.
На рис. 1показана полученная в одном из опытов гистограмма, построенная на основаниирезультатов 100 наблюдений, сгруппированных в таблице 1.
Таблица 1
/>
В данномопыте в первый и последующие интервалы попадает соответственно 0,06; 0,12;0,18; 0,25; 0,17; 0,14 и 0,08 от общего количества наблюдений; при этом,очевидно, что сумма этих чисел равна единице.

/>
Рис. 1.Гистограмма
Еслираспределение случайной величины х статистически устойчиво, то можно ожидать, чтопри повторных сериях наблюдений той же величины, в тех же условиях,относительные частоты попаданий в каждый интервал будут близки кпервоначальным. Это означает, что построив гистограмму один раз, припоследующих сериях наблюдений можно с определенной долей уверенности заранеепредсказать распределение результатов наблюдений по интервалам. Приняв общуюплощадь, ограниченную контуром гистограммы и осью абсцисс, за единицу, S0=1, относительную частотупопаданий результатов наблюдений в тот или иной интервал можно определить какотношение площади соответствующего прямоугольника шириной Δl к общей площади.
Прибесконечном увеличении числа наблюдений n→ ∞ и бесконечном уменьшении ширины интервалов Δl →0, ступенчатая кривая,огибающая гистограмму, перейдет в плавную кривую f (x) (рис. 2), называемую кривой плотности распределения вероятностейслучайной величины, а уравнение, описывающее ее, – дифференциальным законом распределения.Кривая плотности распределения вероятностей всегда неотрицательна и подчиненаусловию нормирования в виде
/>

/>
Рис. 2.Кривая плотности распределения вероятностей
Законраспределения дает полную информацию о свойствах случайной величины и позволяетответить на поставленные вопросы о результате измерения и его случайнойпогрешности. Если известен дифференциальный закон распределения f (x), то вероятность Ρ попадания случайнойвеличины х в интервал от x1 до x2 можно записать в следующемвиде
/>
Графическиэта вероятность выражается отношением площади, лежащей под кривой f (x) в интервале от x1 до x2 к общей площади,ограниченной кривой распределения. Следовательно, рассмотренное выше условие нормированияозначает, что вероятность попадания величины х в интервал [− ∞; + ∞] равна единице, т.е. представляет собойдостоверное событие. Вероятность этого события называется функциейраспределения случайной величины и обозначается F(x).Функцию распределения F(x) иногда называют также интегральной функциейраспределения.В терминах интегральной функции распределения имеем

P {x1 ≤ x ≤ x2} = F (x1)− F (x2),
т.е.вероятность попадания результата наблюдений или случайной погрешности взаданный интервал равна разности значений функции распределения на границахэтого интервала.
/>
Рис. 3.Интегральная (а) и дифференциальная (б) функции распределения случайнойвеличины
Интегральнойфункцией распределения F(x) называют функцию, каждое значениекоторой для каждого х является вероятностью события, заключающегося в том, что случайнаявеличина xiв i -м опыте принимает значение,меньшее х. График интегральнойфункции распределения показан на рис. 3, а. Она имеет следующие свойства:
− неотрицательная, т.е. F(x) ≥ 0;
− неубывающая, т.е. f (x2) ≥ F(x1), если x2 ≥ x1;
− диапазон ее изменения: от0 до 1, т.е. F(−∞) = 0; F(+∞) = 1;
− вероятность нахожденияслучайной величины х в диапазоне от x1 до
x2: P{x1

Запишем функциюраспределения через плотность:
/>
Площадь,ограниченная кривой распределения, лежащая левее точки x (х
– текущая переменная) (рис.4), отнесенная к общей площади, есть не что иное, как интегральная функцияраспределения F(x) = P{xi
/>
Рис. 4.Кривая плотности распределения вероятностей (дифференциальная функцияраспределения случайной величины)
Плотностьраспределения вероятностей f (x) называют
дифференциальнойфункцией распределения:
/>
Примерраспределения дискретной случайной величины приведен на рис. 5.

/>
Рис. 5.Распределение дискретной случайной величины
Глава 2. Числовые параметры законов распределения. Центр распределения.Моменты распределений
Функцияраспределения является самым универсальным способом описания поведениярезультатов измерений и случайных погрешностей. Однако для их определениянеобходимо проведение весьма длительных и кропотливых исследований ивычислений. В большинстве случаев бывает достаточно охарактеризовать случайныевеличины специальными параметрами, основными из которых являются:
− центр распределения;
− начальные и центральныемоменты и производные от них коэффициенты – математическое ожидание (МО),среднее квадратическое отклонение (СКО), эксцесс, контрэксцесс и коэффициентасимметрии.
Координатацентра распределения Xц определяет положение случайной величины на числовой оси и можетбыть найдена несколькими способами. Наиболее фундаментальным являетсяопределение центра по принципу симметрии вероятностей, т.е. нахождение такойточки XMна оси х, слева и справа откоторой вероятности появления различных значений случайных погрешностей равнымежду собой и составляют P1 =P2 = 0,5:
/>

Точка XM называется медианой, или 50%-ным квантилем.Для его нахождения у распределения случайной величины должен существовать тольконулевой начальный момент. Координата Хц может быть определена и как центр тяжестираспределения, т.е. как математическое ожидание случайной величины. Это такая точка X, относительно которойопрокидывающий момент геометрической фигуры, огибающей которой является кривая f (x), равен нулю:
/>
У некоторыхраспределений, например, у распределения Коши, не существует МО, так какопределяющий его интеграл расходится.
При симметричнойкривой плотности распределения вероятностей f (x)оценкой центра распределения может служить абсцисса моды распределения, т.е. координатамаксимума плотности распределения Xm. Однако есть распределения, у которых несуществует моды, например, равномерное. Распределения с одним максимумомназываются одномодальными, с двумя – двухмодальные. Те распределения, укоторых в средней части расположен не максимум, а минимум, называются антимодальными.
Длядвухмодальных распределений применяется оценка центра в виде центра сгибов:
/>
где xc1, xc2 – сгибы, т.е. абсциссыточек, в которых распределение достигает максимумов.
Дляограниченных распределений применяется оценка в виде центра размаха:

/>
где x1, x2 – первый и последнийчлены вариационного ряда, соответствующего распределению.
При выбореоценки центра распределения необходимо учитывать ее чувствительность к наличиюпромахов в обрабатываемой совокупности данных. Исключительно чувствительны кналичию промахов: оценка в виде центра размаха Xp (определяется по наблюдениям,наиболее удаленным от центра, каковыми и являются промахи); оценка в виде среднегоарифметического (ослабляется лишь из n раз). Защищенными от влияния промахов являютсяквантильные оценки: медиана XM и центр сгибов Xc, поскольку они не зависят от координат промахов.
Пристатистической обработке данных важно использовать наиболее эффективные, т.е.имеющие минимальную дисперсию, оценки центра распределения, так как погрешностьв определении Xцвлечет за собойнеправильную оценку СКО, границ доверительного интервала, эксцесса и т.д.
Все моментыпредставляют собой некоторые средние значения, причем, если усредняютсявеличины, отсчитываемые от начала координат, моменты называются начальными, а если от центра распределения– то центральными.
Начальныемоменты k-го порядка определяютсяформулами
/>
где pi – вероятность появлениядискретной величины. Здесь и ниже первая формула относится к непрерывным, авторая к дискретным случайным величинам. Из начальных моментов наибольшийинтерес представляет математическое ожидание МО случайной величины (k = 1):
/>
Центральныемоменты k-го порядкарассчитываются по формулам
/>
Изцентральных моментов особенно важную роль играет второй момент (k=2), дисперсия случайнойвеличины D
/>
Дисперсияслучайной величины характеризует рассеяние отдельных ее значений. Дисперсияимеет размерность квадрата случайной величины и выражает как бы мощностьрассеяния относительно постоянной составляющей. Однако чаще пользуютсяположительным корнем квадратным из дисперсии – средним квадратическимотклонением (СКО) σ = D, которое имеет размерность самой случайной величины.
Третийцентральный момент

/>
служитхарактеристикой асимметрии, или скошенности распределения. С его использованиемвводится коэффициентасимметрии υ= μ3/ σ³. Для нормальногораспределения коэффициент асимметрии равен нулю. Вид законов распределения приразличных значениях коэффициента асимметрии приведен на рис. 6, а.
Четвертыйцентральный момент
/>
служит дляхарактеристики плосковершинности или островершинности распределения. Этисвойства описываются с помощью эксцесса ε = μ4 / σ4.
Его значениялежат в диапазоне от 1 до ∞. Для нормального распределения ε = 3. Вид дифференциальной функциираспределения при различных значениях эксцесса показан на рис. 6, б.

/>
Рис. 6. Виддифференциальной функции распределения при различных значениях коэффициента асимметрии(а) и эксцесса (б)
Дадим болеестрогое определение постоянной систематической и случайной погрешностей.
Систематическойпостоянной погрешностью называется отклонение математического ожиданиярезультатов наблюдений от истинного значения измеряемой величины:
Θ = m1 −Q,
а случайнойпогрешностью – разность между результатом единичного наблюдения иматематическим ожиданием результатов:
Δx = xi − m1.
В этихобозначениях истинное значение измеряемой величины составляет
Q = xi − Θ −Δx.

Глава 3. Оценка результата измерения
На практикевсе результаты измерений и случайные погрешности являются величинамидискретными, т.е. величинами xi, возможные значения которых отделимы друг отдруга и поддаются счету. При использовании дискретных случайных величинвозникает задача нахождения точечных оценок параметров, их функцийраспределения на основании выборок – ряда значений xi, принимаемых случайной величиной x в n независимых опытах.Используемая выборка должна быть репрезентативной (представительной), т.е. должна достаточнохорошо представлять пропорции генеральной совокупности.
Оценкапараметра называется точечной, если она выражается одним числом. Задача нахождения точечныхоценок – частный случай статистической задачи нахождения оценок параметровфункции распределения случайной величины на основании выборки.
К оценкам,получаемым по статистическим данным, предъявляются требования состоятельности,несмещенности и эффективности. Оценка называется состоятельной, если при увеличениичисла наблюдений она стремится к истинному значению оцениваемой величины.
Оценканазывается несмещенной, если ее математическоеожидание равно истинному значению оцениваемой величины. В том случае, когда можнонайти несколько несмещенных оценок, лучшей из них считается та, которая имеетнаименьшую дисперсию. Чем меньше дисперсия оценки, тем более эффективной считают эту оценку.
Точечнойоценкой математического ожидания МО результата измерений является среднееарифметическое значение измеряемой величины
/>

При любомзаконе распределения оно является состоятельной и несмещенной оценкой, а такженаиболее эффективной по критерию наименьших квадратов.
Точечнаяоценка дисперсии, определяемая по формуле
/>
являетсянесмещенной и состоятельной.
Оценка среднегоквадратического отклонения СКО
/>
Полученныеоценки МО и СКО являются случайными величинами. Это проявляется в том, что приповторении несколько раз серий из n наблюдений каждый раз будут получаться различные оценки X и σ. Рассеяние этих оценокцелесообразно оценивать СКО Sx. Оценка СКО среднего арифметического значения
/>
Полученныеоценки позволяют записать итог измерений в виде
/>
Интервал,определяемый правой частью этого равенства, с некоторой вероятностью«накрывает» истинное значение Q измеряемой величины. Однако точечные оценки ничего не говорят означении этой вероятности.
Рассмотренныеточечные оценки параметров распределения дают оценку в виде числа, наиболееблизкого к значению неизвестного параметра. Такие оценки используют только прибольшом числе измерений. Чем меньше объем выборки, тем легче допустить ошибкупри выборе параметра.
Способы нахожденияоценок результата зависят от вида функции распределения и от имеющихсясоглашений по этому вопросу, регламентируемых в рамках законодательнойметрологии.
Распределенияпогрешностей результатов наблюдений, как правило, являются симметричными относительноцентра распределения, поэтому истинное значение измеряемой величины может бытьопределено как координата центра рассеивания Xц, т.е. центра симметрии распределения случайной погрешности(при условии, что систематическая погрешность исключена). Отсюда следуетпринятое в метрологии правило оценивания случайной погрешности в виде интервала,симметричного относительно результата измерения (Xц ± Δx).
В практикеизмерений встречаются различные формы кривых распределения случайных величин,целесообразно классифицировать их следующим образом:
− трапецеидальные,например, равномерное, треугольное (Симпсона);
− экспоненциальные,например, распределение Лапласа, распределение Гаусса (нормальное);
− семейство распределенийСтьюдента (предельное распределение семейства законов Стьюдента – распределениеКоши);
− двухмодальные, например,дискретное двузначное распределение, арксинусоидальное распределение, остро- икругло-вершинные двухмодальные распределения.
Однако чащевсего имеют дело с нормальным и равномерным распределением плотностивероятностей.
Учитываямноговариантность подходов к выбору оценок и в целях обеспечения единстваизмерений, правила обработки результатов наблюдений обычно регламентируютсянормативно-техническими документами (стандартами, методическими указаниями,инструкциями). Так, в стандарте на методы обработки результатов прямыхизмерений с многократными наблюдениями указывается, что приведенные в немметоды обработки установлены для результатов наблюдений, принадлежащих нормальномураспределению.
Глава 4. Характеристики нормального распределения
Нормальноераспределение плотности вероятности или распределение Гаусса (рис. 7)характеризуется тем, что, согласно центральной предельной теореме теориивероятностей, такое распределение имеет сумма бесконечно большого числабесконечно малых случайных возмущений с любыми распределениями.
/>
Рис. 7.Кривые нормального распределения
Применительнок измерениям это означает, что нормальное распределение случайных погрешностейвозникает тогда, когда на результат измерения действует множество случайныхвозмущений, ни одно из которых не является преобладающим. Практически,суммарное воздействие даже сравнительно небольшого числа возмущений приводит кзакону распределения результатов и погрешностей измерений, близкому к нормальному.
Ваналитической форме нормальный закон распределения выражается формулой
/>
где х – случайная величина; mx – математическое ожиданиеслучайной величины; σ – среднее квадратическое отклонение (СКО); е=2,71828 – основаниенатурального логарифма; π = 3,14159. Перенеся начало координат в центр распределения mx, и откладывая по осиабсцисс погрешность
Δx = x − mx, получим кривуюнормального распределения погрешностей
/>
Для группы изn наблюдений,распределённых по нормальному закону
/>
Рассмотримнесколько свойств нормального распределения погрешностей.
Криваянормального распределения погрешностей симметрична относительно оси ординат.Это означает, что погрешности, одинаковые по величине, но противоположные познаку, имеют одинаковую плотность вероятностей, т.е. при большом численаблюдений встречаются одинаково часто. Математическое ожидание случайнойпогрешности равно нулю.
Из характеракривой следует, что при нормальном законе распределения малые погрешности будутвстречаться чаще, чем большие. Так, вероятность появления погрешностей,укладывающихся в интервал от 0 до Δx1 (рис. 7), характеризуемая площадью S1, будет значительнобольше, чем вероятность появления погрешностей в интервале от Δx2 до Δx3 (площадь S2).На рис. 8 изображены кривые нормального распределения с различными средними квадратическимиотклонениями, причем σ1 >σ2 > σ3.
/>
Рис. 4.8.Рассеяние результатов наблюдений
Сравниваякривые между собой можно убедиться, что чем меньше СКО, тем меньше рассеяниерезультатов наблюдений и тем больше вероятность того, что большинство случайныхпогрешностей в них будет мало.
Естественно заключить,что качество измерений тем выше, чем меньше СКО случайных погрешностей. Есливместо случайной величины ввести так называемую нормированную случайнуювеличину
/>
то она такжебудет распределена по нормальному закону с центром распределения mx, абсцисса которого mx = 0, а σ =1. Поэтому формулу, определяющуюплотность вероятности, а также формулу функции распределения величины t можно записать так:

/>
Определенныйинтеграл с переменным верхним пределом, имеющий вид
/>
иопределяющий значение площади под кривой плотности вероятности, называютфункцией Лапласа.
Для неесправедливы следующие равенства:
Ф(− ∞) = −0,5; Ф(0) = 0; Ф(+ ∞) = 0,5; Ф(t) = −Ф(t).
Функцияраспределения F(t) связана с функциейЛапласа формулой
F(t) = 0,5 +Ф(t). (4.14)
Эта формулапозволяет при наличии таблицы значений Ф(t), соответствующихразличным значениям t, рассчитать F(t). Таблицы плотностивероятностей f(t) и функции Ф(t) нормированной случайной величины,распределенной по нормальному закону, дают возможность найти плотностьвероятности f(x) и значения функциираспределения F(x) любой случайной величины,распределенной по нормальному закону, если известны значения ее центрараспределения mxи параметра σ.
Еслислучайная величина х принимает значения лишь в пределах некоторого конечного интервалаот x1, до x2 с постоянной плотностью вероятностей(рис. 9), то такое распределение называется равномерным и описываетсясоотношениями
/>
/>
Рис. 9.Равномерное распределение случайной величины

Списокиспользованной литературы
1.    Марусина М.Я., ТкаличВ.Л., Воронцов Е.А., Скалецкая Н.Д. Основы метрологии стандартизации исертификации: учебное пособие. — СПб: СПбГУ ИТМО, 2009. — 164 с.
2.    Бурдун Г.Д., Марков Б.Н.Основы метрологии. Учебное пособие для вузов. Издание третье, переработанное –М.: Изд-во стандартов, 1985. — 256 с.
3.    Козлов М.Г. Метрология истандартизация: Учебник. М., СПб.: Изд-во «Петербургский ин-т печати», 2001. — 372 с.