–PAGE_BREAK–2. Выполнение в пакете STATGRAPHICS
Генерация выборки
Работа начинается с главного меню пакета (панель STATGRAPHICS Statistical Graphics System)
:
|STATGRAPHICS Statistical Graphics System|
DATA MANAGEMENT AND SYSTEM UTILITIES TIME SERIES PROCEDURES
A. Data Management L. Forecasting
B. System Environment M. Quality Control
C. Report Writer and Graphics Replay N. Smoothing
D. Graphics Attributes O. Time Series Analysis
PLOTTING AND DESCRIPTIVE STATISTICS ADVANCED PROCEDURES
E. Plotting Functions P. Categorical Data Analysis
F. Descriptive Methods Q. Multivariate Methods
G. Estimation and Testing R. Nonparametric Methods
H. Distribution Functions S. Sampling
I. Exploratory Data Analysis T. Experimental Design
ANOVA AND REGRESSION ANALYSIS MATHEMATICAL AND USER
PROCEDURES
J. Analysis of Variance U. Mathematical Functions
K. Regression Analysis V. Supplementary Operations
р
ис. 1. Главное меню
Выполнение:
H.Distribution functions(законы распределения) — 5.
Random NumberGeneration (генерация случайных чисел) — из списка Distributions available(возможные распределения) выбираем нужное и его номер вводим в окно
Distribution
number — F6 (исполнение) — вводим параметры распределения и объем выборки Number of samples; исходное состояние датчика случайных чисел (окно seed) оставим без изменения (однако, оно не должно превышать 2147483646) — F6 — вводим имя файла, в котором будем хранить все данные этой работы (в виде различных переменных): File: WORK (например), вводим имя переменной, в которой будет находиться наша выборка: Variable (переменная): x-F6.
Выборка сгенерирована. Посмотрим полученную выборку:
Ctrl + Break(быстрый возврат в главное меню вместо многократного Escили F10) — A.Data Management(управление данными) — 1.
Display Data Directory— выбираем нашу переменную WORK.
x — F6.
Наблюдаем выборку. Выпишем значения выборки или выведем на печать (клавиша F4) или сохраним (F3; повторный вызов: Report Writer & Graphics Replay (составление отчетов и вызов графиков)— Replay Texts & Graphic Files(вызов текстов и графических файлов ) ).
Посмотрим выборку графически. После возврата в главное меню (
Ctrl + Break):
E.Plotting Function(графические функции) — 1
.X-Y Line and Scatterplots (x-y графики) — вводим данные для графика: по оси xдолжны быть целые числа от 1 до n: в строку xзаписываем оператор (для n=50, например):
COUNT 50
этот оператор создает массив целых чисел от 1 до 50; в строкуyзаписываем x; в окне Points: Yes(точки нужны), в окне
Lines: Yes(клавишей «пробел», линии нужны) –
F6.
График выведем на печать (F4) или сохраним (F3).
Построение вариационного ряда
1-й способ
A.2.File Operations— вводим в окно file name: WORK(можно так: Ctrl+F7(список файлов) — выделить нужный -ENTER) —
Desiredoperation: C (Edit — редактирование) — F6 — выделяем переменнуюx — ENTER -F6-(наблюдаем выборку)— F5 (опции) — Sort in ascending order(сортировка в порядке возрастания ) — F6 — Save and exit(запоминание и выход). Если бы требовалось не менять содержимое переменной x, следовало бы сначала скопировать ее в другую переменную (операцией U
pdate).
2-й способ
Сначала загрузим оператор сортировкиSORTUP, который относится к разряду загружаемых:
V.Supplementary Operations(дополнительные операции) — 1.
Load Operation and Function(загрузка операторов и функций) — Mathematical function — Read(после использования загружаемых операторов их желательно выгрузить опцией Erase, чтобы не занимать память).
Ctrl+F5(быстрый выход в исполнительное окно) — SORTUP x -ENTER (наблюдаем вариационный ряд, при этом содержащие переменной x не изменилось).
Построение графика функции эмпирического распределения
F.3.Frequency Histogram — Data: x — F6— поправляем некоторые параметры графика:
No of classes(число классов): 200 (или еще больше: — 500, чтобы на каждый интервал попало не больше одного наблюдения), Cumulative: Yes, (накопленные частоты, т.е. функция распределения), Relative:
Yes, (относительные частоты) — F6.
Наблюдаем функцию эмпирического распределения. Выводим ее на печать или сохраняем.
Группирование данных
F.2.Frequency Tabulation — Data: x — F6— поправляем, если нужно параметры группирования: нижний (Lower limit) и верхний (Upper Limit) пределы (минимальное и максимальное значения выборки приведены ниже на экране), число интервалов группирования No of classes: 10 — F6 — Display Table — ENTER.
Наблюдаем таблицу группированных данных. Выводим ее на печать или сохраняем.
Построение гистограммы частот
F.3.Frequency Tabulation — Data: x — F6— поправляемпараметры графика:No of classes: 10 — F6.
Наблюдаем гистограмму. Выводим ее на печать или сохраняем.
Определение выборочных характеристик
Определим выборочные среднее, дисперсию, cтандартное отклонение, медиану (сравним их с теоретическими значениями), минимальное и максимальное значения выборки, размах:
F.1 — Summary Statistics — Data rectors:x — в окне Statisticsоставляем те буквы — коды, которым соответствуют нужные нам статистики A, B, E, F, H, I, J — F6.
Наблюдаем таблицу выборочных значений. Выписываем ее и сравниваем с теоретическими значениями.
Проверка гипотезы о типе распределения
Проверим выборку с помощью критерия Колмогорова — Смирнова .
H.1. — Distribution Fitting Data vector: x, вводим код распределения в окно Distribution number — F6 — ââîäèì вместо оценок теоретические значения параметров –
F6 — Histogram — ENTER— поправляем параметры графика: No of classes 200, Cumulative: Yes — F6.
Наблюдаем функции эмпирического и теоретического распределений; определим по графику значение статистики
— ìåðû различия между этими функциями.Величина D
n
, конечно же, определяется пакетом:
Esc — Esc— вместо опции Histogram выбираем K-S Test — ENTER.Сообщается значение статистики « …statistic DN = ….» и
«…
significancelevel = …» т.е. уровень значимости
.
Если эта вероятность мала (сотые доли или меньше), гипотезу о соответствии наблюдений теоретическому распределению следует отклонить. В противном случае признают, что наблюдения не противоречат гипотезе.
Описание двумерных выборок
Пример. В табл.2 приведены результаты химического анализа 32 образцов сланцевых пород на содержание двуокиси кремния (SiO2 – x) и двуокиси алюминия (Al2O3 – y).
Построим диаграмму рассеяния для этой выборки, определим выборочные характеристики: среднее, дисперсии, коэффициент корреляции и построим диаграмму рассеяния и двумерную гистограмму.
Таблица 2
¹
X
Y
¹
X
Y
¹
X
Y
¹
X
Y
1
57.8
17.2
9
53.9
16.1
17
53.8
16.3
25
50.9
14.7
2
54.6
17.9
10
60
14.8
18
53.1
17.2
26
49.6
16.1
3
54.8
18.8
11
56.2
17
19
51.5
15.8
27
52.2
19.5
4
51.7
19.9
12
55.2
17.8
20
54
15
28
50.5
15.6
5
61.1
16
13
53.3
19.9
21
50.4
14.4
29
51.1
18.1
6
62.3
17.8
14
57.9
17.1
22
53
15.3
30
52.2
19,5
7
52.2
18.8
15
54
15.5
23
53.3
16.6
31
49.2
15.7
8
49.2
19.3
16
52.6
17.6
24
51.6
14.9
32
49.3
13.2
а) Ввод данных:
А.2.File
Operations — file name:
WORK,
Desired
operatio
n: С (операция Edit (редактирование) в списке Operations)
– F6
– F6 – В окне Add
additional
column (добавить дополнительные столбцы) вводим имена новых переменных: Name: x1,
Type:
N (тип вещественный), Width: 13 (или меньше; – число десятичных разрядов) – F6
–
Name: y1
– F6
–
ESC
– вводим данные в колонки x1 иy1.
– F6
–
Save
and
Exit (запомнить и выйти) – ENTER (появляется описание созданных переменных).
Замечание.При вводе удобнее вводить числа без десятичной точки, а затем операцией J и опцией A (
ASSIGNMENT – назначение) разделить на 10.
б)
Представление выборки диаграммой рассеяния:
E.1.X-Y
Line
and Scatterplots – вносим в строкуx: x1, в строку у: y1
– F6. Появляется диаграмма рассеяния, которую можно отредактировать (F5): изменять надписи, диапазоны величин по осям, частоту делений и т.д. Диаграмму выводим на печать (F4).
в)
Определение выборочных характеристик:
F.1.
Summary
Statistics
–
Data
vectors: x1, во второй строке:y1, Statistics:
A,
B,
F,
H, I,
– F6. Появляется таблица выборочных характеристик для двух переменных x1 иx2.
Определение выборочной ковариационной матрицы: Q.2.Covariance
Analysis (анализ ковариаций) – Data
vectors: x1, во второй строке: y1
– F6. Появляется матрица ковариаций (в данном случае, 2´2).
выборочная корреляционная матрица определяется процедурой Q
.1.
Correlation
Analysis.
г) Построение двумерной гистограммы:
F.7.
Three
–
Dimensional
Histogram
–
Sample 1: x1,
Sample 2: y1
– F6
– Поправляем, если необходимо, параметры графика – F6.
Появляется трехмерный график. Выводим его на печать или сохраняем.
продолжение
–PAGE_BREAK–