Математическое моделирование в управлении

Министерствообразования и науки Украины
Приднепровскаягосударственная академия
строительстваи архитектуры
 
Кафедраприкладной математики

Математическоемоделирование и решение задач оптимального управления
 
Тема: Математическоемоделирование в управлении
Днепропетровск
2009

Введение
Экономические процессы характеризуетбольшое число параметров, взаимосвязь и взаимное влияние которых определяютсостояние этой, с точки зрения системного анализа, сложной динамической системыи возможности перехода ее в другие состояния. В этой ситуации решения пооптимальному управлению необходимо принимать на основании многомерного статистическогоанализа стохастической, неполной информации. Всестороннее изучение деятельностипредприятий дает возможность фиксировать значения таких показателей, какпроизводительность труда, индекс снижения себестоимости, рентабельностьодновременно с показателями, которые могут оказывать влияние на перечисленныерезультирующие показатели. К таким воздействующим показателям можно отнеститрудоемкость единицы продукции, удельный вес рабочих в составепромышленно-производственного персонала, коэффициент сменности оборудования,премии, фондоотдача и другие. Однако следует учесть, что показатели могут бытьвзаимосвязаны и, следовательно, могут опосредствовано оказывать влияние нарезультирующие показатели.
Рассмотрение поведенияподобных сложных систем, характерной особенностью которых является наличиеуправления, присуще системному подходу. Основным методом исследования систем врамках системного подхода является метод математического моделирования,базирующийся на использовании средств компьютерной техники. Под математическиммоделированием понимают способ исследования различных явлений, процессов путемисследования явлений, имеющих разное физическое содержание, но описываемыходинаковыми математическими соотношениями.
Математической модельюреальной системыназывается ее описание на каком-либо формальном языке, позволяющее выводитьсуждения о некоторых чертах поведения этой системы при помощи формальныхпроцедур. Математическая модель может представлять собой функциональные зависимостиили графики, уравнения; таблицы или графики, описывающие движение систем ипереходы их из одних состояний в другие. Другими словами, математическая модель– это отражение оригинала (системы) в виде функций, уравнений, неравенств, цифри т.д. Математическая модель – это приближенное описание системы и ее поведенияс помощью математической символики. Математическое моделирование – мощный методпознания, а также прогнозирования и управления. Математическое моделированиезанимает ведущее место среди других методов исследования, особенно благодарякомпьютерной технике, возможности которой позволяют исследование поведениясистемы осуществлять с помощью машинного эксперимента.
В настоящее время труднопредставить себе исследование и прогнозирование экономических явлений, безиспользования эконометрического моделирования на основе статистических данных,регрессионного анализа и других методов, опирающихся на теорию вероятностей.Экономические законы все более усложняются и, следовательно, в соответствии сзаконами развития динамических систем должен усиливаться статистическийхарактер законов, их описывающих, который позволяет учитывать влияние случайныхфакторов.
Таким образом, длявыработки оптимального управления сложной системой, каковой являетсяэкономический процесс, необходим системный анализ и построение математическоймодели, которая должна отражать связи между отдельным зависимым параметром игруппой влияющих на него показателей, а также связи внутри этой группы, что возможноосуществить методами множественного корреляционного и регрессионного анализастатистических данных. Итак, решение задачи оптимального управления состоит изтаких этапов:
—  многомерныйэкономико-статистический анализ показателей производственно–хозяйственнойдеятельности предприятий;
—  составлениематематической модели задачи оптимизации управления деятельностью предприятийна основании корреляционного и регрессионного анализа статистических данных;
—  решение задачиоптимизации, количественное обоснование прогнозируемого результата и рекомендациипо его достижению.
Многомерныйстатистический анализ выполняется средствами надстройки Excel «Пакетанализа». Решение нелинейной задачи оптимизации выполняется средствами надстройкиExcel «Поиск решения».
Для успешного выполнениязадания приводятся необходимые сведения из теории вероятностей и математическойстатистики, и устанавливается связь между параметрами теоретического истатистического распределения изучаемых факторных и результативных признаков.

I. Статистический анализ в Excel
 
§ 1.1 Очисткаинформации от засорения
 
При статистическоманализе экономической информации принято считать, что экономические показателиподчиняются нормальному закону распределения. Однако на практике это не всегдаверно. Наблюдаются отклонения как односторонние, так и двусторонние. Воизбежание искажения значений характеристик распределения при обработкеинформации необходимо очистить ее от засорения случайными отклонениями. Методвыявления аномальных наблюдений и их удаления из совокупности при обработкемногомерной статистической информации может привести к отбрасыванию слишкомбольшого количества точек наблюдения. Известны более четко обоснованные методыобнаружения засорения: метод Смирнова–Граббса проверки максимального наблюдения,критерий Граббса для обнаружения одного экстремального наблюдения, критерийисключения нескольких грубых ошибок как обобщение критерия Граббса. Все ониприменяются к упорядоченной совокупности (вариационному ряду):
/> (N/>25).
Для проверкимаксимального и минимального значений на наличие грубой ошибки используются критерии
/> и /> ,
где /> , /> , />.
При N>25 экстремальные значения могутбыть проверены по критерию S:
/>,
где />– стандартное отклонение,определенное для всей выборки ;
/> – предполагаемый выброс.
При Sрасч –выброс отвергается, в противном случае экстремальное значение /> считается грубой ошибкой ииз дальнейшего рассмотрения исключается. Критические значения критерия Sопределяются по таблице. При уровне значимости /> Sкр так зависит от объема выборки N: значениям N = 30; 50; 100; 1000 соответствуют Sкр = 2,929; 3,082; 3,283; 3,884 .
Парный корреляционный ирегрессионный анализ удобно выполнять средствами Excel и надстройки «Пакетанализа» (в меню – Сервис– Анализ данных ).
В данной работе я выполяюстатистический анализ совокупности таких показателейпроизводственно-хозяйственной деятельности предприятий (Приложение 1):производительность труда (среднегодовая выработка продукции на одногоработника), тыс. грн. Y1,премии и вознаграждения на одного работника, % X8, среднегодовая численность ППП, чел.X11, среднегодовая стоимость основныхпроизводственных фондов(ОПФ), тыс. грн. X12, среднегодовой фонд заработной платыППП, тыс. грн. X13, непроизводственные расходы, %X17.
Выполняю проверкистатистических данных на «засорение»:
– копирую все значения показателейна чистый лист;
– упорядочиваю их повозрастанию, выделяю весь столбец без заголовка и нажимаю на панели кнопку сортировки;
– устанавливаю курсор подпоследним значением и ввожу функцию Статистическая
– СРЗНАЧ, а затемСТАНДОТКЛ .
– вычисляю значениестатистики Sрасч по найденным характеристикам длянаибольшего значения, которое нужно подставить в формулу вместо x1 и проверить гипотезу H0: наибольшее (последнее в столбце) значение – выброс;
– если Sрасч > Sкр (0,05; 50) = 3,082, это значение является выбросом, инеобходимо проверить предыдущее значение, только при этом следует зановоопределить среднее значение и стандартное отклонение, но уже исключив выброс,как это и выполнено в приведенной таблице;
– проверку на выброспродолжаю до первого значения, для которого гипотеза H0окажется неправдоподобной, т.е. для которого значение Sрасч окажется меньше Sкр;
– такую же проверкувыполняю начиная с наименьшего (первого в столбце) значения, помня о том, чтокритерий S имеет двустороннюю критическуюобласть, и поэтому следует рассматривать модуль Sрасч.
Такие проверки выполняюдля всех показателей. В итоге на новый лист переношу исходные статистические данные,и исключить полностью каждую строку, в которой есть выброс хотя бы одного изпоказателей. Весь последующий статистический анализ провожу только по очищеннымданным. Данные сохраняю в Excelна листе под названием «Очистка от засорения».
 
§ 1.2Проверка закона распределения
Предварительный анализстатистических данных заключается в проверке соответствия их предположению онормальном распределении параметров, для чего строю гистограмму и определяювыборочные числовые характеристики. Для построения гистограммы выполняю такуюпоследовательность действий:
размещаю на рабочем листеExcelстатистические данные наблюдений (безвыбросов);
Сервис – Анализ данных– Гистограмма (рис.1);
/>
Рис.1.Выбор инструментаанализа.
— в появившемсядиалоговом окне Гистограмма ввожу в поле Входные данные интервал(диапазон) ячеек, содержащий исходные данные, и отмечаю поле Метки,т.к., таблица данных имеет заголовки;
— ввожу в поле Параметрывыхода адрес ячейки, с которой должны размещаться выходные данные (выходнойинтервал) и щелкаю пункт Вывод графика;
— OK.
Гистограммы строю длявсех признаков статистических данных и сравниваю их с кривой нормальногораспределения с целью убедиться, что закон распределения каждого признакаблизок к нормальному, как на приведенной гистограмме.
Числовыехарактеристики длявсех признаков оцениваются по выборке с помощью инструмента анализа Описательнаястатистика., вызов которого осуществляется аналогично (см. рис.1 ). Впоявившемся диалоговом окне Описательная статистика ввожу таким жеобразом Входные данные и Параметры вывода, только вместо пункта Выводграфика отмечаю пункт Итоговая статистика.
Результаты примененияинструмента Описательная статистика к данным наблюдений порезультативному признаку Y1 и выбранным факторнымпризнакамприведены на листе Excelпод названием «Проверка законараспределения».
Как видно, результаты Описательнойстатистики дают возможность оценить справедливость предположения онормальном распределении признаков: эксцесс и асимметричность невелики, хотя иотличаются от 0. Нормальный закон распределения факторных признаков подтверждаетсяеще и тем, что значения медианы и моды у них совпадают или близки.
§ 1.3Корреляционный анализ
 
Предварительный анализтесноты взаимосвязи параметров многомерной модели осуществляю по оценке корреляционнойматрицы генеральной совокупности X по наблюдениям. Для этого использую инструмент Анализ данных всоответствии со следующим алгоритмом:
— размещаю на рабочемлисте Excel статистические данные в столбцах с соответствующими заголовками(именами переменных);
— Сервис – Анализданных – Корреляция;
— в появившемсядиалоговом окне Корреляция в соответствующие поля ввожу с помощью мышивходные данные и параметры вывода (см. рис.3 );
— после щелчка мышью покнопке OK на рабочем листе появится матрица,содержащая оценки парных коэффициентов корреляции.
Отбираю для дальнейшегоанализа пары переменных, имеющие наибольшие значения парных коэффициентовкорреляции
(/> 0,4 ), учитывая, что чемменьше коэффициент rij, тем слабее их связь. Такими парами в приведенном примере (рис.3) являются:Y1–X11; Y1–X12; X11–X13; X12–X13; X17–X8.
 Проверяю значимостькоэффициентов корреляции на уровне />= 0,05.Поскольку объем выборки для всех признаков одинаков и равен 53, критическоезначение rкр для всех пар будет одинаково и всоответствии с таблицей Фишера–Иейтса rкр = rтабл (0,05;53)rтабл(0,05;50) = 0,273. Поскольку для всехкоэффициентов выполняется неравенство /> >rкр, коэффициенты корреляции всех отобранныхпар признаков значимо отличаются от нуля, что подтверждает связь между ними.
Дальнейший анализстатистических данных зависит от размерности принимаемой модели. Простейшийвариант – двумерная модель. Учитывая, что в приведенном примере Y1–результирующий признак, определяющий индекс производительность труда, входит вдве пары, следует рассмотреть трехмерную модель Y1–X11–X12,
где X11 – среднегодовая численность ППП, аX12 – среднегодовая стоимость основныхпроизводственных фондов(ОПФ). В остальных парах следует определить зависимости междуX11 и X13, X12 и X13, X17 и X8.Здесь X5 –удельный вес рабочих в составе промышленно–производственногоперсонала, X6 –удельный вес покупных изделий, X7 – коэффициент сменностиоборудования.
Таким образом, дляматематической модели задачи выбора оптимального управления деятельностьюпредприятия с учетом указанных показателей следует установить зависимости: Y2 = F( X4,X8) – целевая функция;
X6 = φ(X4); X8 = φ(X7); X5 = φ(X7) –ограничения.

/>
Рис.3.Анализ парнойкорреляции.
§1.4 Регрессионныйанализ двумерной модели
 
В среде Excel для двумерного случая линейнойрегрессии предусмотрено несколько инструментов: статистические функции(КОРРЕЛ, ЛИНЕЙН, ТЕНДЕНЦИЯ и др.); инструмент Регрессия надстройки Пакетанализа ; графические средства при работе с диаграммой – построение линиитренда.
С помощью Пакета анализаможно получить искомую информацию, следуя такому алгоритму:
— разместить на рабочемлисте Excel в двух смежных столбцах с соответствующимизаголовками статистические данные по двум признакам, подлежащим исследованию (например,X4 и X6);
— Сервис – Анализданных – Регрессия ;
— в появившемсядиалоговом окне Регрессия ввести входные данные в поля Входнойинтервал Y(X6)и Входной интервал X(X4)и щелкнуть по полю Метки, чтобы заголовки невошли в интервалы данных;
— ввести параметры выводав поле Выходной интервал: адрес левого верхнего угла таблицырезультатов или щелкнуть поле Новый рабочий лист для вывода на другойлист (см. рис.4);
— для наглядности можновывести график, щелкнув по полю График подбора ;
— OK.
/>
Рис.4.Работа с диалоговымокном Регрессия.
Результат работыинструмента Регрессия приведен на рис.5. Итак, выборочное уравнениелинейной регрессии X6 на X4 имеет вид:
/>
Выходная таблица содержиткоэффициент детерминации R2=0,368802, чтоозначает, что полученная модель приблизительно на 37% отражает зависимость удельноговеса покупных изделий от трудоемкости единицы продукции. Стандартная ошибка(отклонение результата) />=0,118415 означает, что 68% реальных        значений результирующего признака x6 находится в диапазоне />0,118415от линии регрессии. Это следует из того, что условные распределения нормальнораспределенной генеральной совокупности при фиксировании различных подмножествкомпонент являются нормальными. ВЫВОД ИТОГОВ
Регрессионная статистика Множественный R 0,607291 R-квадрат 0,368802 Нормированный R-квадрат 0,35592 Стандартная ошибка 0,118415 Наблюдения 51 Дисперсионный анализ                                                        
 
df
SS
MS
F
Значимость F Регрессия 1 0,401452 0,401452 28,63014 2,3E-06 Остаток 49 0,687078 0,014022 Итого 50 1,088529
 
Коэффициенты
Стандартная ошибка
t-статистика
P-Значение
Нижние 95%
Верхние 95% Y-пересечение 0,557512 0,051111 10,90789 1,04E-14 0,45480 0,66022  X4 -0,85062 0,158973 -5,35071 2,3E-06 -1,1701 -0,5312 /> /> /> /> /> /> /> />
Рис.5. Результатырегрессионного анализа .
В разделе Дисперсионныйанализ приведены значения таких величин:
df – число степеней свободы; SS –сумма квадратов отклонений; MS– дисперсия; F– расчетное значение F–критерия. Поскольку критическое значениекритерия Фишера Fкр = 4,03 (m1=1; m2=50;/>) Fрасч =28,63 > Fкр, и, следовательнос вероятностью /> гипотеза оботсутствии связи между рассматриваемыми признаками отвергается. Это означает,что уравнение в целом статистически значимо, т.е. хорошо соответствует даннымнаблюдений.
Нижняя часть таблицысодержит такие сведения :
Коэффициенты – оценки параметров /> уравнения регрессии;
Стандартная ошибка – стандартные отклонения /> ;
t–статистика – расчетное значение. Таким образом,можно оценить значимость коэффициентов уравнения регрессии, сравнив расчетноезначение t – статистики с критическимзначением, найденным по распределению Стьюдента при уровне значимости /> и m=50: tкр =2,009. Поскольку /> > tкр для обоих коэффициентов, то ониявляются статистически значимыми при уровне доверительной вероятности 0,95.
Нижние 95% и Верхние 95% определяютнижние и верхние границы доверительных интервалов для коэффициентов уравнениярегрессии при />. Поскольку доверительные интервалы не содержат,это подтверждает значимость коэффициентов уравнения регрессии.
Для получения линиирегрессии и ее уравнения в случае двумерной модели удобным инструментом Excel является добавление линии трендак точечной диаграмме, построенной на значениях компонент системы двух заданныхслучайных величин как результатов наблюдения (см. рис.6).