МИНИСТЕРСТВООБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Государственноеобразовательное учреждение высшего профессионального образования
«Северо-Западный Государственный Заочный Технический Университет»
Институтуправления производственными и инновационными программами
Дисциплина:Статистика
контрольная работа
на тему: ВЫБОРОЧНОЕНАБЛЮДЕНИЕ. ИСПЫТАНИЕ СТАТИСТИЧЕСКИХ ГИПОТЕЗ
ВЫПОЛНИЛ:студентка 5 курса ЭГФ
Группа 624
Шифр6710210047
Лодырева М.С.
ПРОВЕРИЛ: ВолковВ.Ф.
Санкт-Петербург
2010
Содержание
1.Выборочное наблюдение испытание статистических гипотез
1.1Причины применения выборочного наблюдения. Дескриптивная статистика истатистический вывод
1.2Способы отбора, обеспечивающие репрезентативность выборки. Виды выборки
1.3Ошибка выборки
1.4Влияние вида выборки на величину ошибки выборки
1.5Задачи, решаемые при применении выборочного метода
1.6Распространение данных выборочного наблюдения на генеральную совокупность
1.7Малая выборка
1.8Примеры применения выборочного метода
Заключение
Приложение
выборка статистика отбор ошибка
1.Выборочное наблюдение испытание статистических гипотез
1.1Причины применения выборочного наблюдения. Дескриптивная статистика истатистический вывод
Извсех видов несплошного наблюдения главным является выборочное наблюдение, таккак только выборочный метод имеет статистако-математическое обоснованиераспространения данных, полученных по выборке, на всю совокупность. Причиниспользования выборочного метода несколько.
Во-первых,как это ни парадоксально, это повышение точности данных: уменьшение числаединиц наблюдения в выборке резко снижает ошибки регистрации. Правда, за счетнеполноты охвата единиц возникает ошибка репрезентативности, т.е.представительности выборочных данных. Но даже взятые вместе ошибка наблюдениядля выборки плюс ошибка репрезентативности обеспечивают большую точностьвыборочных данных по сравнению с массовым сплошным наблюдением. Приограниченном объеме работ можно привлечь более квалифицированных исполнителей(интервьюеров, счетчиков- регистраторов). Это положительно сказывается накачестве данных выборочного обследования.
Во-вторых,обращение к выборкам обеспечивает экономию материальных, трудовых, финансовыхресурсов и времени. Например, для составления баланса денежных доходов ирасходов населения, для изучения денежного обращения, выявления дифференциациинаселения по уровню жизни, определения черты бедности и т.д. необходимы данныео бюджетах домохозяйств. Сбор этих данных осуществляется государственнойстатистикой, но один статистик в состоянии курировать ежедневные записидоходов, расходов, потребления не более чем в 20—25 домохозяйствах. Если бы онрешил собирать данные о бюджетах всех домохозяйств, то только для этой цели (неучитывая потребности последующей обработки) потребовалось бы примерно двамиллиона статистиков. Так что использование выборочного наблюдения являетсяединственным экономически выгодным решением, тем более что по результатамизучения сравнительно небольшой части можно получить с достаточно высокойстепенью уверенности данные о всей совокупности. Подобная ситуация возникаетпри аудиторских проверках крупных фирм, когда вместо детального изучениякаждого платежного документа ограничиваются анализом выборки документов, и вдругих областях применения статистики.
В-третьих,без выборки не обойтись, когда наблюдение связано с порчей наблюдаемыхобъектов. Это относится прежде всего к изучению качества продукции, котороеосновано на испытаниях образцов на вибрацию, упругость, разрыв и т.д. Всюпродукцию, конечно же, таким испытаниям не подвергают, а только отобранныеобразцы. То же можно сказать об исследовании молока на жирность, зерна — насодержание белка, влажность, чистоту и всхожесть семян, электрических лампочек— на длительность горения и т.д. На выборках основаны маркетинговыеисследования, оценки качества поставок.
Практикаприменения выборочного метода очень разнообразна. Иногда, проведя сплошноенаблюдение, используют выборочный метод при разработке данных: отбирают частьданных для более подробной разработки по расширенной программе. Так поступают,например, при разработке данных переписи населения о составе и типах семей.Нередко в процессе сбора данных применяют совместно сплошное и несплошноенаблюдение. При переписях населения в нашей стране (1959, 1970, 1979 гг.)собирались сведения о каждом лице по 11 признакам, а 25% населения давали болееподробную информацию (18 вопросов).
Выборкииспользуются при опросах общественного мнения, при выяснении потребительскихпредпочтений, формировании доходов и расходов населения, при определенииурожайности сельскохозяйственных культур и продуктивности скота. С 20-х гг. XXв. выборочный метод стал использоваться для контроля и анализа качествапродукции. Сейчас методы статистической выборки все шире внедряются в самыеразличные области. В 1994 г. в Российской Федерации была проведена 5%-наямикроперепись населения с целью уточнения демографического и социальногосостава населения, уровня благосостояния, включая жилищные условия, источникидохода и др. Эта микроперепись была положена в основу новой бюджетной выборки,созданной в 1996 г. на период до 2003 г., после чего она должна бытьпересмотрена на основе данных Всероссийской переписи населения 2002 г.
Тасовокупность, из которой проводится отбор, называется генеральной совокупностью;отобранные данные составляют выборочную совокупность. Эти данные представляютинтерес, поскольку дают основание для суждений о параметрах и свойствахгенеральной совокупности. Таким образом, выборочный метод обладает следующимидостоинствами:
•относительно небольшие (по сравнению со сплошным наблюдением) материальные,трудовые и стоимостные затраты на сбор данных (включая затраты на планированиеи формирование выборки);
•оперативность получения результатов;
•широкая область применения;
•высокая достоверность результатов.
Всеэти достоинства проявляются лишь при условии правильного решения проблемвыборочного обследования.
Кним относятся:
1)определение границ генеральной совокупности;
2)разработка программы наблюдения и инструкций;
3)определение основы для проведения выборки — списка единиц генеральнойсовокупности, сведений об их размещении и т.д.;
4)установление допустимого размера погрешности и определение объема выборки;
5)определение вида выборочного наблюдения;
6)установление сроков проведения наблюдения;
7)определение потребности в кадрах для проведения выборочного наблюдения, ихподготовка;
8)оценка точности и достоверности данных выборки, определение порядка ихраспространения на генеральную совокупность.
Представлениео статистических данных, как о выборочных, может относиться не только ксобственно выборке, но и к данным сплошного наблюдения, которые иногдарассматриваются как выборка из всех возможных реализаций изучаемого процесса.Это имеет смысл в случае мапого числа единиц совокупности. Кроме того,трактовка данных как выборочных используется применительно к результатамэксперимента, которые рассматриваются как некая выборка из потенциальнобесконечного числа повторений экспериментальных наблюдений. Трактовка данныхкак выборочных является основой деления статистики на описательную(дескриптивную) и выводную. Методы описательной статистики включают сбор данныхпо всем единицам изучаемой совокупности, их обработку, получение сводныхпоказателей, которые характеризуют только наблюдаемую совокупность. Например,если наша задача состоит в изучении успеваемости группы студентов, включающей25 человек, то вычисленный средний балл по этой группе, процент отличных оценоки т.д. являются описаниями данной совокупности. Если же мы будем рассматриватьэту группу студентов с точки зрения оценки успеваемости всех студентов данногоколледжа или университета, то эта группа предстанет как выборка из общего числастудентов. В таком случае средний балл для группы будет являться оценкойсредней успеваемости студентов колледжа в целом.
Генеральнаясовокупность может быть реальной, а может быть гипотетической, включающейслучаи, которые реально не существуют, например, все возможные результатыэксперимента. В выводной статистике принято строго различать параметры исвойства генеральной совокупности и их оценки по данным выборки. С этой цельюпринята следующая система обозначений: генеральные параметры обозначаютсягреческими буквами, выборочные показатели, которые рассматриваются как оценкигенеральных параметров, — латинскими буквами:
Подводяитоги, можно сказать, что описательная статистикаявляется инструментом описаниясовокупности, по которой у нас полностью имеются исходные данные. Методстатистического вывода позволяет по данным выборок делать заключение о большейсовокупности, по которой мы не имеем исчерпывающих наблюдений.
1.2Способы отбора, обеспечивающие репрезентативность выборки. Виды выборки
Длятого чтобы по выборке можно было делать вывод о свойствах генеральнойсовокупности, выборка должна быть репрезентативной (представительной), т.е.полно и адекватно представлять свойства генеральной совокупности.Репрезентативность выборки может быть обеспечена только при объективностиотбора данных. Выборочная совокупность формируется по принципу массовыхвероятностных процессов, без каких бы то ни было исключений из принятой схемыотбора. Необходимо обеспечить относительную однородность выборочнойсовокупности, или ее разделение на однородные группы единиц. При формированиивыборочной совокупности должно быть дано четкое определение единицы отбора.Желателен приблизительно одинаковый размер единиц отбора, причем результатыбудут тем точнее, чем меньше единица отбора. Возможны три способа отбора:случайный отбор, отбор единиц по определенной схеме, сочетание первого ивторого способов. Если отбор в соответствии с принятым способом проводится изгенеральной совокупности, предварительно разделенной на типы (слои или страты),то такая выборка называется типической (или расслоенной, или стратифицированной,или районированной). Еще одно деление выборки по видам определяется тем, чтоявляется единицей отбора: единица наблюдения или серия единиц (иногдаиспользуют термин «гнездо»). В последнем случае выборка называется серийной илигнездовой. На практике часто используется сочетание типической выборки сотбором сериями. В математической статистике, обсуждая проблему отбора данных,обязательно вводят деление выборки на повторную и бесповторную.
Перваясоответствует схеме возвратного шара, вторая — безвозвратного (при рассмотрениипроцесса отбора данных на примере отбора шаров разного цвета из урны). Всоциально- экономической статистике нет смысла применять повторную выборку,поэтому, как правило, имеется в виду бесповторный отбор. Если выборка проводитсяпо схеме возвратного шара, то вероятность попадания любой единицы в выборкуравна 1/N, и она остается той же самой на протяжении всей процедуры отбора.Если выборка проводится по схеме невозвратного шара, то вероятность попаданияединицы в выборку изменяется последней. Поскольку социально-экономическиеобъекты имеют сложную структуру, организовать выборку бывает довольно трудно.Например, чтобы провести отбор домохозяйств при изучении потребления населениякрупного города, легче провести сначала отбор территориальных ячеек, жилыхдомов, потом квартир или домохозяйств, затем респондента. Такая выборканазывается многоступенчатой. На каждой ступени используются разные единицыотбора: более крупные — на начальных ступенях, на последней ступени единицаотбора совпадает с единицей наблюдения. Еще один вид выборочного наблюдения —многофазовая выборка. Такая выборка включает определенное количество фаз,каждая из которых отличается подробностью программы наблюдения. Например, 25%всей генеральной совокупности обследуются по краткой программе, каждаячетвертая единица из этой выборки обследуется по более полной программе и т.д.При любом виде выборки отбор единиц проводится тремя отмеченными способами.Рассмотрим процедуру случайного отбора. Прежде всего составляется список единицсовокупности, в котором каждой единице присваивается цифровой код (номер илиметка). Затем проводится жеребьевка. Шары с соответствующими номерамизакладываются в барабан, перемешиваются, и проводится их отбор. Выпавшие номерасоответствуют единицам, попавшим в выборку; число номеров равнозапланированному объему выборки.
Отборжеребьевкой может быть подвержен смещениям, вызванным недостатками техники(качеством шаров, барабана) и другими причинами. Более надежен с точки зренияобъективности отбор по таблице случайных чисел. Такая таблица содержит сериицифр, чередующихся случайным образом, отобранных путем электронных сигналов.Поскольку мы пользуемся десятичной цифровой системой 0, 1,2, …, 9, вероятностьпоявления любой цифры равна 1/10.
Следовательно,если бы нужно было создать таблицу случайных чисел, включающую 500 знаков, то50 из них были бы нули, столько же — единиц и т.д. Ввиду того, что каждая цифраи их последовательность являются случайными, можно использовать таблицуслучайных чисел, перемещаясь либо по ее вертикали, либо по горизонтали. Цифрысгруппированы по пять для лучшей обозримости таблицы и пользования .
Пример.Предположим, что нам нужно провести 5%-ную выборку из 9540 студентовуниверситета. Объем выборки составит: п = 5% — 7V = 477 студентов. Ввиду того,что объем генеральной совокупности выражается четырехзначным числом, кодкаждого студента должен быть четырехзначным: от 0001 — для первого студента до9540 — для последнего студента в списке. Для того чтобы провести отбор потаблице случайных чисел, нужно выбрать начальную точку: можно закрыть глаза ипоставить наугад точку в таблицу карандашом. Предположим, мы попали в 13-юстроку в 1-й столбец
Следовательно,единица с номером 9082 является первой в выборке. Если двигаться по строке, тоединица с номером 2602 будет второй, 8088 — третьей, 9259 — четвертой.Следующий код 9610 пропускаем, так как у нас нет студента с таким номером.Далее в выборку попадают номера 4277, 2605, 6176, 8730, 4117, 7212, 1791, 5296,5919, 0305, 1018. Код 9797 пропускается. Следующие отобранные номера 7868,0161, 3747, 9526, 8413, 7725 и т.д.
Процедурапродолжается, пока число отобранных номеров не составит требуемый объем выборки(n = 477). Часто используется отбор по какой-либо схеме (так называемаянаправленная выборка). Схема отбора принимается такой, чтобы отразить основныесвойства и пропорции генеральной совокупности. Простейший способ — по спискамединиц генеральной совокупности, составленным так, чтобы упорядочивание единицбыло бы не связано с изучаемыми свойствами, проводится механический отборединиц с шагом, равным N: n. Обычно отбор начинают не с первой единицы, а отступивполшага, чтобы уменьшить возможность смещения выборки. Частота появления единицс теми или иными особенностями, например студентов с тем или иным уровнемуспеваемости, живущих в общежитии, и т.д., будет определяться той структурой,которая сложилась в генеральной совокупности. Для большей уверенности в том,что выборка отразит структуру генеральной совокупности, последняяподразделяется на типы, и проводится случайный или механический отбор изкаждого типа. Общее число единиц, отобранных, из разных типов, должносоответствовать объему выборки. Особые трудности возникают, когда нет спискаединиц, а отбор нужно провести либо на местности, либо из образцов продукции наскладе готовой продукции. В этих случаях важно детально разработать схемуориентации на местности и схему отбора и следовать ей, не допуская отклонений.
Например,счетчик получает указание двигаться от определенной автобусной остановки насевер по четной стороне улицы и, отсчитав два дома от первого угла, войти втретий и провести опрос в каждом пятом жилом помещении. Неукоснительноеследование принятой схеме обеспечивает выполнение главного условия формированиярепрезентативной выборки объективность отбора единиц.
Отслучайной выборки следует отличать квотный отбор, когда выборка конструируетсяиз единиц определенных категорий (квот), которые должны быть представлены взаданных пропорциях. Например, при опросе покупателей универмага может бытьзапланировано провести отбор 150 респондентов, в том числе 90 женщин, из низ 25— девушек, 20 — молодых женщин с маленькими детьми, 35 — женщин среднеговозраста, одетых в деловой костюм, 10 — женщин старшего возраста; кроме того,планировался опрос 60 мужчин, из них 25 подростков и юношей, 10 — молодыхмужчин с детьми, 15 —мужчин, которые одеты в костюмы, 10 — мужчин, одетых в спортивнуюодежду. Для определения потребительских ориентации и предпочтений такаявыборка, может быть, и хороша, но если мы захотим по ней установить среднююсумму покупок, их структуру, получим непредставительные результаты. Этопроисходит потому, что квотная выборка нацелена на отбор определенныхкатегорий. Выборка может быть нерепрезентативной, даже если она формируется всоответствии с известными пропорциями генеральной совокупности, но отборпроводится без какой-либо схемы — единицы набираются, как угодно, лишь быобеспечить соотношение их категорий в тех же пропорциях, что и в генеральнойсовокупности (например, соотношение мужчин и женщин, респондентов в возрастемоложе и старшетрудоспособного, в трудоспособном и т.д.).
Этизамечания должны предостеречь вас от подобных подходов к формированию выборки иеще раз показать необходимость объективного отбора.
1.3Ошибка выборки
Всеошибки выборочного наблюдения подразделяются на ошибки выборки (случайные);ошибки, вызванные отклонением от схемы отбора (неслучайные); ошибки наблюдения(случайные и неслучайные). Плохо, когда ошибка выборки превышает допустимыйразмер погрешности, но слишком высокая точность также подозрительна и, какправило, свидетельствует об ошибках отбора. К неслучайным ошибкам приводятошибки отбора. Так бывает, если объективный отбор подменяется «удобной»выборкой. Например, когда появляются добровольные респонденты — те, кто самипредлагают, чтобы их опросили. Очевидно, что характеристики таких добровольцеви недобровольцев могут быть различны и это приведет к ошибочному заключению огенеральной совокупности. Такая же опасность возникает при замене по какой-либопричине единиц, попавших в выборку, другими единицами (например, вместоотобранного домохозяйства, где в момент прихода интервьюера никто не открылдверь, был проведен опрос в соседней квартире или интервьюер встретил решительныйотказ участвовать в опросе и был вынужден пойти на замену домохозяйства). Какотмечает социолог В. И. Паниотто, систематические ошибки представляют собойнекоторое постоянное смещение, которое не уменьшается с увеличением числаопрошенных и вызваны недостатками и просчетами в системе отбора респондентов.Если, например, для изучения общественного мнения жителей города вархитектурном управлении получить сведения о жилом фонде и из всех имеющихся вгороде квартир отобрать случайным образом 400, а затем предложить интервьюерамопросить всех, кого они застанут в момент посещения в этих квартирах, тополученные данные не будут репрезентативны. Допущена систематическая ошибка:более подвижная часть населения попадает в выборку в меньшей пропорции, а менееподвижная — в большей пропорции, чем в генеральной совокупности.
Такимобразом, с вероятностью 0,95 можно утверждать, что средняя продолжительностьрасчетов предприятия данного треста с кредиторами составляет не менее 26,7 дняи не более 29,7 дня. Ошибка выборки для выборочной относительной величины(доли) определяется аналогично. Дисперсию относительной величины определим поданным выборки:
Пример.По данным выборочного изучения 100 платежных документов предприятий одноготреста оказалось, что в шести случаях сроки расчетов с кредиторами былипревышены. С вероятностью 0,954 требуется установить доверительный интервалдоли платежных документов треста без нарушения сроков:
1.4Влияние вида выборки на величину ошибки выборки
Какуказывалось в подразд. 7.2, при проведении выборочного наблюдения используютсяразличные способы формирования выборочной совокупности: случайный отбор —повторный или бесповторный, механический, серийный, типический. Вид выборкивлияет на величину ошибки выборки. При бесповторном отборе формулы среднейошибки выборки (7.4) и (7.14) дополняются множителем Величина ошибкирайонированной выборки меньше величины ошибки простой (нерайонированнойвыборки). Часто используется сочетание районированного отбора с отборомсериями. Такой вид выборки обеспечивает преимущества в организации выборки иуменьшение ошибки выборки. Дисперсия такой выборки представляет среднюю измежсерийных дисперсий для каждого у’-го района: Оборачиваемость запасоврассчитывается делением продолжительности периода (полгода) на среднюю продолжительностьодного периода оборота запасов. Очевидно, что чем скорее оборачиваются запасы,тем выше их отдача.
Коэффициентпокрытия рассчитывается как отношение суммы всех источников покрытия запасов кстоимости запасов. Еслизначение этого показателя меньше единицы, то текущеефинансовые показатели предприятий легкой промышленности крупного города за Iполугодие 2001 г. т.е. таких предприятий должно быть не меньше 2% и не больше28%. Фактически в генеральной совокупности их оказалось 20% общего числапредприятий, т.е. выборка дает репрезентативный результат и по этомупоказателю.
Выполненнаявыборка формировалась как простая бесповторная механическая. Однако навернякастатистик будет стремиться учесть структуру генеральной совокупности, поэтомуболее естественной была бы выборка, учитывающая выделение предприятий разныхформ собственности. Тогда выборка должна быть районированной.
Пример.Генеральная совокупность состоит из 11 государственных предприятий, 36 частных,13 смешанных. В выборке эти пропорции соблюдаются следующим образом: отобраныпо 4 предприятия государственных и смешанных и 12 частных.
Такимобразом, использование многоступенчатой выборки улучшает организацию выборки,но увеличивает ее ошибку. Кроме рассмотренных применяется многофазовая выборка,когда одни сведения собираются по всем единицам выборки, а другие — только поподвыборке из первоначальной выборки.
Припериодическом повторении выборочных обследований с целью изучения динамикиявлений применяются либо независимые выборки — через определенные промежуткивремени отбор каждый раз проводится независимо от предыдущих выборок; либофиксированные выборки — в этом случае повторные обследования проводятся поодной и той же выборке. В связи с тем, что в фиксированной выборке могутпроисходить изменения (прежде всего за счет выбытия единиц), практикуютпериодическую адаптацию фиксированной выборки к происходящим изменениям. Чащедля целей изучения динамики используется промежуточный вариант ротационнаявыборка (частичное замещение). При этом нужно следовать определенному планузамещения, например, каждый раз замещать четверть выборки, тогда каждаяпервоначально отобранная единица останется в четырех следующих друг за другомвыборках.
Названныевиды выборок ориентированы на отбор конкретных материальных явлений. Помимо нихследует назвать как особыйвид выборки метод моментных наблюдений. Сущностьэтого метода состоит в периодической фиксации состояний наблюдаемых единиц вотобранные моменты времени. Расчет объема такой выборки дает количествомоментов. Этот вид выборочного наблюдения применяется при изучениииспользования производственного оборудования либо рабочего времени (подразд.7.7).
1.5Задачи, решаемые при применении выборочного метода
Прииспользовании выборочного метода возникают три основные задачи:
•определение объема выборки, необходимого для получения требуемой точностирезультатов с заданной вероятностью;
•определение возможного предела ошибки репрезентативности, гарантированного сзаданной вероятностью, и сравнение его с величиной допустимой погрешности;
•определение вероятности того, что ошибка выборки не превысит допустимойпогрешности. т.е. в данном случае корректировка не оказала влияния нарезультаты расчета. Все округления даются с превышением. Окончательныйрезультат: должно быть опрошено 100 человек. При проектировании районированнойвыборки рассчитанный объем выборки распределяют пропорционально численностирайонов (пропорциональный отбор):
Еслидоля отбора меньше 5%, к формуле бесповторного отбора не переходят, так как этонесущественно скажется на величине п (как это было в рассмотренном примере).
Выборкадолжна быть такой, чтобы выборочные показатели по всем основным характеристикамбыли репрезентативны. Поэтому численность выборки рассчитывают многократноисходя из допустимых ошибок разных показателей, значения которых в генеральнойсовокупности известны.
Например,при выборочном учете детей школьного возраста требуется определить число семей,которые надо обследовать. При этом надо учесть: а) число детей в возрасте 6—7лет; б) число детей в возрасте 6—15 лет; в) число детей в возрасте 16—17 лет;г) среднедушевой доход (например, для решения вопроса о строительстве базыотдыха). Вычислив значение п, на основе каждой из характеристик получаем разныеобъемы выборки: 1200; 300; 700; 100. Обследовать необходимо 1200 семей, т.е. израссчитанных
числен-ностейберется максимальная. При резких различиях необходимых объемов выборки дляразных вопросов программы проводится многофазный отбор. В рассмотренном примересреднедушевой доход достаточно учитывать в одной из каждых 12 семей, попавших ввыборку. Многофазный отбор, как правило, довольно сложно организовать, можетбыть нарушен принцип случайности отбора. Поэтому для обеспечениярепрезентативности оказывается выгоднее затратить больше средств на учетбольшего числа единиц совокупности. Многофазный отбор целесообразно применять,если соотношение между рассчитанными объемами выборки по крайней мере 1 :6
Посколькурасчет необходимой численности выборки основан не на точных, а напредположительных данных о колеблемости в совокупности, надо соблюдатьследующие рекомендации: абсолютную величину п округлять только вверх; долюотбора округлять только вниз, т.е. из предосторожности планировать несколькобольший объем выборки, чем показывают расчеты.
Объеммногоступенчатой выборки рекомендуется увеличить не менее чем на 10%рассчитанной численности, поскольку, как было показано в подразд. 7.4,многоступенчатость отбора увеличивает ошибку выборки.
Послепроведения выборки рассчитывают ошибки выборочных показателей (ошибкирепрезентативности), которые используются для оценки результатов выборки и дляполучения характеристик генеральной совокупности.
Пример.На электроламповом заводе взято для проверки 100 ламп. Средняяпродолжительность их горения оказалась 1420 ч со средним квадратическимотклонением 61,03 ч. Поскольку приемщика продукции интересует качество всейпартии (50 тыс. электроламп), оценивают точность полученной средней.
Средняявозможная ошибка вычисленной выборочной средней:
Аналогичноможно определить вероятность того, что предел ошибки доли не превыситдопустимую погрешность. Оценки надежности выборочных показателей, как показанона примере, позволяют принять обоснованные решения в отношении генеральной совокупности.
1.6Распространение данных выборочного наблюдения на генеральную совокупность
Конечнойцелью выборочного наблюдения является характеристика генеральной совокупностина основе данных, полученных по выборке. При этом исходят из того, что все средниеи относительные показатели, полученные по выборке, являются несмещенными иэффективными характеристиками генеральной совокупности.
Последнийсомножитель не что иное, как обратная величина доли отбора, рассчитанной позначениям признака z- Значит, итоговый подсчет по генеральной совокупностиможетбыть получен делением соответствующего итогового подсчета по выборке надолю отбора. При прямом расчете берется доля отбора единиц совокупности, приспособе коэффициентов — доля отбора по значению какого-либо признака.
Эффективностьспособа коэффициентов по сравнению с методом прямого расчета зависит от того,насколько тесно связаны между собой признаки, лежащие в основе расчетакоэффициента, т.е. признак, по которому подсчитывается итог, и признак, покоторому определяется доля отбора. Эффект проявляется, если коэффициенткорреляции между ними больше 0,8. Способ коэффициентов используется длякорректировки данных сплошного наблюдения. Например, по данным переписи скотабыла получена величина поголовья свиней в районе 10 000, в том числе в теххозяйствах, которые потом были.
1.7Малая выборка
Таблицыинтеграла вероятностей используются для выборок большого объема из бесконечнобольшой генеральной совокупности. Но уже при п
Ввыборках небольшого объема п
1.8Примеры применения выборочного метода
Потребностьв использовании выборочного метода, выработке вероятностных суждений всовременной отечественной практике непрерывно расширяется. В государственнойстатистике основными направлениями использования выборочного метода традиционноявляются бюджетные обследования домо-хозяйств, выборочные переписи населения,контрольные обходы и проверки после проведения сплошных обследований. СозданиеЕГРПО, в котором фиксируются все хозяйствующие субъекты на территорииРоссийской Федерации всех форм собственности, открывает возможность проведенияразнообразных выборочных обследований в области экономики.
Вобласти социальных исследований для государственной статистики главным являетсябюджетное обследование, которое охватывает примерно 45 тыс. домохозяйств. Оноосновано на многоступенчатом отборе. Общий объем выборки распределяется посферам занятости (для работающих) и территориям. Затем для работающихпроводится отбор предприятий в пределах каждой отрасли в отобранной территории.Если, например, нужно отобрать 100 рабочих, занятых в определенной отрасли, дляобследования семейных бюджетов так, чтобы на каждом отобранном предприятии былоне менее 20 бюджетов, включающих рабочих с разным уровнем заработной платы, то,значит, должно быть отобрано: 100: 20 = 5 предприятий. Отбор предприятийпроводят по списку, в котором предприятия располагаются в порядке убываниясредней заработной платы рабочих, указываются общее число рабочих, их суммарнаязаработная плата. Шаг отбора определяется делением общего числа рабочих на предприятияхданной отрасли на число отбираемых предприятий. Если всего на предприятияхданной отрасли в области занято 30525 человек, то шаг отбора равен: 30525: 5 =6105. По данным кумулятивной численности рабочих с рассчитанным шагом отборапроводится отбор предприятий, которые затем проверяются на репрезентативностьпо показателю средней месячной заработной платы. Следующая стадия связана сотбором рабочих на выбранных предприятиях: среди 20 бюджетов должны бытьпропорционально представлены бюджеты семей малоквали- фицированных ивысококвалифицированных рабочих, а среди этих категорий отбор проводитсямеханически по спискам рабочих, составленным в порядке убывания среднеймесячной заработной платы, Выборочная совокупность при бюджетных обследованияхвключает и семьи неработающих (пенсионеров, студентов, инвалидов) и одиночек.
Задачейстатистики в области бюджетных обследований являются обеспечениепредставительства всех социальных групп и учет всех источников дохода. Наиболееобщим показателем уровня благосостояния населения являются денежные доходы,поступающие в семью в виде заработной платы, премий, единовременных выплат,гонораров, предпринимательского дохода или дохода от собственности,компенсационных выплат и дотаций. В совокупные доходы семьи включаются такженатуральная оплата труда, доходы, полученные от реализации и потребленияпродукции личного подсобного хозяйства (садового участка, коллективногоогорода). Для характеристики обеспеченности семей следует учитывать ихнакопления, а также валютные поступления. Возрастает значение анализа личногопотребления. Для изучения структуры рабочего времени работников разныхкатегорий, особенно рабочих, а также для характеристики использования машин иоборудования используется метод моментных наблюдений. Этот метод состоит врегистрации вида затрат времени в определенные, заранее выбранные моменты.Предварительно составляется список всех возможных состояний или видов затратвремени. Подсчитывается доля отметок о каждом состоянии, и оцениваетсядоверительный интервал доли времени, затраченного на тот или иной вид работы.Отбор моментов выборки может быть проведен либо по схеме механической выборки —через равные промежутки времени, либо по схеме случайной выборки сиспользованием таблицы случайных чисел. Необходимая численность моментовнаблюдения рассчитывается как Если при проверке отобранных документов ошибок необнаружено, то с принятой доверительной вероятностью мы можем распространитьрезультаты выборки на всю генеральную совокупность и считать, что итог по генеральнойсовокупности завышен не более чем на величину предельно допустимой ошибки. Еслиже обнаружена по крайней мере одна ошибка, то первоначальная гипотезаотносительно отсутствия ошибок, которая закладывалась при планировании выборки,оказывается несостоятельной. В этом случае должны быть пересмотрены либозначение коэффициента надежности, либо величина предельно допустимой ошибки(точность), либо и то, и другое. Если ошибки выявлены в операциях, значениекоторых превышает величину шага отбора, то можно быть уверенным в отношенииабсолютного размера ошибок в таких операциях, так как каждая из них проверяласьполностью. В этом случае нужно решить вопрос о распространении абсолютногоразмера выявленных ошибок на операции, значение которых меньше шага отбора. Всеошибки группируются в два класса: завышение суммы и ее занижение. Для всехопераций, значение которых превышает шаг отбора, выявленная ошибка являетсяточным размером завышения или занижения. Для операций, значение которых меньшешага отбора, размер выявленной ошибки относится к значению операции, иполученная относительная ошибка умножается на шаг отбора, т.е. распространяетсяна весь интервал. После определения суммарного размера ожидаемой ошибки по всеминтервалам выборки (т.е. шагам отбора) проводится сравнение с допустимымразмером суммарной ошибки, и если рассчитанная суммарная ошибка превосходитдопустимую величину, то, подставляя последнюю в формулу объема выборки,определяют, с каким коэффициентом надежности и соответственно с какой доверительнойвероятностью могут гарантироваться результаты данного выборочного исследования:данных не в целом по единице наблюдения, а лишь по некоторым пунктам формуляранаблюдения. К частичным пропускам относят также ошибочные и некорректныеответы, которые могут быть внесены в бланк с данными в силу непониманиявопроса, неточности или просто невнимательности. Для обработки полных неответов респондентов совокупность не ответивших предприятий должна бытьразделена на три следующие группы:
•• первая — предприятия, данные по которым восстанавливаться не будут. К нимотносятся предприятия, ликвидированные или находящиеся в стадии ликвидации, такназываемые спящие, т.е. приостановившие свою деятельность в силу различныхпричин;
•• вторая — предприятия, о которых достоверно известно, что они, несмотря наотсутствие отчета, активны, ведут финансово-хозяйственную деятельность;
•• третья — предприятия, по которым нет никаких данных и даже сведений,действующие они или нет. К каждой группе полных неответов применяется свойметод коррекции и восстановления данных. Используются следующие методывосстановления пропусков:
•• заполнение с пристрастным подбором;
•заполнение по предыдущему значению;
•заполнение без подбора;
•• заполнение средними;
•• заполнение с помощью регрессии;
•замена.
Заполнениес пристрастным подбором означает поиск данных, относящихся к единицамопределенного типа. Заполнение по предыдущему значению часто используется всовременной практике. Но этот метод не рекомендуется применять при большом количествепропусков, а также при наличии тенденции изменения показателя и значительномсроке со дня последней регистрации значения. Заполнение безусловными средними.По имеющимся наблюдениям рассчитываются средние, и существующий пропускзаполняется средними значениями. Этот метод эффективен при однородностианализируемой совокупности и небольшом количестве пропусков.
Заполнениес помощью регрессии состоит в заполнении пропусков значениями, предсказываемымирегрессией пропущенных для данного объекта переменных на основе присутствующих.Регрессия вычисляется по объектам с полной информацией. Этот метод выдвигаетряд серьезных требований к данным: однородность, поскольку известно, что прииспользовании метода наименьших квадратов небольшое число грубых ошибок можетвесьма существенно исказить значение характеристики распределения; подчинениетеоретическому нормальному распределению, что требует дополнительной обработкиинформации.
5.Досчет на вновь зарегистрированные предприятия. Записи о вновь зарегистрированныхпредприятиях добавляются к выборочной совокупности, и коэффициент увеличениячисленности используется как коэффициент досчета по всем показателям.
6.Распространение результатов выборочного наблюдения на генеральную совокупностьпроводится по методике, рассмотренной выше.
7.Анализ и экспертная корректировка полученных результатов. За качествопередаваемой на федеральный уровень информации отвечает соответствующаятерритория (субъект РФ или федеральный округ). Достоверность отчетности зависиттолько от квалификации исполнителя и желания добросовестно сделать свою работу.Решению проблем, связанных прежде всего с проблемами организации и проведениявыборочных обследований малых предприятий на региональном уровне, посвященаразработка подпроекта Программы TACIS «Статистика-3». Особое внимание уделялосьвопросам подготовки анкеты выборочного наблюдения, составу и структуресодержащихся в ней показателей, а также концепциям формирования выборки нарегиональном уровне. Большая проблема для российской статистики состоит ввыявлении и обработке данных нетипичных единиц наблюдения. Несмотря надостаточно эффективный план выборки проводимого обследования, при детальноманализе данных на региональном и федеральном уровнях неоднократно выявлялисьединицы, включение (или исключение) которых в выборочную совокупность сильновлияет на итоговое значенительным контролем при разработке итогов обследований малыхпредприятий.
Выборочныйметод широко используется при проведении конъюнктурных опросов. Конъюнктурныеопросы рекомендуется проводить по постоянной выборке, т.е. по панелипредприятий. Это обеспечивает существенные преимущества при организации опросови анализе результатов. Достоинства панельной организации опросов. Во-первых,регулярное получение ответов от одной и той же совокупности предприятий создаетуникальную возможность экономического анализа на микроуровне.
Во-вторых,при разумной и дальновидной организации хранения и накопления результатовпанельных опросов появляется возможность многократного и всестороннегоиспользования результатов опросов. При этом аналитические результаты могут бытьполучены без проведения новых опросов, а только за счет применения новыхметодов или моделей к уже накопленным данным. Новые опросы на той же панелимогут в этом случае проводиться для расширения уже существующих первичныхданных.
В-третьих,регулярный (ежемесячный или ежеквартальный) характер бизнес-обследованийпозволяет организаторам при необходимости регулярно совершенствовать вопросыанкеты и получать таким образом все более точные данные об исследуемыхявлениях.
В-четвертых,создание панели и накопление панельных данных позволяют использоватьспецифические статистические методы и эконометрические модели, не применимые кдругим типам данных. Эти методы и модели способны обеспечить получениепринципиально новых результатов.
Внастоящее время на регулярной основе проводятся обследованияпредпринимательских намерений в промышленности, строительстве, сельскомхозяйстве, оптовой торговле, а также в банковском и страховом секторах и винновационной сфере.
Обследованиябазовых предприятий промышленности проводятся ежемесячно; по промышленности вцелом — ежеквартально; строительных организаций, оптовой торговли и винновационной сфере — ежеквартально; в банковском и страховом секторах — двараза в год.
Выборочноенаблюдение широко используется при изучении качества готовой продукции. Отборготовых изделий для установления их качества проводится главным образоммеханически (5-е, 10-е, 15-е изделие и т.д.). Если изделия в таре, то в большинствеслучаев осуществляется серийный отбор (единица отбора = единице тары). Это такназываемый приемочный или последующий контроль, основанный на проверке качествауже выработанных изделий; он не в состоянии предупредить появление брака.
Большоераспространение получил непрерывный текущий статистический контроль закачеством изготовляемой продукции, осуществляемый в форме отбора проб в ходепроизводственного процесса непосредственно у рабочих мест.
Такойконтроль обеспечивает систематическое наблюдение не только за качествомпродукции, но и за самим производственным процессом. Текущий контроль в ходеотбора и анализа проб позволяет своевременно обнаружить неполадки в работе,сигнализировать о них и тем самым предупредить возникновение брака.
Значительнойсферой применения выборочного наблюдения являются маркетинговые исследования,проводимые с целью оценки мощности рынков товаров и услуг, определенияспецифических сегментов рынка.
Заключение
Выборочноенаблюдение проводится с целью повышения точности и оперативности данных,экономии материальных, трудовых и финансовых ресурсов.
Длятого чтобы по выборке можно было делать вывод о свойствах генеральнойсовокупности, выборка должна быть репрезентативной. Репрезентативность выборкиможет быть обеспечена объективным отбором данных. Используют три способаотбора: случайный, механический, сочетание первого и второго способов.
Еслиотбор проводится из генеральной совокупности, предварительно разделенной натипы (районы, слои или страты), то такая выборка называется типической(районированной, расслоенной или стратифицированной).
Единицейотбора может быть единица наблюдения или группа единиц. В последнем случаевыборка называется серийной или гнездовой. В социально-экономическихисследованиях используется схема бесповторной выборки.
Ошибкивыборочного наблюдения подразделяются на случайные и неслучайные. Случайныеошибки подчиняются вероятностным законам. К случайным относится ошибка выборки,называемая ошибкой репрезентативности.
Рассчитываютсяошибки выборки для выборочных средних и выборочных относительных величин. Навеличину ошибки выборки влияет вид выборки: если районы существенно отличаютсядруг от друга, то ошибка районированной выборки будет меньше, чемнерайонированной выборки; применение гнездовой выборки при прочих равныхусловиях приводит к увеличению ошибки выборки. На практике часто используютсочетание районированной выборки с гнездовым отбором. Применение выборочногометода связано с решением трех задач:
•определение объема выборки, обеспечивающего требуемую точность результатов спринятой вероятностью;
•расчет предельной ошибки репрезентативности, гарантированный с принятойвероятностью, и сравнение его с величиной допустимой погрешности;
•определение вероятности того, что ошибка выборки не превысит допустимойпогрешности.
Перваязадача связана с распространением данных выборки на генеральную совокупность.На основе выборочных характеристик даются интервальные оценки генеральныхпараметров. Могут быть получены и оценки значения подсчетов в генеральнойсовокупности.
Определенныеособенности имеют организация и проведение малых выборок (при п
Приложение
Задача№ 1
Дляопределения скорости расчетов с кредиторами предприятий одного треста былапроведена случайная выборка 50 платежных документов, по которым средний срокперечисления денег оказался равен 28,2дня со стандартным отклонением5,4 дня. Определим средний срок прохождениявсех платежей в течение данного года сдоверительной вероятностью F(t)=0,95, Тогда t=1,96; скорректированная дисперсия средняя ошибка выборки
/>
/>
Отклонениевыборочной средней от генеральной с вероятностью 0,95 составит; />= 1,96 x 0,77 =±1,51дня.
Величина /> называется доверительной ошибкойвыборки или предельной ошибкой выборки.Рассчитав величину />, мыможем записать следующее неравенство:
28,2 — 1,51 />28,2 + 1,51;
26,7 дня /> 29,7 дня.
Таким образом, свероятностью 0,95 можно утверждать, что средняя продолжительность расчетовпредприятия данного треста с кредиторами составляет неменее26,7дняинеболее29,7дня.
Задача № 2
По данным выборочногоизучения 100 платежных документов предприятий одного треста оказалось, что вшести случаях сроки расчетов с кредиторами были превышены. С вероятностью 0,954требуется установить доверительный интервал доли платежных документов трестабез нарушения сроков:
/>
/>
/>
Генеральная доля платежных документов />, не выходящихза установленные сроки, с вероятностью0,954 находится в интервале
0,892 /> /> /> 0,988, или 89,2% /> /> /> 98,8%.
Задача №3
Для изученияинтенсивности труда было организовано наблюдение за 10 отобранными рабочими.Доля работавших все время была равном 0,40, дисперсия; 0,4 • 0,6 = 0,24, Потабл. П,2 приложения находим; F(t) = 0,95 и d.f. = n — 1 = 9,t =2,26. Рассчитаем среднюю ошибкувыборки доли работавших все время:
/>
Тогда предельная ошибкавыборки />=2,26 •0,16 = ±0,36. Таким образом, с вероятностью 0,95 доля рабочих, работавших безпростоев, в данном цехе предприятия находится в пределах 4% /> /> /> 72%.
Если бы мы использовалидля расчета доверительных границ генерального параметра таблицу интеграла вероятностей,то t было бы равно 1,96 и />= ±0,31, т.е.доверительный интервал был бы несколько уже, но тем не менее неопределенностьоценки очень велика. Следовательно, в данном случае малая выборка такого объеманецелесообразна.
Списоклитературы
1. И.И.Елисеева,М.М.Юзбашев ОБЩАЯ ТЕОРИЯ СТАТИСТИКИ Под редакцией члена-корреспондентаРоссийской Академии наук И.И.Елисеевой ПЯТОЕ ИЗДАНИЕ, ПЕРЕРАБОТАННОЕ ИДОПОЛНЕННОЕ Рекомендовано Министерством образования Российской Федерации вкачестве учебника для студентов высших учебных заведений, обучающихся понаправлению и специальности «Статистика» Москва «Финансы истатистика» 2004г.