Задачи по статистике с решением — Выборочное наблюдение
Решения задач по выборочному наблюдению
Задача 1 по статистике
При проверке импортирования груза на таможне методом случайной выборки было обработано 200 изделий. В результате был установлен средний вес изделия 30г., при СКО=4г с вероятностью 0,997. Определите пределы в которых находится средний вес изделий генеральной совокупности.
Решение.
В данном примере – случайный повторный отбор.
n=200
=30г
=4г — СКО
p=0,997, тогда t=3
Формула средней ошибки для случайного повторного отбора:
=0,84 г
г
Определяем величину средней ошибки.
Ответ: пределы в которых находится средний вес изделий: г
Задача 2
В городе проживает 250тыс. семей. Для определения среднего числа детей в семье была организована 2%-я бесповторная выборка семей. По ее результатам было получено следующее распространение семей по числу детей:
P=0,954. Найти пределы в которых будет находится среднее число детей в генеральной совокупности.
Число детей в семье, xi |
0 |
1 |
2 |
3 |
4 |
5 |
Кол-во детей в семье |
1000 |
2000 |
1200 |
400 |
200 |
200 |
Решение
2%-я выборка означает:
n=250000*0,02= 5000 семей было исследовано.
Т.к. выборка бесповторная, используем следующую формулу для определения средней величины ошибки:
Найдем среднее число детей в выборочной совокупности:
ребенка
Определим дисперсию
ребенка – средняя величина ошибки
Т.к p = 0,954, то t = 2
ребенка
ребенка
Вывод: из-за слишком малой величины ошибки, среднее число детей в генеральной совокупности можно принять за 1,5 ребенка.
Задача 3
С целью определения средней фактической продолжительности рабочего дня в гос. учреждении с численностью служащих 480 человек была проведена 25%-ная механическая выборка. По результатам наблюдения оказалось, что у 10% обследованных потери рабочего времени достигали более 45 мин.в день. С вероятностью 0,683 установите пределы, в которых находится генеральная доля служащих с потерями рабочего времени более 45 мин. в день.
Решение. Определим объем выборочной совокупности: n=480*0.25=120 чел.
Выборочная доля w по условию 10%.Учитывая, что показатели точности механической и собственно случайной бесповторной выборки определяются одинаково, а также то, что при P=0,683 t=1, предельная ошибка выборочной доли: =
Ответ: пределы в которых находится средняя доля % или: г
Т.о., с вероятностью 0,683 можно утверждать, что доля работников учреждения с потерями рабочего времени более 45 мин. в день находится в пределах от 7,6 до 12,4 %.
Задача 4 по статистике
В АО 200 бригад рабочих. Планируется проведение выборочного обследования с целью определения удельного веса рабочих, имеющих профессиональные заболевания. Известно, что дисперсия доли бесповторной выборки равна 225. с вероятностью 0,954 рассчитайте необходимое количество бригад для обследования рабочих, если ошибка выборки не должна превышать 5%.
Численность выборки для бесповторного отбора:
бригад
ВЫБОРОЧНЫЙ МЕТОД. РЕШЕНИЕ ТИПОВЫХ
ЗАДАЧ
Приступая к изучения
данной темы целесообразно вначале
ознакомиться с условными обозначениями
(приложение А), затем в процессе решения
задач, следует воспользоваться формулами
определения средней ошибки выборки,
дисперсии, необходимого объема выборки,
представленных в приложениях Б, В,Г.
Пример 1.
Из партии электроламп
взята 20%-ная случайная бесповторная
выборка для определения среднего веса
спирали.
Результаты выборки
следующие:
Определите: с
вероятностью
0,95 доверительные
пределы, в
которых лежит средний вес спирали, для
всей партии электроламп.
Решение.
Доверительные
интервалы для генеральной средней с
вероятностью Р:
Средний уровень
признака по выборке
найдем по формуле средней арифметической
взвешенной:
,
Предельную ошибку
при случайном бесповторном отборе
определим по формуле:
При вероятности
Р=0,95
t=1,96
(приложение Ж).
Для определения
выборочной дисперсии воспользуемся
формулой:
Доверительные
интервалы для генеральной средней с
вероятностью Р=0,95:
Таким образом, с
вероятностью 95% можно утверждать, что
средний вес спирали в генеральной
совокупности колеблется от 41,7 до 42,3 мг.
Пример 2.
На основе случайного
повторного выборочного обследования
в отделении связи города предполагается
определить долю писем частных лиц в
общем объеме отправляемой корреспонденции.
Никаких предварительных данных об
удельном весе этих писем в общей массе
отправляемой корреспонденции не имеется.
Определите:
-
численность
выборки, если результаты выборки
необходимо дать с точностью до 1% и
гарантировать это с вероятностью 0,95.
Решение.
По условию задачи
известны:
размер допустимой
(предельной) ошибки — w=1%
или 0,01:
принята вероятность
– Р
= 0,95;
Необходимая
численность выборки при случайном
повторном отборе:
Так как значение
w
не дано, то следует ориентироваться на
наибольшую дисперсию, которой соответствует
значение w
= 0,5.
Таким образом,
чтобы с данной точностью определить
долю частных писем в общем объеме
отправляемой корреспонденции, необходимо
в порядке случайной выборки отобрать
9604 письма.
Пример 3.
В городе 500 тыс.
жителей. По материалам учета городского
населения было обследовано 50 тыс. жителей
методом случайного бесповторного
отбора. В результате обследования
установлено, что в городе 15% жителей
старше 60 лет.
Определите:
-
с вероятностью
0,683 пределы, в которых находится доля
жителей в городе в возрасте старше 60
лет
Решение.
Доверительные
интервалы для доли в генеральной
совокупности определяются:
По условию задачи,
выборочная доля w
= 15% (или w
= 0,15).
С вероятностью
0,683 определим предельную ошибку выборки
для доли альтернативного признака:
Определяем
доверительные интервалы
Таким образом, с
вероятностью 0,683 можно утверждать, что
доля жителей в возрасте старше 60 лет в
городе А
находятся в пределах 10%
р
20%.
Пример 4.
В области, состоящей
из 20 районов, проводилось выборочное
обследование урожайности на основе
бесповторного отбора серий (районов).
Выборочные средние по районам составили
соответственно 14,5 ц/га;
16,0; 15,5; 15,0 и 14,0 ц/га.
Определите:
-
с вероятностью
0,954 пределы урожайности во всей области.
Решение.
Выборочная средняя
определяется по формуле средней
арифметической:
Межгрупповая
дисперсия определяется по формуле:
При вероятности
0,954 коэффициент доверия t
= 2. Предельная
ошибка серийной бесповторной выборки
определяется по формуле:
Доверительные
интервалы урожайности в области:
Таким образом,
урожайность в области с вероятностью
0,954 будет находиться в пределах от 14,45
до 15,55 ц/га.
Пример 5.
При проверке веса
импортируемого груза на таможне методом
случайной повторной выборки отобрано
200 изделий. В результате был установлен
средний вес изделия 30 г
при среднем квадратическом отклонении
4 г.
Определите:
-
c
вероятностью 0,9973 пределы, в которых
находится средний вес изделий в
генеральной совокупности.
Решение.
Рассчитаем
предельную ошибку выборки. Так, при
Р=0,9973,
t=3.
Определим пределы
генеральной средней:
или
Следовательно, с
вероятностью 0,9973 можно утверждать, что
средний вес изделий в генеральной
совокупности находится в пределах от
29,15 до 30,85 г.
Пример 6.
В 100 туристических
агентствах города предполагается
провести обследование среднемесячного
количества реализованных путевок
методом механического отбора. Какова
должна быть численность выборки, чтобы
с вероятностью 0,683 ошибка не превышала
3 путевок, если по данным пробного
обследования дисперсия составляет 225?
Решение.
Так как отбор
механический, численность выборки
определяется по формуле:
Рассчитаем
необходимый объем выборки:
Таким образом,
чтобы с данной точностью определить
среднемесячное количество реализованных
путевок, необходимо отобрать 20
туристических агентств.
Пример 7.
Произведено
выборочное наблюдение партии однородной
продукции для определения процента
изделий высшего сорта.
При механическом
способе отбора из партии готовых изделий
в 20000 единиц было обследовано 800 единиц,
из которых 640 изделий отнесены к высшему
сорту.
Определите:
-
с вероятностью
0,9973 возможный процент изделий высшего
сорта во всей партии.
Решение.
В случае механического
отбора предельная ошибка определяется
по следующей формуле:
Границы генеральной
доли изделий высшего сорта:
Следовательно,
генеральная доля находится в пределах:
Таким образом, с
вероятностью 0,9973 можно утверждать, что
во всей партии от 76 до 84 % — продукция
высшего сорта.
Пример 8.
При обследовании
100 образцов изделий, отобранных из партии
в случайном порядке, оказалось 20
нестандартных.
Определите:
-
с вероятностью
0,954 пределы, в которых находится доля
нестандартной продукции в партии.
Решение.
Чтобы определить
границы генеральной доли, необходимо
определить выборочную долю и ошибку
выборочной доли.
Рассчитаем долю
нестандартной продукции в выборочной
совокупности:
Предельная ошибка
выборочной доли с вероятностью 0,954
составит:
Доля нестандартной
продукции в генеральной совокупности
определяется по формуле:
Таким образом, с
вероятностью 0,954 можно утверждать, что
доля нестандартной продукции в партии
товара находится в пределах от 12 до 28%.
Пример 9.
200 ящиков деталей
упакованы по 40 шт. в каждом. Для проверки
качества деталей был проведен сплошной
контроль деталей в 20 ящиках (выборка
бесповторная). В результате контроля
установлено, что доля бракованных
деталей составляет 15%. Межсерийная
дисперсия равна 49.
Определите:
-
с вероятностью
0,9973 пределы, в которых находится доля
бракованной продукции в партии ящиков.
Решение.
Определим среднюю
ошибку выборки:
Предельная ошибка
выборки для доли с вероятностью 0,9973
(t=3)
равна: w
= 1,48
3 = 4,44%.
Пределы в генеральной
совокупности:
Таким образом, с
вероятностью 0,9973 можно утверждать, что
доля бракованных деталей в партии будет
находиться в пределах от 10,59 до 19,41%.
Пример 10.
В районе 10 тыс.
семей. Из них 5 тыс. семей рабочих, 4 тыс.
семей работников сельского хозяйства,
1 тыс. семей служащих. Для определения
числа детей в семье была проведена
10%-ная типическая выборка, с отбором
единиц пропорционально численности
единиц типических групп. Внутри групп
применялся метод механического отбора.
Результаты выборки представлены в
таблице.
Определите:
-
с вероятностью
0,9973 пределы, в которых находится среднее
число детей в семье в районе.
Решение.
Определим число
отобранных семей по типам семей:
где
Численность семей
в первой группе:
Численность семей
во второй группе:
Численность семей
в третьей группе:
Выборочная средняя
определяется
по формуле средней арифметической
взвешенной:
Определим среднюю
из внутригрупповых дисперсий:
Рассчитаем среднюю
ошибку выборочной средней типической
выборки:
С вероятностью
0,9973 (t
= 3) определим предельную ошибку
выборочной средней:
Доверительные
пределы определим по формуле:
Таким образом, с
вероятностью 0,9973 можно утверждать, что
в районе среднее число детей в семье
находится в пределах
Пример 11.
В акционерном
обществе 200 бригад рабочих. Планируется
проведение выборочного обследования
с целью определения удельного веса
рабочих, имеющих профессиональные
заболевания. Известно, что межсерийная
дисперсия доли равна 225.
Рассчитайте:
-
с вероятностью
0,683 необходимое количество бригад для
обследования рабочих, если ошибка
выборки не должна превышать 5%.
Решение.
Рассчитаем
необходимое количество бригад на основе
формулы объема серийной бесповторной
выборки:
Таким образом,
чтобы с заданной точностью определить
удельный вес рабочих, имеющих
профессиональные заболевания, необходимо
из 200 бригад обследовать 30 бригад.
Средняя из
внутригрупповых дисперсий определяется
по формуле:
Определим среднюю
ошибку выборочной доли:
Предельная ошибка
выборки для доли с вероятностью 0,683
(t
=
1)
Определим
доверительные интервалы:
или
Таким образом, с
вероятностью 0,683 можно утверждать, что
доля рабочих, не выполняющих норму
выработки на заводе колеблется от 2,45
до 5,15%.
ПРИЛОЖЕНИЕ А
Условные обозначения
ПРИЛОЖЕНИЕ Б
Определение средней ошибки выборки
при различных видах выборок
ПРИЛОЖЕНИЕ В
Определение дисперсий для различных
видов выборки
ПРИЛОЖЕНИЕ Г
Определение необходимого объема
выборки
Ошибка! Ошибка связи.
Соседние файлы в папке А Д
- #
24.03.201569.63 Кб46123.xls
- #
- #
- #
- #
- #
- #
24.03.201515.36 Кб65Лабораторная 1 , Алексеева Александра.xls
При обследовании 500 образцов изделий, отобранных из партии готовой продукции предприятия в случайном порядке, 40 оказались нестандартными.
С вероятностью 0,954 определите пределы, в которых находится доля нестандартной продукции, выпускаемой заводом.
Решение:
Рассчитаем долю нестандартной продукции в выборочной совокупности:
Средняя ошибка выборочной доли при повторном отборе рассчитывается по формуле:
где n – численность выборки.
С вероятностью 0,954 рассчитаем предельную ошибку выборочной доли по формуле:
Δ = μ × t
где
t – коэффициент доверия.
Значение коэффициента доверия t определяется в зависимости от того, с какой доверительной вероятностью надо гарантировать результаты выборочного наблюдения и берётся из готовых таблиц.
При Р = 0,954, t = 2.
Δ = t * μ = 2 * 0,012 = 0,024
С вероятностью 0,954 можно утверждать, что доля нестандартной продукции в партии товара колеблется:
ω – Δ ˂ р ˂ ω + Δ
0,08 – 0,02 ˂ р ˂ 0,08+0,02
0,06 ˂ р ˂ 0,10
или
6% ˂ р ˂ 10%
4.6. Оценка генеральной средней по повторной и бесповторной выборкам
Итак, вникаем: пусть из нормально распределенной (или около того) генеральной совокупности
объёма проведена выборка объёма и по её результатам найдена выборочная средняя . Тогда доверительный интервал для оценки
генеральной средней имеет вид:
, где («дельта» большая) – точность
оценки, которую также называют предельной ошибкойвыборки.
Точность оценки рассчитывается как произведение – коэффициента доверия на среднюю ошибкувыборки («мю»).
Если известна дисперсия генеральной совокупности , то коэффициент доверия отыскивается из лапласовского соотношения , а средняя ошибка рассчитывается по формуле:
– для бесповторной выборки или – для повторной.
Если же генеральная дисперсия не известна, то в качестве её приближения используют исправленную выборочную дисперсию . В этом случае коэффициент доверия определяют с помощью распределения Стьюдента, а при можно использовать соотношение . Средняя же ошибка рассчитывается по аналогичным формулам:
– для бесповторной или – для повторной выборки.
Напоминаю, что доверительная вероятность (надёжность) задаётся наперёд и показывает, с какой вероятностью построенный
доверительный интервал накрывает истинное
значение .
С конспектом отмучились, теперь задачи
Модифицируем задание Примера 19, а именно уточним способ отбора попугаев:
Пример 25
Известно, что генеральная совокупность распределена нормально со средним квадратическим отклонением . По результатам 4%-ной бесповторной выборки объёма , найдена выборочная средняя (условно средний рост птицы).
1) Найти доверительный интервал для оценки генеральной средней с надежностью .
2) Выборку какого объёма нужно организовать, чтобы уменьшить данный интервал в два раза?
Не решение даже, а целое исследование впереди, начинаем. Прежде всего, найдём объём генеральной
совокупности:
попугаев, и на самом деле нам предстоит
ответить на следующий вопрос: а достаточно ли выборки объёма ? Или для качественного исследования роста попугаев нужно выбрать побольше
птиц?
1) Доверительный интервал для оценки генеральной средней составим по формуле:
, где – точность оценки. В задачах данного типа у коэффициента доверия часто
опускают подстрочный индекс и пишут просто ,
однако я не буду следовать мейнстриму, т. к. эта «кастрация» ухудшает понимание.
По условию, нам известна генеральная дисперсия, поэтому коэффициент доверия найдём из
соотношения . По таблице значений функции Лапласа либо на макете (пункт 1*) определяем, что этому значению функции соответствует аргумент .
Поскольку выборка бесповторная, то среднюю ошибку рассчитаем по
формуле:
Таким образом, точность оценки и
соответствующий доверительный интервал:
– с вероятностью данный интервал накроет истинное значение генерального среднего
роста попугая.
Теперь предположим, что нас не устраивает точность полученного результата. Хотелось бы уменьшить интервал. Или оставить
его таким же, но повысить доверительную вероятность. Этим вопросам и посвящён следующий пункт решения:
2) Выясним, сколько попугаев нужно взять, чтобы уменьшить полученный интервал в два раза. Иными словами, была точность
0,96, а мы хотим . При условии сохранения
доверительной вероятности необходимый объём выборки можно рассчитать по формуле , которая выводится из .
А нашей задаче:
и обязательно проверочка:
, ч.т.п.
Таким образом, чтобы обеспечить точность при
надёжности нужно провести выборку объёмом
не менее 358 попугаев (округлили в бОльшую сторону). В этом случае получится доверительный
интервал в два раза короче:
И внимание! Здесь нельзя использовать значение предыдущего пункта! Почему? Потому что в новой выборке мы почти
наверняка получим НОВУЮ выборочную среднюю. Вот её-то и нужно будет подставить.
Осталось прикинуть, а не много ли это – 358 попугаев? Объём выборки составит: от генеральной совокупности – ну, в принципе, сносно, хотя и многовато. Поэтому здесь
можно использовать другой подход: оставить точность оценки прежней, но повысить доверительную вероятность до . В этом случае нужно найти новый коэффициент доверия (из соотношения ) и решить уравнение , получив в качестве корня необходимый объём выборки . Желающие могут выполнить этот пункт самостоятельно, в результате
получается выборка в попугаев или генеральной совокупности. Что лучше, конечно, ведь измерить
линейкой 358 попугаев – задача хлопотная, они явно будут сопротивляться, а некоторые ещё и говорить нехорошие слова J.
Теперь распишем доверительный интервал подробно:
и ответим вот на какой вопрос: а что будет, если генеральная совокупность великА или даже бесконечна? В
этом случае дробь близкА к нулю, и мы получаем
интервал:
, который фигурировал в Примере 19. То есть по
умолчанию (когда не сказано, бесповторная выборка или нет), считают именно так.
Следует отметить, что полученный выше интервал соответствует повторной выборке со
средней ошибкой , таким образом, при слишком
большом объёме генеральной совокупности
математическое различие между бесповторной и повторной выборкой стирается.
Пришло время запланировать собственное статистическое исследование:
Пример 26
В результате многократных независимых измерений некоторой физической величины в прошлом достаточно точно определена генеральная дисперсия ед.; при этом средняя величина склонна изменениям (от исследования к
исследованию). Сколько измерений нужно осуществить, чтобы с вероятностью заключить текущее истинное значение генеральной средней в интервале длиной 0,5 ед.
И это как раз только что описанный случай: данную выборку можно считать бесповторной, при этом ген. совокупность
теоретически бесконечна; либо повторной, так как округлённые результаты измерений могут повторяться.
Краткое решение в конце книги, числа можете выбрать по своему вкусу J. Но здесь есть одно «странное» значение . Оно не случайно и соответствует
правилу «трёх сигм», т. е.,
практически достоверным является тот факт, что построенный интервал накроет истинное значение .
Разумеется, на практике генеральная дисперсия чаще не известна, и поэтому за неимением лучшего, используют исправленную
выборочную дисперсию:
Пример 27
С целью изучения урожайности подсолнечника в колхозах области проведено 5%-ное выборочное обследование 100 га посевов,
отобранных в случайном порядке, в результате которого получены следующие данные:
С вероятностью 0,9974 определить предельную ошибку выборки и возможные границы, в которых ожидается средняя
урожайность подсолнечника в области.
Решение: в условии не указан тип отбора, но исходя из логики исследования, положим, что он
бесповторный. Поскольку выборка 5%-ная, то объем генеральной совокупности (общая посевная площадь области)
составляет:
гектаров – не знаю, насколько это
реалистично, оставим этот вопрос на совести автора задачи.
По условию, требуется найти предельную ошибку выборки (точность оценки) , где –
коэффициент доверия, соответствующий доверительной вероятности , и коль скоро выборка бесповторна и генеральной дисперсии мы не знаем, то средняя ошибка рассчитывается по формуле . Далее нужно составить интервал , который с вероятностью 99,74% (практически достоверно) накроет генеральную среднюю урожайность
подсолнечника по области.
И если с коэффициентом «тэ гаммовое» трудностей никаких, то коэффициент «мю» здесь трудовой – по той причине, что нам не
известна исправленная выборочная дисперсия. Ну что же, хороший повод освежить пройденный материал. Смотрим на таблицу
выше и приходим к выводу, что нам предложен интервальный вариационный ряд с
открытыми крайними интервалами. Поскольку длина частичного интервала составляет га, то вопрос закрываем так: 11-13 и 19-21 га.
Находим середины интервалов (переходим к
дискретному ряду), произведения и их суммы:
Вычислим выборочную среднюю: центнеров с гектара.
Выборочную дисперсию вычислим по формуле:
и этим частенько пренебрегают, но я
призываю поправлять дисперсию:
– мелочь, а приятно.
Теперь составляем доверительный интервал ,
где .
Найдём коэффициент доверия .
Поскольку нам известна лишь исправленная выборочная дисперсия (а не генеральная), то правильнее использовать распределение
Стьюдента. Но, к сожалению, в таблице нет значений для , но зато есть расчётный макет (пункт 2б). Для заданной надёжности и количества степеней свободы получаем .
Поскольку объём выборки , то можно использовать
нормальное распределение, и тут получается конфетка:
, какой способ выбрать – зависит от вашей
методички, и я так подозреваю, второй :). Но сейчас выберем первый.
Вычислим среднюю ошибку бесповторной выборки:
ц/га, таким образом, предельная ошибка
составляет ц/га, и искомый доверительный
интервал:
(ц/га) – границы, в которых ожидается
средняя урожайность подсолнечника в области с вероятностью (практически достоверно).
Ответ: ц/га, (ц/га)
В рассмотренной задаче можно поставить вопросы, аналогичные Примеру 25, а именно попытаться улучшить исследование, в
частности, уменьшить точность оценки . В этом
случае для определения необходимого объема выборки используется та же формула , но она менее достоверна, поскольку в разных выборках мы будем получать разные значения
. Такие задачи, однако, встречаются, будьте
готовы. Да, и аналогичная формула для повторной выборки: .
Пример 28
По результатам 10%-ной бесповторной выборки объёма , найдены выборочная средняя и дисперсия .
а) Найти пределы, за которые с доверительной вероятностью 0,954 не выйдет среднее значение генеральной совокупности.
б) Найти эти пределы, если выборка повторная. Какой способ точнее?
Значение 0,954 обусловлено тем, что автор задачи пощадил студентов, в методичке используется функция Лапласа и получается целое значение .
Решаем самостоятельно!
4.7. Оценка генеральной доли
4.5. Повторная и бесповторная выборка
| Оглавление |