АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Ошибки выборки

Читайте также:
  1. I.Ошибки в согласовании
  2. II. Ошибки в управлении
  3. III. Ошибки в построении простого предложения
  4. IV. Найдите предложения, в которых нет грамматической ошибки. Исправьте ошибки в остальных предложениях.
  5. IV. Ошибки в построении сложного предложения
  6. Влияние вида выборки на величину ошибки выборки
  7. Возможные ошибки
  8. Возможные ошибки психолога при использовании мета-методов на тренинге
  9. Выборочный метод понятие виды выборки
  10. Выделенные ошибки
  11. Гендерные различия и ошибки мышления
  12. Глава 5 ОСНОВНЫЕ ОШИБКИ И МЕРЫ ПРЕДОСТОРОЖНОСТИ

Как уже отмечалось, выборочный метод позволяет результаты выборочной обработки материалов переносить на всю генеральную совокупность. При этом, естественно, имеет место некоторая ошибка, и эффективность выборочного метода заключается в том, что он позволяет оценить эту ошибку.

Ошибки, возникающие при использовании выборочных данных для суждения о всей совокупности, показывают, насколько хорошо характеристики выборки представляют соответствующие характеристики генеральной совокупности, и называются поэтому ошибками представительности (репрезентативности). Различают ошибки представительности двоякого рода: систематические и случайные.

Систематические ошибки возникают в том случае, если не выполнены условия случайности отбора.

Систематическая ошибка может возникнуть и в случае, когда формально отбор произведен случайным образом, но исходная совокупность не является полной и представительной для решения поставленной задачи.

В теории выборочного метода не рассматриваются систематические ошибки, но исследователь должен помнить о возможности их появления и принять меры, обеспечивающие их исключение. С помощью выборочного метода определяются величины ошибок второго рода, т. е. величины случайных ошибок.

Случайные ошибки выборок возникают за счет того, что для анализа всей совокупности используется только часть ее.

Хотя выборочный метод и позволяет обоснованно судить о средней арифметической некоторого количественного признака генеральной совокупности по средней арифметической, исчисленной по выборке, это, однако, не означает, что выборочная средняя совпадает с генеральной средней. Она, как правило, в той или иной степени от нее отличается.

Величина ошибки выборки представляет собой разность между генеральной и выборочной средними. Ошибки выборки различны для каждой конкретной выборки и в принципе могут быть обобщенно охарактеризованы с помощью средней из всех таких отдельных ошибок.

В математической статистике получены формулы, которые позволяют приближенно вычислить среднюю ошибку выборки, основываясь на данных только той выборки, которая имеется в распоряжении исследователя. Вычисление средней ошибки выборки зависит от способа отбора элементов из совокупности в выборку.

Средняя ошибка выборки при собственно случайном повторном методе отбора определяется формулой

где о — оценка среднего квдаратического отклонения в генеральной совокупности по выборке; n - число элементов в выборке (ее объем) (На практике величину а заменяют на среднее квадратическое отклонение выборки по формуле (4.7), но пользоваться этой формулой можно лишь при достаточно большом объеме выборки(n>30). Методы расчета средней ошибки для малых выборок изложены в § 4 этой главы.).

Как видим, средняя ошибка выборки (ее называют иногда стандартной ошибкой выборки) существенно зависит от среднего квадратического отклонения отдельных значений признака от выборочной средней: чем больше среднее квадратическое отклонение, т. е. чем больше разброс значений признака, тем, при прочих равных условиях, больше средняя ошибка выборки. Объем выборки воздействует на среднюю ошибку выборки в обратном направлении: чем больше численность выборки, тем меньше средняя ошибка выборки, что вполне объяснимо, так как большая выборка лучше представляет всю совокупность.

Средняя ошибка выборки при случайном бесповторном отборе находится по формуле

где N — объем генеральной совокупности.

Формула (5.2) отличается от формулы (5.1) только множителем— . Множитель всегда меньше единицы, в связи с чем средняя ошибка выборки при бесповторном способе отбора, как правило, бывает меньше средней ошибки повторной выборки того же объема. Это различие становится тем существеннее, чем большую долю генеральной совокупности составляет выборка. Если же отношение n/N мало, то множитель близок к единице и при расчете средней ошибки бесповторной выборки им можно пренебречь. Таким же образом следует поступать и в том случае, когда объем генеральной совокупности неизвестен, с чем историк может нередко столкнуться. Правда, при этом необходимо иметь хотя бы примерное представление о соотношении n и N.

 

18. понятие о рядах динамики,основные требование к их построению. Ряд динамики представляет собой ряд расположенных в хронологической последовательности числовых значений статистического показателя, характеризующих изменение общественных явлений во времени.

В каждом ряду динамики имеются два основных элемента: время t и конкретное значение показателя (уровень ряда) y.

Уровень ряда – это показатели, числовые значения которых составляют динамический ряд. Время – это моменты или периоды, к которым относятся уровни.

Ряды динамики различаются по следующим признакам:

1. по времени – моментные и интервальные.

Моментным называется ряд динамики, уровни которого характеризуют состояние явления на определенные даты (моменты времени).

Интервальным (периодическим) рядом динамики называется такой ряд, уровни которого характеризуют размер явления за конкретный период времени (год, квартал, месяц).

2. По форме представления уровней – ряды абсолютных, относительных и средних величин.

3. По расстоянию между датами или интервалами времени выделяют равностоящие и неравностоящие ряды. Равностоящие ряды – когда даты регистрации или окончания периодов следуют друг за другом с равными интервалами. Неполные или неравностоящие ряды динамики – когда принцип равных интервалов не соблюдается.

4. По числу показателей можно выделить изолированные (анализ одного показателя) и комплексные (анализ системы показателей) ряды.

При составлении ряда динамики должны выполняться следующие требования:

1. Периодизация развития, т. е. расчленение его во времени на однородные этапы, в пределах которых показатель подчиняется одному закону развития. Периодизация может достигаться несколькими методами:

- исторический метод; - метод параллельной периодизации. - методы многомерного статистического анализа.

2. Статистические данные должны быть сопоставимы по территории, кругу охватываемых объектов, единицам измерения, времени регистрации, ценам, методологии и др.

3. Величины временных интервалов должны соответствовать интенсивности изучаемых процессов. Чем больше вариация уровней во времени, тем чаще следует делать замеры. Соответственно для стабильных процессов интервалы можно увеличить.

4. Числовые уровни рядов динамики должны быть упорядоченными во времени. Не допускается анализ рядов с пропусками отдельных уровней, если же такие пропуски неизбежны, то их восполняют условными расчетными значениями.

 

19. Уровнями динамического ряда могут быть не только абсолютные показатели. Ряды динамики могут отражать развитие структуры совокупности, вариации признака в совокупности, взаимосвязи между признаками, соотношения значений признака для разных объектов.

Для количественной оценки рядов динамики применяются различные статистические показатели

1) начальный, конечный и средний уровень ряда;

2) статистические показатели направления размера изменений уровней ряда во времени;

3) средние величины в рядах динамики;

4) основная тенденция развития (тренд) и оценка сезонных колебаний;

5) Каждый ряд динамики состоит из n-ого числа варьирующих во времени уровней (показателей).

Обычно анализ рядов динамики начинается с определения среднего уровня.

Средний уровень ряда даёт обобщённую характеристику показателя за весь период, охватываемый рядом динамики.

Средний уровень в интервальном и моментальном рядах динамики определяется по разному. В интервальном ряду с равными периодами (интервалами) средний уровень рассчитывается по формуле простой средней арифметической. Таким образом, средняя хронологическая из моментального ряда динамики равняется сумме показателей этого ряда (при этом начальный и конечный уровни должны быть взяты в половинном размере), делённой на число показателей без одного.

Средние показатели динамики — средний уровень ряда, средние абсолютные изменения и ускорения, средние темпы роста —характеризуют тенденцию. Они необходимы при обобщении характеристик тенденции за длительный период, по различным периодам и незаменимы при сравнении развития за неодинаковые по длительности отрезки времени, при выборе аналитического выражения тренда. При наличии в динамическом ряду существенных колебаний уровней определение средних показателей тенденции требует использования специальных методов статистики.

Средний уровень интервального ряда динамики определяется как простая арифметическая средняя из уровней за равные промежутки времени.

В моментном ряду смысл среднего уровня в том, что он характеризует уже не состояние на отдельный момент, а состояние между начальным и конечным моментом учета.

Средний абсолютный прирост (абсолютное изменение)определяется как простая арифметическая средняя из абсолютных изменений за равные промежутки времени или как частное от деления величины базисного абсолютного изменения на число осредняемых отрезков времени от базисного до сравниваемого периода.

Среднее ускорение абсолютного изменения применяется реже. Для его надежного расчета даже при слабых колебаниях уровней требуется использовать методику аналитического выравнивания по параболе 2-го порядка. Не рекомендуется измерять среднее ускорение без абстрагирования от колебаний уровней. Для более грубого, приближенного расчета среднего ускорения можно воспользоваться средними годовыми уровнями, сглаживающими колебания.

20. выравнивае рядов динамики. Очень часто в рядах динамики сложно определить общую тенденцию развития. Второй задачей рядов динамики является выявление таких периодов развития, которые достаточно однородны по своим условиям и взаимодействиям связей между показателями.

Под тенденцией понимается общее направление к росту, снижению или стабилизации уровня явления с течением времени. Тенденция по периодам может не совпадать с общей тенденцией. Иногда вообще сложно определить общую тенденцию. В этом случае прибегают к различным методам:

способ укрупнения интервалов;

сглаживание ряда с помощью скользящей средней;

производят аналитическое выравнивание и получают уравнение тренда.

Первый способ заключается в переходе от меньших временных интервалов к большим и расчете усредненных уровней ряда за укрепленный интервал. Поэтому для наглядного представления тренда применяется метод укрупнения интервалов.

Способ скользящей средней заключается в том, что вычисляется средний уровень из определенного числа первых по порядку уровней ряда, затем – средний уровень из такого же числа уровней ряда, начиная со второго, далее – начиная с третьего и т.д

Метод скользящей средней волне приемлем, если графическое изображение ряда динамики напоминает прямую линию. Однако когда тренд выравниваемого ряда имеет изгибы, использовать для сглаживания ряда метод скользящей средней нецелесообразно.

Но самые точные результаты выравнивания ряда динамики дает аналитическое выравнивание, с помощью которого строят математическое уравнение, наилучшим образом описывающее тенденцию изменения показателя ряда.

При построении тренда необходимо выявить этапы в развитии исследуемого явления с помощью абсолютных и относительных показателей рядов динамики, выбрать тип линии уравнения тренда и вычислить параметры уравнения. Для этого, как правило, применяют метод наименьших квадратов.

 

21. Оценка адекватности тренда и прогнозированиеДля найденного уравнения тренда необходимо провести оценку его надежности (адекватности), что осуществляется обычно с помощью критерия Фишера, сравнивая его расчетное значение Fр с теоретическим (табличным) значением FТ (Приложение 4). При этом расчетный критерий Фишера определяется по формуле (102):

, (102)

где k – число параметров (членов) выбранного уравнения тренда.

Для проверки правильности расчета сумм в формуле (102) можно использовать следующее равенство (103):

. (103)

В нашем примере про ВО равенство (103) соблюдается (необходимые суммы рассчитаны в трех последних столбцах табл. 31): 89410,434 = 9652,171 + 79758,263.

Сравнение расчетного и теоретического значений критерия Фишера ведется при заданном уровне значимости[32]с учетом степеней свободы: и . При условии Fр > FТ считается, что выбранная математическая модель ряда динамики адекватно отражает обнаруженный в нем тренд.

Проверим тренд на адекватность в нашем примере про ВО по формуле (102):

FР = 79758,263*5/(9652,171*1) = 41,32 > FТ, значит, модель адекватна и ее можно использовать для прогнозирования (FТ = 6,61 находим по Приложению 4 в 1-ом столбце [ = k – 1 = 2 – 1 = 1] и 5-й строке [ = n – k = 5]).

Как уже было отмечено ранее, в нашем примере про ВО России можно произвести выравнивание не только по прямой линии, но и по параболе, чего делать не будем, так как уже найденный линейный тренд адекватно описывает тенденцию[33].

При составлении прогнозов уровней социально-экономических явлений обычно оперируют не точечной, а интервальной оценкой, рассчитывая так называемые доверительные интервалы прогноза. Границы интервалов определяются по формуле (104):

, (104)

где – точечный прогноз, рассчитанный по модели тренда; коэффициент доверия по распределению Стьюдента при уровне значимости и числе степеней свободы =n–1 (Приложение 2)[34]; ошибка аппроксимации, определяемая по формуле (105):

. (105)

 

 


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.007 сек.)