Прикладная эконометрика

👀 318 просмотров
📌 276 загрузок

Выбери формат для чтения

Конспект лекции по дисциплине «Прикладная эконометрика», pdf

Загружаем конспект в формате pdf

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Прикладная эконометрика», Word формат

Модуль 3 Прикладная эконометрика Тема 3.1. Анализ временных рядов Лекция 3.1.1. Составляющие временного ряда. Выделение долгосрочной тенденции развития Временным рядом называют последовательность наблюдений, обычно упорядоченную во времени, хотя возможно упорядочение и по какому-то другому параметру. Временной ряд имеет два главных отличия от рассматриваемых наблюдений анализируемого признака, образующих случайные выборки: а) образующие временной ряд наблюдения, рассматриваемые как случайные величины, не являются взаимно-независимыми, и, в частности, значение, которое мы получим в момент времени tk , может существенно зависеть от того, какие значения были зарегистрированы до этого момента времени; б) наблюдения временного ряда (в отличие от элементов случайной выборки) не образуют стационарной последовательности, т.е. закон распределения вероятностей k-го члена временного ряда не остается одним и тем же при изменении его номера k; в частности от tk могут зависеть основные числовые характеристики случайной переменной xk — ее среднее значение и дисперсия. Иначе говоря, при исследовании временных рядов существенное значение имеет тот порядок, в котором проводились наблюдения над исследуемой величиной. Посредством анализа временных рядов могут решаться следующие задачи: описание характерных особенностей ряда, объяснение механизма поведения ряда, прогнозирование поведение ряда, моделирование совместного развития во времени многих переменных и др. Динамика рядов экономических показателей в общем случае складывается из четырех компонентов: 57 1. тенденции, характеризующей долговременную основную закономерность развития исследуемого явления; 2. периодического компонента, связанного с влиянием сезонности развития изучаемого явления; 3. циклического компонента, характеризующего циклические колебания, свойственные любому воспроизводству (например, циклы обновления, связанные с чисто техническими проблемами); 4. случайного компонента как результата влияния множества случайных факторов. Под тенденцией понимают некоторое общее направление развития, долговременную эволюцию. Тенденцию ряда динамики представляют в виде гладкой кривой (траектории), которая аналитически выражается некоторой функцией времени, называемой трендом. Тренд характеризует основную закономерность движения во времени, свободную в основном (но не полностью) от случайных воздействий. В большинстве случаев полученная траектория связывается исключительно со временем. Предполагается, что, рассматривая любое явление как функцию времени, можно выразить влияние всех основных факторов. Механизм их влияния в общем виде не учитывается. В связи с этим под трендом обычно понимают регрессию на время. Более общее понятие тренда — это детерминированная составляющая динамики развития, определяемая влиянием постоянно действующих факторов. Отклонение от тренда есть некоторая случайная составляющая, характеризуемая влиянием случайных факторов. Исходя из этого модель временного ряда описывается уравнением yt = f (t) + εt , где y1 , y2 , . . . , yT (t = 1, T ) — уровни временного ряда; f (t) — систематическая (детерминированная) составляющая, характеризующая основную тенденцию ряда во времени; εt — случайная составляющая. 58 Во временных рядах можно наблюдать тенденции трех видов: тенденцию среднего уровня, тенденцию дисперсии, тенденцию автокорреляции. Тенденцию среднего уровня наглядно можно представить графиком временного ряда. Аналитически она выражается в виде функции f (t), вокруг которой варьируют фактические значения изучаемого явления. Тенденция дисперсии — это изменения отклонений эмпирических значений временного ряда от значений, вычисленных по уровню тренда. Тенденция автокорреляции — это тенденция изменения связи между отдельными уровнями временного ряда. Первоначально анализ временных рядов базировался на моделях, в которых влияние временного параметра проявлялось только в систематической составляющей. В таких моделях предполагается, что течение времени никак не отражается на случайной составляющей, т. е. математическое ожидание случайной величины равно нулю (M εt = 0), дисперсия равна некоторой постоянной (Dεt ≡ c = const) и значения ε в разные моменты времени некоррелированы: cov (εt1 , εt2 ) = 0 для любых не равных между собой t1 , t2 ∈ 1, T . Долговременная тенденция формируется под воздействием факторов, ведущих к постепенному изменению экономического показателя, поэтому такие зависимости могут моделироваться с использованием полиномов низких степеней. Циклические последовательности (как долговременные, так и сезонные) моделируются при помощи тригонометрических функций. Проверка гипотезы о существовании тенденции Один из способов проверки основан на сравнении средних уровней ряда: временной ряд разбивают на две примерно равные части по числу членов, каждая из которых рассматривается как некоторая самостоятельная выборочная совокупность, имеющая нормальное распределение. Если временной ряд имеет тенденцию, то средние, вычисленные для каждой совокупности, должны существенно (значимо) отличаться 59 между собой. Если же расхождение будет незначимым, несущественным (случайным), то временной ряд не имеет тенденции. Таким образом, проверка наличия тренда в исследуемом ряду сводится к проверке гипотезы о равенстве средних двух нормально распределенных совокупностей. Процедура проверки наличия тренда осуществляется в следующей последовательности: временной ряд делится на две примерно равные части, для каждой из которых вычисляются величины средних и дисперсий (y1 , y2 , S12 , S22 ). После этого проверяется гипотеза о равенстве дисперсий при уровне значимости α, для чего формируются две гипотезы: H0 : σ12 = σ22 , H1 : σ12 = 6 σ22 . Значимость различий проверяется путем вычисления Fрасч S22 = 2 S1 и сравнением ее с критическим значением F при числе степеней свободы, равном f1 = n2 − 1 и f2 = n1 − 1 и уровне значимости α. Если Fрасч < Fтабл , то принимается нулевая гипотеза о равенстве дисперсий генеральных совокупностей (выборочные дисперсии незначимо различаются, расхождение между ними случайно). После этого проверяется основная гипотеза H0 : y1 = y2 и гипотеза H1 : y1 6= y2 , для чего рассчитывается величина y1 − y2 Tрасч = p · (n1 − 1)S12 + (n2 − 1)S22 s n1 n2 (n1 + n2 − 2) √ . n1 + n2 Если |Tрасч | < tкрит(α, n−2) , то принимается нулевая гипотеза о равенстве средних, расхождение между вычисленными средними незначимо. Отсюда делается вывод, что тренд отсутствует. В противном случае, когда различие между средними будет значимо, принимается гипотеза H1 и делается вывод о наличии тренда. Существует еще ряд относительно простых методов для выявления тренда. Рассмотрим метод Ф. Фостера и А. Стюарта, который дает более надежный результат. По данным исследуемого ряда определяются величины ut и lt путем последовательного сравнения уровней ряда. 60 Если какой-либо уровень ряда превышает по своей величине каждый из предыдущих уровней, то величине ut присваивается значение 1, в остальных случаях она равна 0. Таким образом, ( 1 при yt > yt−1 , yt > yt−2 , . . . , yt > y1 ; ut = 0 — в противном случае И наоборот, если уровень ряда меньше всех предыдущих, то величина lt равна 1, в остальных случаях она равна 0: ( 1 при yt < yt−1 , yt < yt−2 , . . . , yt < y1 ; lt = 0 — в противном случае Затем находятся еще две величины: P S = st , где st = ut + lt ; P и D = dt , где dt = ut − lt . Суммирование проводят по всем членам ряда. Величины S и D имеют независимые распределения и существенно зависят от порядка расположения уровней во времени. С помощью D проверяют, существует ли тенденция изменения в дисперсиях, а S позволяет обнаружить тенденцию в средней. С этой целью проверяются две гипотезы о том, существенно ли отличаются D от нуля и S — от µ (математического ожидания S). Эти гипотезы проверяются с помощью случайных величин T1 и T2 , где D−0 T1 = σ2 и S−µ , T2 = σ1 причем σ2 и σ1 — средние квадратические ошибки соответственно D и S. Величины T1 и T2 имеют распределение Стьюдента с числом степеней свободы, равным (n − 1). Рассчитанные по формулам значения 1 и 2 сравнивают с табличными, найденными по таблицам критических точек распределения Стьюдента с уровнем значимости α и числом степеней свободы (n − 1). Если T2 (расч) > tтабл , то принимается гипотеза о наличии тенденции в средней и говорят, что тренд существует. Если T1 (расч) > tтабл , то тенденция в дисперсии есть и описывается некоторым трендом. В противном случае говорят, что тенденция в дисперсии отсутствует. 61 Лекция 3.1.2. Сглаживающие процедуры. Моделирование тенденции временного ряда В случаях, когда тренд имеет незначительные колебания на довольно коротких интервалах времени, и невозможно представить его простой функцией времени на всем интервале, тогда используются статистические процедуры сглаживания (которые также называют фильтрованием). Суть этих методов заключается в замене фактического значения ряда в данной точке на некоторую взвешенную среднюю величину значений, наблюдаемых в окрестности этой точки. При этом считается, что наблюдаемые значения являются суммой тренда и случайной ошибки. Грубо говоря, взвешенное среднее тренда совпадает со значением самого тренда в данной точке, а взвешенное среднее случайных составляющих имеет тенденцию становиться весьма малой величиной. Тем самым довольно нерегулярный график наблюдений заменяется гладким графиком скользящего среднего. Колеблемость ряда уменьшается, что позволяет оценить тренд взвешенной средней наблюдаемых значений. Расчетные значения определяются для всех точек ряда за исключением нескольких первых и последних. Пусть имеются наблюдения y1 , . . . , yT . Тогда формула линейного фильтра (или сглаженного значения уровня в точке t) будет yt∗ = m X cs yt+s s=−m t = m + 1, T − m. Здесь yt∗ является взвешенным средним наблюдаемых значений yt в интервале значений временного параметра t, отстоящих от t не более чем на m единиц. Веса cs предполагаются нормированными, так что m X cs = 1. s=−m В случае, когда веса остаются постоянными (cs = const), то фильтры называют симметричными. Тогда результат сглаживания есть вариант среднего арифметического и сглаженное значение yt∗ выражается 62 формулой yt∗ m X 1 1 = . yt+s , т. е. cs = 2m + 1 s=−m 2m + 1 В случае, когда весовые коэффициенты не остаются постоянными, т. е. когда, например, с приближением элемента ряда к уровню t его весовой коэффициент возрастает, то говорят о скользящей средней взвешенной. Если задается cs < cs+1 , то фильтр позволяет учесть устаревание данных. Существует и другая группа методов сглаживания, основанных на вычислении экспоненциальных средних значений уровня ряда по формуле типа m X ∗ yt = (1 − cs )m yt . s=−m Однако методы сглаживания имеют ряд недостатков: 1. невозможно указать доверительные области и проверить гипотезы относительно тренда; 2. нельзя непосредственно связать построенную функцию с моделью образования тренда; 3. сглаженный ряд укорачивается по сравнению с фактическим, что приводит к не очень надежной экстраполяции тренда. В связи с этим использование методов сглаживания больше применяется не для анализа ряда, а для его описания. Моделирование тенденции временного ряда с помощью аналитического выравнивания Наиболее распространенным и простым способом моделирования тенденции социально-экономического явления является аналитическое выравнивание временного ряда. Существуют различные приемы, но суть их одна — замена фактических уровней ряда расчетными, имеющими значительно меньшую колеблемость, чем исходные данные. Задача заключается в выборе наиболее подходящего типа кривой и оценке ее параметров. 63 Выбрать форму кривой можно, исходя из теоретического анализа сущности изучаемого явления и опираясь на опыт и знания самого исследователя. Наибольшее распространение имеют линейные зависимости, т. е. функции типа yt = a0 + a1 t, где yt — сглаженное (выравненное) значение уровня на момент t; коэффициенты a1 , a2 , . . . , aτ — веса, приписываемые уровню ряда, находящемуся на расстоянии τ от момента t. В зависимости от того, какие значения принимают весовые коэффициенты, сглаживание по данной формуле будет выполнено либо с помощью скользящих средних , либо экспоненциальных средних. Зависимости такого типа целесообразно применять для временных рядов с постоянным абсолютным приростом или снижением показателей (когда уровни ряда увеличиваются в арифметической прогрессии). Если анализируемая тенденция характеризуется постоянным темпом роста (рост уровней ряда идет в геометрической прогрессии), то целесообразно проводить выравнивание по показательной функции: 2 yt = a0 + a1 t или yt = b t+b t a0 a11 2 . При выравнивании временных рядов экономических явлений, характеризующихся стремлением к некоторой предельной величине, насыщением, используется модифицированная экспонента yt = a0 + a1 at2 . Процессы с переменными темпами роста хорошо моделируются Sобразными кривыми. К ним относятся логистические кривые и кривая Гомперца: yt = k (пример логистической кривой), 1 + a0 e−a1 t at yt = ka01 (пример кривой Гомперца). Для аппроксимации тренда часто используются полиномы различных степеней (как правило, до четвертой степени). Например, полином первой степени yt = a0 + a1 t, полином второй степени yt = a0 + a1 t + a2 t2 , полином третьей степени yt = a0 + a1 t + a2 t2 + a3 t3 и т. д. 64 Существуют различные приемы, позволяющие выбрать форму кривой, достаточно хорошо аппроксимирующей действительное развитие. Наиболее простой путь — визуальный, на основе графического изображения временного ряда. По виду графика подбирается уравнение кривой, которая ближе всего подходит к эмпирическому виду (траектории). Другой путь выявления формы кривой заключается в применении метода последовательных разностей. Однако данный метод применяется только при подборе кривых, описываемых полиномами. Сущность этого метода заключается в нахождении первых, вторых и т. д. разностей уровней, т. е. ∆1t = yt − yt−1 ; ∆2t = ∆1t − ∆1t−1 ; ∆3t = ∆2t − ∆2t−1 и т. д. Расчет этих разностей ведется до тех пор, пока разности не будут приблизительно равными. Порядок этих разностей и принимают за порядок искомого полинома. При подборе функции тренда наряду с теоретическим анализом закономерностей развития явления используются и эмпирические методы. После того, как форма кривой будет выбрана, необходимо оценить параметры соответствующей модели. Если функция линейна, то для оценки тренда используется традиционная техника регрессионного анализа. В остальных случаях должны применяться приемы преобразования уровней (линеаризация) и нелинейный метод наименьших квадратов. 65 Лекция 3.1.3. Модели автокорреляции и авторегрессии Среди моделей, отражающих свойства временных рядов, особо следует выделить модели автокорреляции и авторегрессии. Автокорреляция — это корреляционная зависимость между последовательными (соседними) значениями уровней временного ряда y1 и y2 , y2 и y3 , y3 и y4 и т. д. Например, урожайность в определенные годы связана с урожайностью предшествующих лет, энерговооруженность производства за определенный год зависит каким-то образом от электровооруженности этого производства в предшествующие годы и т. д. Чтобы оценить степень зависимости между соседними уровнями временного ряда (автокорреляцию), рассчитывают коэффициенты автокорреляции между уровнями исходного ряда и того же ряда, но сдвинутого на τ шагов во времени. Величину τ называют шагом (или лагом). Последовательность значений коэффициентов автокорреляции rτ , вычисленных при τ = 1, 2, . . . , l, называют автокорреляционной функцией. Эта функция дает достаточно глубокое представление о внутренней структуре изучаемого экономического явления. Различают два типа автокорреляции, характерной для временных рядов: автокорреляцию уровней временного ряда yt , когда наблюдается зависимость уровней временного ряда, и автокорреляцию остаточной компоненты εt , когда ее значения зависят от предшествующих значений εt−1 , εt−2 и т. д. Коэффициенты автокорреляции рассчитываются по формуле парного коэффициента корреляции. Так, коэффициент автокорреляции первого порядка (τ = 1) есть не что иное, как парный коэффициент корреляции между двумя рядами: y1 , y2 , . . . , yT −1 и y2 , y3 , . . . , yT −1 , yT . Тогда TP −1 (yt − y1 )(yt+1 − y2 ) . r1 = s t=1 TP −1 TP −1 (yt − y1 )2 · (yt+1 − y2 )2 t=1 t=1 где y1 — средний уровень первого ряда; y2 — средний уровень второго ряда. Аналогично вычисляются коэффициенты автокорреляции второго порядка τ = 2, третьего и т. д. 66 Общая формула для расчета коэффициента автокорреляции порядка τ запишется так: rτ = s TP −τ t=1 TP −τ t=1 (yt − y1 )(yt+τ − y2 ) (yt − y1 )2 · TP −τ t=1 . (yt+τ − y2 )2 При расчете коэффициентов автокорреляции с ростом порядка число коррелируемых пар уменьшается, а известно, что при небольшом числе наблюдений значимыми оказываются лишь высокие коэффициенты корреляции. Отсюда следует, что наибольшее значение τ должно быть таким, чтобы число пар наблюдений оказалось достаточным для вычисления коэффициентов автокорреляции rτ . В практике ориентируются на правило τ 6 T /4, где T — общее количество наблюдений временного ряда. Коэффициент автокорреляции изменяется от −1 до 1. Близкое к нулю значение коэффициента говорит об отсутствии автокорреляции уровней ряда, а достаточно высокая по модулю величина свидетельствует об автокоррелированности ряда. Если на оси абсцисс отложить значения τ , а на оси ординат — значения коэффициентов автокорреляции rτ , а затем точки с координатами (τ, rτ ) соединить отрезками прямой, то получится ломаная линия, которая называется коррелограммой. Анализ коррелограмм позволяет определить особенности стохастического процесса, отраженного в изучаемом ряду. Совокупность значений коэффициентов автокорреляции с разными лагами r1 , r2 , . . . , rp образует корреляционную функцию. Интерпретация коррелограмм требует определенного навыка и не всегда осуществима. Приведем несколько наиболее часто встречающихся ситуаций. 1. Если ряд содержит долгосрочную тенденцию к росту или к снижению, то все значения коэффициентов положительны, первый коэффициент r1 достаточно большой, а все последующие имеют тенденцию к снижению (рис. 3.1). Данный временной ряд хорошо аппроксимируется трендовыми моделями. 67 1 rτ -1 1 1 2 3 4 5 4 5 τ Рис. 3.1 rτ -1 1 2 3 τ Рис. 3.2 2. Если ряд имеет краткосрочные корреляции (зависимы смежные уровни ряда между собой), то первый коэффициент r1 положителен и имеет высокое значение (рис. 3.2). С увеличением временного лага корреляционная функция резко уменьшается и сохраняет лишь незначительные затухающие колебания около нуля. Для таких рядов целесообразно использовать авторегрессионные модели. 3. Если ряд имеет периодические колебания, то значения коэффициентов автокорреляции последовательно изменяют свой знак (рис. 3.3, 3.4, 3.5). 4. В случае стационарности временного ряда, когда с течением времени его математическое ожидание и дисперсия остаются постоянными, с ростом временного лага колебания коэффициентов автокорреляции затухают (рис. 3.6). 68 1 rτ -1 1 3 2 4 5 τ Рис. 3.3 1 rτ -1 1 2 3 4 5 τ Рис. 3.4 1 rτ -1 1 2 3 4 5 τ Рис. 3.5 69 1 rτ -1 1 3 2 1 5 4 τ Рис. 3.6 rτ -1 1 2 3 4 5 τ Рис. 3.7 5. Для полностью случайного ряда значения коэффициентов автокорреляции близки к нулю (рис. 3.7). При анализе временных рядов необходимо также знать, существует ли автокорреляция остаточной компоненты, поскольку для оцени- εt Рис. 3.8. Гомоскедастичность t вания параметров уравнения регрессии методом наименьших квадратов одним из условий было условие нормальности распределения остаточной составляющей (нулевое математическое ожидание, неизменность дисперсии и независимость остатков). 70 Если же возникает ситуация, когда дисперсия остаточной компо- εt ненты возрастает, т. е. распределение отличается от нормального, говорят о t наличии автокорреляции в остатках (иначе это явление называется ге- Рис. 3.9. Гетероскедастичность тероскедастичностью). Такая ситуация возникает, когда анализируемые объекты неоднородны. Например, если исследуется зависимость прибыли предприятия от каких-либо факторов (размера основных фондов), то естественно ожидать, что для больших предприятий колебание прибыли будет выше, чем для малых. Условие независимости дисперсии от номера наблюдения Dεt = σ 2 (t = 1, T ) называется гомоскедастичностью (рис. 3.8). Случай, когда это условие не выполняется, т. е. возрастает дисперсия остаточной компоненты, называется гетероскедастичностью (рис. 3.9). Условие cov(εt · εS ) = 0 при t= 6 S указывает на некоррелирован- εt ность ошибок для разных наблюде- ний. Это условие часто нарушается, t Рис. 3.10. Автокорреляция остатков когда данные являются временными рядами. Тогда говорят об автокорреляции в остатках (см. 3.10). Самым распространенным методом проверки автокорреляции в остатках в настоящее время является критерий Дарбина — Уотсона. Гипотеза о наличии автокорреляции про- 71 веряется с помощью случайной величины d= n−1 P t=1 (εt+1 − εt )2 n P t=1 . ε2t Здесь εt+1 и εt — отклонения от тренда. Возможные значения критерия находятся в интервале [0, 4]. Если автокорреляция в ряду отсутствует, то значения критерия d колеблются около 2. В общем случае расчетное значение критерия Дарбина — Уотсона может попасть в один из подинтервалов значений в промежутке от 0 до 4. При попадании расчетного значения критерия в конкретный подинтервал делаются соответствующие выводы о наличии (отсутствии) автокорреляции, либо о невозможности сделать вывод (в этом случае необходимо провести дополнительные исследования): . . d}н . . . |dв . . .{z 4 − d}в . . . 4| − d{z н...4 |0 . {z } есть есть есть Эмпирическое значение d сравнивается с табличным значением. В таблице значений критерия указываются два значения критерия d1 и d2 (верхняя и нижняя граница теоретических значений). Критическое значение распределения Дарбина — Уотсона определяют для уровня значимости α, при этом ν — число факторов в уравнении регрессии, n — число членов временного ряда. При сравнении расчетного значения d с табличным может получиться один из трех исходов: 1. dрасч < d1 — автокорреляция присутствует; 2. dрасч > d2 — автокорреляция отсутствует; 3. d1 6 dрасч 6 d2 — необходимо дальнейшее исследование. Величина критерия d различна при положительной и отрицательной автокорреляции; при отрицательной автокорреляции d находится в интервале [2, 4], тогда для проверки определяют величину d′ = 4 − d. Для определения автокорреляции вычисляют также коэффициент 72 автокорреляции остатков ρ= n P εt+1 εt t=1 . n P 2 εt t=1 Коэффициент автокорреляции остатков может принимать как положительные, так и отрицательные значения (вообще |ρ| 6 1). При положительном значении ρ делают вывод о наличии автокорреляции в остатках; отрицательное значение ρ говорит о регулярной смене знака остатков, т. е. о чередовании положительных и отрицательных отклонений. Как было отмечено выше, для временных рядов с краткосрочными тенденциями целесообразно построение авторегрессионных моделей. В общем виде модель авторегрессии порядка p имеет следующий вид: yb = α0 + α1 yt−1 + α2 yt−2 + . . . + αp yt−p + εt ,   yp yp−1 . . . y1    yp+1 yp . . . y2   где X =  .. ..  ,  ... . . . . .   yT −1 yT −2 . . . yT −p     a0 yp+1      a1   yp+2     Y =  ...  , A =  ... .     ap yT Оценка параметров авторегрессионного уравнения осуществляется по формуле A = (X T X)−1 X T Y. При этом одним из важных вопросов анализа авторегрессии является определение порядка авторегрессионной модели. Низкий порядок модели может дать несущественные результаты, так как в модели не использована важная информация за предыдущие моменты времени. Повышение порядка авторегрессионной модели может привести к снижению качества модели. Поэтому анализ авторегрессии не ограничивается 73 построением только одной модели, строится несколько моделей, по которым определяется ее порядок. Сначала строится уравнение регрессии первого порядка ybt = a0 + a1 yt−1 и для нее находится коэффициент автокорреляции. Затем строится модель второго порядка ybt = a0 + a1 yt−1 + a2 yt−2 . Для нее рассчитывается совокупный коэффициент автокорреляции R1 . Если R1 будет превышать r1 , то переходят к построению модели третьего порядка. Для этой модели также рассчитывается совокупный коэффициент автокорреляции R2 , который сравнивается с предыдущим. Эти расчеты продолжаются до тех пор, пока множественный коэффициент автокорреляции практически станет неизменным при добавлении очередных уровней. Коэффициент множественной автокорреляции определяется по формуле p Rk = r1 β1 + r2 β2 + . . . + rk βk , где ri — парные коэффициенты автокорреляции, βi — коэффициенты регрессии в стандартизованном масштабе. Построенные модели могут быть использованы при краткосрочном прогнозировании изучаемых явлений. 74 Лекция 3.1.4. Многомерные временные ряды При изучении закономерностей социально-экономических явлений большое значение имеет выявление зависимостей между взаимосвязанными, развивающимися во времени явлениями, проведение связанного анализа динамики. С этой целью строятся многофакторные модели взаимосвязанных временных рядов. Многофакторной моделью называют модель, построенную по нескольким временным рядам, уровни которых относятся к одинаковым временным отрезкам или датам. При моделировании многомерных временных рядов особое значение имеет корреляционный и регрессионный анализ. Однако при корреляционно-регрессионном анализе временных рядов необходимо учитывать ряд особенностей, игнорирование которых не позволяет получить правильной оценки взаимосвязи между рядами и адекватной модели этой взаимосвязи. Одна из таких особенностей состоит в наличии автокорреляции, которая искажает истинную тесноту связи между уровнями рядов, поскольку является следствием коррелированности уровней рядов друг с другом. Как правило, коэффициент корреляции между уровнями временных рядов, содержащих автокорреляцию, имеет завышенное значение, которое говорит не о высокой степени связи, а о высокой степени сопутствия развития показателей во времени. Высокая мера тесноты связи между уровнями в отдельных случаях может быть получена даже при отсутствии причинно-следственных связей между соответствующими явлениями. Для этого достаточно наличие устойчивых тенденций в развитии явлений, т. е. возможной автокорреляции внутри каждого ряда. Поэтому, прежде чем проводить корреляционный анализ временных рядов, необходимо рассчитать коэффициент автокорреляции и, в случае ее обнаружения, для установления «истинной» зависимости между исследуемыми рядами, требуется устранить автокорреляцию. Существуют различные методы устранения автокорреляции, однако все они преследуют одну цель — исключение из исследуемых рядов основной тенденции. Наиболее применяемые из этих методов: 1. метод коррелирования последовательных или конечных разно75 стей; 2. метод коррелирования отклонений уровней ряда от основной тенденции. Метод коррелирования последовательных разностей — это метод коррелирования первых, вторых и т. д. разностей уровней временных рядов. При этом учитывается вид тренда. Если аппроксимирующие функции линейные, то коррелируются первые разности. Тогда коэффициент корреляции последовательных разностей вычисляют как: rxy = s n−1 P t=1 n−1 P t=1 ∆1xt ∆1yt ∆21xt · . n−1 P t=1 ∆21yt Если аппроксимирующие функции представляют собой параболы второго порядка, то коррелируются вторые разности и т. д. Коррелируя разности уровней, тем самым механически уменьшают автокорреляцию в каждом из рассматриваемых рядов. Методически наиболее правомерным методом коррелирования временных рядов является метод измерения тесноты связи между отклонениями эмпирических значений уровней от выравненных по тренду. Формула коэффициента корреляции по отклонениям от трендов имеет вид n n P P ∗ ∗ εxt εyt (xt − xt )(yt − yt ) t=1 t=1 =s . rxy = s n n n n P P P P (xt − x∗t )2 · (yt − yt∗ )2 ε2xt · ε2yt t=1 Здесь t=1 t=1 t=1 xt , yt — фактические значения показателей; x∗t , yt∗ — расчетные значения показателей; εxt , εyt — отклонения от трендов. Для того, чтобы воспользоваться этой формулой, строят трендовые модели для x и y, с помощью которых оценивают остатки xt и yt . После этого вычисляют коэффициенты автокорреляции остатков и делают вывод о наличии либо отсутствии автокорреляции остаточных компонент. 76 Если автокорреляция остатков отсутствует, то рассчитывают коэффициент корреляции по отклонениям (который будет существенно ниже исходного, рассчитанного по рядам с автокорреляцией). Автокоррелированными могут оказаться остаточные величины и в регрессионной модели, построенной по многомерным временным рядам. Автокорреляция в отклонениях от регрессионной модели, построенной по многомерным временным рядам, обусловлена рядом причин: 1. в модели не учтен некоторый существенный фактор, и его влияние отражается в остатках, вследствие чего последние могут оказаться автокоррелированными; 2. в модели не учтено несколько второстепенных факторов, взаимное влияние которых является существенным вследствие совпадения фаз и направлений их изменения; 3. неправильно выбрана форма связи между факторными и результативными признаками; 4. не учтены особенности внутренней структуры случайной величины. Наиболее распространенным методом определения автокорреляции случайных величин является использование критерия Дарбина — Уотсона. Случайная величина d в этом случае будет иметь вид d= n−1 P t=1 (εt+1 − εt )2 n P t=1 . ε2t где t — случайные отклонения от тренда или регрессионной модели. Если в рядах динамики или в остаточных величинах имеется автокорреляция, то оценки коэффициентов регрессии, полученные методом наименьших квадратов, будут несмещенными, но неэффективными, т.к. наличие автокорреляции увеличивает дисперсии коэффициентов регрессии. Этот факт затрудняет построение доверительных интервалов для коэффициентов регрессии, а также проверку их значимости. 77 Итак, прежде чем проводить корреляционно-регрессионный анализ, необходимо исключить из исследуемых рядов основную тенденцию. Изучая взаимосвязанные временные ряды, следует иметь в виду, что в целом ряде случаев изменение уровней одного ряда может вызвать изменение уровней другого ряда только через определенный интервал времени. Направление и продолжительность отставания уровней одного из взаимосвязанных рядов от уровней другого ряда называются временным лагом. Для лаговых зависимостей применима стандартная техника корреляционно-регрессионного анализа. При вычислении оценок зависимостей ряды показателей сдвигаются друг относительно друга на τ , вследствие этого сдвинутые ряды оказываются короче на τ наблюдений. Коэффициент лаговой корреляции yt+τ и xt определяется по формуле: rτ = s n−τ P t=1 n−τ P t=1 (xt − x)(yt+τ − y) (xt − x)2 · n−τ P t=1 (yt+τ − y)2 где xt и yt+τ — уровни временных рядов, образующих пары; x и y — средние значения укороченных рядов; n — временной интервал наблюдений. Для определения величины сдвига одного ряда относительно другого временного ряда рассчитывается взаимная корреляционная функция, которая представляет собой множество коэффициентов корреляции между уровнями ряда yt и xt в заданные моменты времени t = 1, 2, . . . , n, сдвинутыми относительно друг друга на моментов. Величина и направление временного лага находятся по наибольшему коэффициенту корреляции. Сравнение значений коэффициентов корреляции показывает, с какого момента начинает сказываться влияние изменения уровней одного временного ряда на изменение уровней другого временного ряда и с какого момента это влияние ослабевает или прекращается. В регрессионной модели, построенной по многомерным временным рядам, необходимо исключить мультиколлинеарность. Ее наличие затрудняет проведение анализа изучаемого экономического показателя, т. к. 78 1. усложняется процесс выделения наиболее существенных факторов; 2. искажается смысл коэффициентов регрессии при их экономической интерпретации; 3. затрудняется определение коэффициентов регрессии методом наименьших квадратов, т. к. определитель матрицы системы нормальных уравнений имеет значение, близкое к нулю. При выявлении причин, вызывающих явление мультиколлинеарности, первостепенное значение имеет качественный (логический) анализ. Явление мультиколлинеарности может быть связано как с наличием истинных линейных соотношений между признаками, так и с наличием ошибок в самих признаках, а также с недостаточностью статистической информации. Устранение мультиколлинеарности в многофакторных моделях временных рядов в основном сводится к следующим процедурам: 1. преобразованию множества независимых переменных в несколько ортогональных множеств, используя при этом методы многомерного статистического анализа (факторный анализ и метод главных компонент); 2. исключению из рассмотрения одного или нескольких линейно связанных факторов-аргументов на основе предварительного экономического анализа и априорных сведений о степени влияния каждого исходного фактора на результативный; 3. построению уравнения регрессии по отклонениям от тренда или его конечным разностям; 4. привлечению дополнительной информации. Другой важной проблемой при анализе временных рядов с помощью регрессионного анализа является выбор формы связи (вида уравнения регрессии), от которой в значительной степени зависят практические результаты исследования. 79 Существуют различные способы построения множественной регрессионной модели по временным рядам. 1. Построение модели по уровням временных рядов. Модель будет иметь вид yb = a0 + a1 y1 + a2 y2 + . . . + ap yp . Этот метод имеет ограниченную сферу применения, т. к. при непосредственном коррелировании уровней экономических рядов, содержащих определенные тренды развития, можно столкнуться с проблемой ложной корреляции. Рассмотренный метод может быть использован только при четком подтверждении аналитическими методами отсутствия тенденции и автокорреляции, либо их незначительности. 2. Построение модели по отклонениям уровней временных рядов от выравненных по тренду уровней. Сущность этого способа состоит в том, что из каждого временного ряда исключается временной тренд, являющийся причиной автокорреляции. Модель в общем виде запишется так: yb − yt = a0 + a1 (x1 − x1t ) + . . . + ap (xp − xpt ), где yt , xit (i = 1, p) — основные тенденции моделируемого признака и факторных признаков. 3. Построение модели по разности между уровнями рядов. При использовании данного приема исходят из предположения, что все разности между уровнями временных рядов, начиная с первой, будут содержать только случайную компоненту, причем первые разности содержат случайную компоненту в линейной форме, вторые — описываемую параболой второго порядка, третьи показательной функцией. Модель будет иметь вид ∆yt+1 = a0 + a1 ∆x1, t+1 + a2 ∆x2, t+1 + . . . + ap ∆xp, t+1 . Однако если в результате применения этого метода остаточная компонента окажется сильно автокоррелированной, то он не может быть применен. 80 4. Построение модели по отклонениям уровней от среднего уровня. Справедливо в том случае, если уровни ряда колеблются около средней или имеют очень слабую тенденцию. В этом случае рассматриваемый метод равнозначен методу коррелирования отклонений от тренда. Если уровни ряда имеют ярко выраженную тенденцию, то метод неприемлем. 5. Введение времени в модель в качестве независимой переменной. Такая регрессионная модель, построенная методом коррелирования уровней с включением фактора времени, справедлива в том случае, если основные тенденции исследуемых рядов одинаковы. Если имеется запаздывание во влиянии факторных признаков на результативный, то это учитывается при моделировании независимо от того, каким методом строится модель. 81 Лекция 3.1.5. Циклические и сезонные колебания Внутригодовые уровни многих показателей существенно зависят от сезонности. Так, например, расход электроэнергии в летние месяцы значительно меньше, чем в зимние. Производство многих видов продуктов (сахара, растительного масла и др.), связанных с переработкой сельскохозяйственной продукции, увеличивается в месяцы, следующие непосредственно за окончанием уборки урожая; цены на сезонную продукцию (овощи, фрукты и др.) неодинаковы в различные месяцы и т. д. При графическом изображении таких рядов сезонные колебания наглядно проявляются в повышении или снижении уровней в определенные месяцы года. Причем попытки сгладить эти отклонения путем, например, укрупнения интервалов, приводят к затушевыванию тенденции. Обнаружить колеблемость в ряду, вызванную влиянием сезонности, возможно при наблюдении за месячными (квартальными) уровнями. Наблюдение за сезонными колебаниями представляет интерес с точки зрения стремления к их устранению, например, получить равномерную загрузку мощностей в сельском хозяйстве, строительстве, а также знание особенностей сезонных колебаний может быть использовано при решении многих практических задач, например, планирование выпуска продукции по месяцам, если спрос на нее подвержен влиянию сезонности, и соответственно, планирование потребности в рабочей силе, оборудовании и т.д. Поэтому изучение и измерение «сезонной» волны являются важными моментами при анализе рядов динамики. Выравнивание при помощи ряда Фурье. Когда в эмпирическом ряду наблюдается периодичность изменения уровней, то представить эту периодичность уровней динамического ряда можно в виде гармонических колебаний, т. е. провести аналитическое выравнивание при помощи ряда Фурье ybt = a0 + n X (ak cos kt + bk sin kt). k=1 Синусоиды, полученные при выравнивании рядом Фурье, называют гармониками различных порядков. Показатель k в приведенном уравнении определяет число гармоник. Обычно при выравнивании по ряду 82 Фурье рассчитывают несколько гармоник (чаще не более четырех) и затем уже определяют, с каким числом гармоник наилучшим образом отражается периодичность изменения уровней ряда. При выравнивании по ряду Фурье периодические колебания уровней динамического ряда как бы представляют в виде суммы нескольких синусоид (гармоник), наложенных друг на друга. Так, например, при k = 1 уравнение ряда Фурье будет выглядеть следующим образом: ybt = a0 + a1 cos t + b1 sin t; при k = 2, соответственно, ybt = a0 + a1 cos t + b1 sin t + a2 cos t + b2 sin t и т. д. Параметры уравнения теоретических уровней, определяемых рядом Фурье, находят, как и в других случаях, методом наименьших квадратов. В результате получены формулы для исчисления указанных выше параметров уравнения ряда Фурье: T 1X yt ; a0 = T t=1 T 2πk 2X t, yt cos ak = T t=1 T T 2X 2πk bk = t. yt sin T t=1 T Последовательные значения t обычно определяются от 0 с увеличением (приростом), равным 2π/n, где n — число уровней эмпирического ряда. Например, при n = 10 временные точки t можно записать следующим образом: 0, π 2π 3π 4π 6π 7π 8π 9π , , , , π, , , , . 5 5 5 5 5 5 5 5 Выравнивание по ряду Фурье часто дает положительный эффект в рядах, содержащих сезонную волну. Обычно строятся модели первой гармоники, второй гармоники и т. д., а затем на основании показателей качества полученных уравнений выбирается наиболее близкая модель к фактическим уровням ряда. Рассмотрим модели временных рядов, где предполагается, что наблюдаемые временные ряды являются суммой периодического тренда и 83 f (t) 1 ρ t θ 2π 1 λ Рис. 3.11 случайной компоненты, т. е. yt = f (t) + εt , причем детерминированная составляющая f (t) является периодической функцией и может описывать как циклические, так и сезонные колебания. p Здесь ρ = α2 + β 2 , θ = arctg(β/α). Заметим, что период колебания временного ряда n может не совпадать с периодом колебания тригонометрического составляющего λ. Периодичность тренда означает, что он в точности повторяет себя через определенный промежуток времени (т. е. f (t) = f (t + λ)), причем такое повторение абсолютно регулярно. Этот промежуток называют периодом колебаний временного ряда (λ). Величина, обратная периоду, называется частотой (1/λ). Она равна числу периодов (не обязательно целому), содержащемуся в единичном интервале. Иными словами, именно такое число раз функция повторяет свои значения. Тригонометрические функции cos t и sin t являются периодическими с периодом 2π, т. е. cos (t+2π) = cos t и sin (t+2π) = sin t. Отсюда следует, что cos (t + 2πk) = cos t и sin (t + 2πk) = sin t, где k = 1, 2, . . . Можно преобразовать аргументы, сохранив при этом свойство периодичности. Функции cos (λt − θ) и sin (λt − θ) периодичны с периодом 2π/λ , т. е. 2π cos λ t + − θ = cos [λt + 2π − θ] = cos [λt − θ], λ 84 2π − θ = sin [λt + 2π − θ] = sin [λt − θ]. sin λ t + λ Умножение на λ соответствует растяжению или сжатию масштаба времени, а вычитание θ — сдвигу графика косинуса или синуса. Угол θ называется фазой, причем обычно он выбирается так, чтобы периодическая функция косинуса достигала своего первого максимума в точке t = θ/λ. В таком случае 0 6 θ < 2π. При t = 0 указанные тригонометрические функции соответственно равны cos θ и (− sin θ). Наибольшее значение периодической функции называется амплитудой (обозначим его ρ). Сдвинутые косинусоида и синусоида являются линейными комбинациями обычной косинусоиды и обычной синусоиды. Из тригонометрической формулы cos (a − b) = cos a cos b + sin a sin b имеем ρ(cos λt − θ) = ρ [cos(λt) cos θ + sin(λt) sin θ] = α cos λt + β sin λt, p где α = ρ cos θ, β = ρ sin θ, или, что эквивалентно, ρ = α2 + β 2 . При этом tg θ = β/α, тогда θ = arctg(β/α). Детерминированная составляющая модели временного ряда f (t) может быть представлена суммой тригонометрических слагаемых общего вида: 2π 2π 2π t−θ . f (t) = α cos t + β sin t = ρ cos λ λ λ Здесь λ — период колебаний тригонометрического слагаемого, величина λ может не совпадать с периодом колебания временного ряда; α и β — неизвестные параметры; ρ — амплитуда. Пусть числовая последовательность y1 , . . . , yT имеет период n, где n — целое число, т. е. что yt+n = yt , t = 1, . . . , T − n. Представим T = nh, где T — число наблюдений, n — период колебаний временного ряда, h — число периодов в интервале наблюдений. Для полугодовых данных период равен 2, для ежеквартальных — 4, для 85 ежемесячных — 12. Наблюдаемые значения временного ряда можно точно аппроксимировать с помощью T линейно-независимых тригонометрических функций, причем максимальное число тригонометрических составляющих, входящих в разложение детерминированной составляющей модели временного ряда, определяется как: n−1 — для временных рядов с нечетным периодом n; qmax = 2 n qmax = − 1 — для временных рядов с четным периодом n. 2 На практике количество тригонометрических слагаемых может быть и меньше qmax . Порядок тригонометрического слагаемого ϕk (t) задается числом k = 1, 2, . . . , qmax , тогда тригонометрическое составляющее порядка k (или гармонику порядка k) можно записать как ϕk (t) = αk cos 2πk 2πk t + βk sin t. n n Период тригонометрического составляющего λk = n . k Детерминированную составляющую периодических колебаний временного ряда можно представить в виде следующей суммы тригонометрических функций: q P 2πk 2πk f (t) = α0 + αk cos t + βk sin t (n — нечетное); n n k=1 q P 2πk 2πk f (t) = α0 + αk cos t + βk sin t + αn/2 (−1)t (n — четное); n n k=1 Представление называют разложением в ряд Фурье. Слагаемое αn/2 (−1)t представляет собой периодическую функцию с периодом 2π. Оценки параметров для данной функции определяются с помощью метода наименьших квадратов и минимизируют сумму квадратов отклонений фактических значений временного ряда от выравненных: T X t=1 (yt − ybt )2 → min . 86 В результате решения системы уравнений независимые оценки параметров рассчитываются как: T 1X a0 = yt ; T t=1 T 2X 2πk t, ak = yt cos T t=1 T T 2X 2πk bk = t. yt sin T t=1 T Для временных рядов с четным n оценка an/2 T 1X = yt (−1)t . T t=1 Оценка дисперсии оценок параметров в модели сезонных колебаний вычисляется как S2 Sa20 = ост ; T 2 2S Sa2k = Sb2k = ост ; T 2 S ост Sa2n/2 = . T Оценки амплитуды колебаний и фазы выглядят следующим образом: p a2k + b2k , bk θk = arctg . ak Представляет интерес проверка гипотезы об отсутствии цикличеRk = ского слагаемого с заданным наименьшим периодом, которая формулируется следующим образом H0 : αk = βk = 0. Если верна нулевая гипотеза, то величины αk и βk независимы и нормально распределены с нулевыми средними и дисперсиями 2σ 2 /T . Тогда статистика T Rk2 2 4Sост имеет нормальное распределение с числом степеней свободы в числителе ν1 = 2 и в знаменателе ν2 = T − p, где p — число оцениваемых коэффициентов. F = 87 Нулевая гипотеза отвергается с уровнем значимости α, если критическое значение критерия Фишера (Fα , ν1 , ν2 ) превысит расчетное значение статистики F . Тогда делается вывод о том, что амплитуда колебаний тригонометрического слагаемого значимо отличается от нуля. Проверка значимости параметров α0 и αn/2 осуществляется с использованием статистики Стьюдента для уровня значимости и числа степеней свободы ν = T − p. Расчетное значение t-статистики строится сле- дующим образом: T · a0 ta0 = 2 2Sост либо tan/2 T · an/2 = 2 2Sост . Если tрасч больше tкрит , то принимается гипотеза о значимости параметров. 88 Тема 3.2. Системы линейных одновременных уравнений Лекция 3.2.1. Основные понятия. Виды систем одновременных уравнений. При изучении функционирования экономических систем исследователь обычно сталкивается со следующей ситуацией: состояние системы в каждый момент времени t описывается набором переменных, среди которых есть как эндогенные (внутрисистемные), так и экзогенные (внешние по отношению к рассматриваемой системе). Между переменными существуют функциональные и статистические связи. К первому типу относятся тождества, вытекающие из определений и содержательного смысла переменных. Ко второму типу относятся поведенческие связи, являющиеся выражением экономических законов, действующих в системе. Поскольку поведение экономических систем носит статистический характер (присутствуют случайные возмущения, погрешности, неучтенные факторы), то для описания поведенческих связей используются регрессионные уравнения. В теории экономико-статистического моделирования систему взаимосвязанных регрессионных уравнений и тождеств, в которой одни и те же переменные в различных регрессионных уравнениях могут одновременно выступать и в роли результирующих показателей, и в роли объясняющих переменных, принято называть системой одновременных (эконометрических) уравнений. При этом в соотношения могут входить переменные, относящиеся не только к периоду t, но и к предшествующим периодам, называемые лаговыми («запаздывающими») переменными. Для экономистов большой интерес представляет количественный анализ модели, т. е. нахождение оценок параметров на основании имеющейся в распоряжении исследователя информации о значениях переменных. Первая из возникающих здесь проблем: можно ли в предложенной модели однозначно восстановить значение некоторого параметра или же его определение принципиально невозможно на основе рассматриваемой модели? Это так называемая проблема идентифицируемости. 89 Проблема оценивания здесь также имеет свои особенности. Основная трудность состоит здесь в том, что в эконометрических моделях переменная, играющая роль независимой (объясняющей) переменной в одном соотношении, может быть зависимой в другом. Это приводит к тому, что в регрессионных уравнениях системы объясняющие переменные и случайные возмущения оказываются коррелированными. Рассмотрим в качестве иллюстрации два классических примера. Пример 1. Модель спроса и предложения («крест Маршалла»). Спрос Qd на некоторый продукт и его предложение Qs зависят от цены продукта p. Рыночный механизм формирует цену таким образом, что спрос и предложение уравниваются. Наблюдению доступна равновесная цена и спрос (совпадающий с предложением). Линейная модель выглядит следующим образом: Qdt = α1 pt + β1 + ut («спрос пропорционален цене»); Qst = α2 pt + β2 + εt («предложение пропорционально цене»). Здесь pt — цена товара, ut и εt — случайные возмущения, имеющие нулевые средние (t = 1, n). Предполагается, что на рынке существует равновесие: Qdt = Qst . В соответствии с этой моделью цена и величина спросапредложения определяется одновременно, поэтому без дополнительных предположений (например, на структуру случайных возмущений) параметры αi и βi однозначно определить нельзя, т. е. они неидентифицируемы. Пример 2. Содержательный смысл модели спроса состоит в утверждении, что потребительские расходы, т. е. спрос, пропорциональны доходу. В свою очередь доход есть сумма потребительских и непотребительских расходов. Математическая формулировка модели такова: ct = α + βyt + ut ; yt = ct + zt , 90 где c — потребительские расходы; y — доход; z — непотребительские расходы; u — случайное возмущение (учитывающее неполноту информации, незамкнутость системы и др.). Предполагается, что уровень непотребительских доходов задан извне, т. е. переменная z экзогенна и определяется независимо от c и y. Случайные величины ut некоррелированы, имеют нулевые средние и одинаковые дисперсии σ 2 . Требуется оценить параметры модели α, β, σ 2 . В выражении для ct переменная y коррелирует со случайным возмущением. Это приводит к тому, что обычные МНК-оценки параметров оказываются смещенными и несостоятельными. Рассмотрим общую линейную модель вида βi1 y1t + βi2 y2t + . . . + βiG yGt + γi1 x1t + . . . + γik xKt = uit , (t = 1, n; i = 1, G). Здесь yit — значения эндогенных переменных в момент t; xit — значения экзогенных переменных в момент t и лаговых эндогенных переменных. Переменные xit в момент времени t называются предопределенными. Совокупность равенств данного вида называется системой одновременных уравнений в структурной форме. На коэффициенты в указанных равенствах накладываются априорные ограничения, например, часть коэффициентов считаются равными нулю. Это обеспечивает возможность статистического оценивания оставшихся. Систему указанных равенств удобно представить в матричном виде: Byt + Gxt = ut , где B — матрица, состоящая из коэффициентов при текущих значениях эндогенных переменных; G — матрица, состоящая из коэффициентов при предопределенных переменных; yt = (y1t , . . . , yGt ); xt = (x1t , . . . , xKt ); ut = (u1t , . . . , uGt ) — векторы-столбцы. 91 Если матрица B невырождена, то систему можно разрешить относительно yt : yt = Pxt + ηt , где P = −B −1 G; ηt = B −1 ut — случайное возмущение. Такая форма записи называется приведенной формой системы одновременных уравнений. В приведенной форме параметры матрицы P выражают общий (прямой и косвенный) эффект влияния предопределенных переменных на совместно зависимые переменные, тогда как в структурной форме параметры матрицы G отражают только непосредственное влияние предопределенных переменных. Совместно-зависимыми называются переменные, которые в один и тот же момент времени выступают как объясняющие переменные в одних уравнениях и как зависимые — в других. Приведенную форму модели используют для прогнозирования. Параметры модели в приведенной форме оценивают непосредственно с помощью МНК. Уравнения для всех периодов наблюдений могут быть записаны в виде одного матричного уравнения: BY + GX = U. Решение вопросов о том, какие переменные должны быть включены в модель, разделение переменных на эндогенные и экзогенные, а также определение состава переменных каждого уравнения системы составляют суть процесса спецификации модели. Кроме этого, спецификация модели включает в себя априорную информацию: ограничения на коэффициенты и гипотезу о случайных возмущениях ut . Типичным примером априорных ограничений являются исключающие ограничения, выражающие то, что некоторые переменные заведомо не входят в отдельные уравнения и, следовательно, соответствующие им коэффициенты равны нулю. В качестве гипотезы о случайных возмущениях принимается гипотеза о том, что случайные величины ut независимы и имеют один и тот же закон распределения с нулевым средним. 92 Проблема идентифицируемости Предположим, что априорные ограничения являются линейными однородными функциями, каждая из которых зависит только от коэффициентов одного из уравнений структурной формы. Выясним, когда коэффициенты матрицы G могут быть однозначно восстановлены по матрице приведенной формы P . В качестве одного из критериев идентифицируемости, удовлетворение требований которого обеспечивает однозначную идентифицируемость параметров системы уравнений, выступает правило порядка. Правило порядка (или необходимое условие идентифицируемости) определенного уравнения говорит о том, что число неизвестных, исключенных из уравнения, должно быть по меньшей мере равно числу уравнений минус единица, или число исключенных из уравнения экзогенных переменных должно быть не меньше числа участвующих в нем эндогенных переменных, уменьшенного на единицу. В ситуации, когда имеются дополнительные ограничения на коэффициенты приведенной формы (например, требование определенного соотношения между коэффициентами, либо равенство нулю дополнительных коэффициентов сверх правила порядка), говорят о случае сверхидентифицируемости. Среди систем приведенных уравнений наиболее простыми являются рекурсивные системы, для оценивания коэффициентов которых можно применять метод наименьших квадратов. Система одновременных уравнений BY + GX = U называется рекурсивной, если матрица B является нижней треугольной матрицей (т. е. βij = 0 при j > i) и каждое ограничение на структурные коэффициенты относится к отдельному уравнению. Общий вид рекурсивной системы может быть представлен следующим образом: y1 = β11 x1 + . . . + β1n xn + ε1 , y2 = −α21 y1 + β21 x1 + ... + β2n xn + ε2 , ... ym = −αm1 y1 + αm, m−1 ym−1 + βm1 x1 + . . . + βmn xn + εm . Рекурсивные системы являются весьма привлекательными для ис93 пользования их в экономических исследованиях, тем более что реальные экономические системы являются рекурсивными по своей природе. Действительно, вряд ли можно представить рынок, где равновесные цены и спрос формировались бы одновременно (ситуация, приведенная в Примере 1). Более реальной является ситуация, когда цены в день t устанавливаются в зависимости от объема продаж в предыдущий день, в то время как покупки в день t зависят от цены товара в день t. Математическая модель данной ситуации выглядит так: pt = α0 + α1 qt−1 + ut , qt = β0 + β1 pt + vt . Здесь ut и vt — случайные возмущения, которые можно считать независимыми, и тогда в данном случае мы имеем модель рекурсивной системы. Необходимость рассматривать системы, отличные от рекурсивных, возникает в связи с тем, что исследователь обычно располагает усредненными (агрегированными) данными. Например, данные о рыночной конъюнктуре могут быть усреднены по недельным или месячным периодам, т. е. известными являются величины: Pt — средняя цена за неделю t; Qt — средний объем ежедневных продаж за неделю t. Если считать время реакции рынка, как и раньше, равным одному дню, то соотношение Pt = α0 + α1 Qt−1 + ut вряд ли можно считать разумным. В этом случае модель Примера 1 представляется более естественной. 94 Лекция 3.2.2. Оценка параметров систем уравнений Пусть теперь имеется несколько изучаемых переменных, для каждой из которых существует свое уравнение регрессии. В совокупности эти уравнения образуют систему, которая является невзаимозависимой, если одни изучаемые переменные не выступают факторами-регрессорами для других изучаемых переменных. Если изучаемые переменные возникают не только в левых, но и правых частях уравнений, то такие системы называются одновременными или взаимозависимыми. Невзаимозависимые системы В этом пункте используется сокращенная форма записи уравнений регрессии: b = ẐA + ε, X (1) где X̂ — N × k-матрица центрированных наблюдений за изучаемыми переменными, Ẑ — N × n-матрица центрированных наблюдений за факторными переменными, A — n × k-матрица параметров уравнений регрессии, ε — N × n-матрица ошибок изучаемых переменных (остатков по на- блюдениям). Относительно ошибок предполагается, что в каждом наблюдении их математическое ожидание равно нулю, матрица ковариации размерности k × k одинакова и равна Ω (Ω — вещественная, симметричная, положительно определенная матрица), и что они не коррелированы по наблюдениям. Оценивать параметры этой системы можно отдельно по каждому уравнению: A = M −1 m̃, (2) 1 ′ 1 ′ Ẑ Ẑ, m̃ = Ẑ X̂, или через обычные операторы МНКгде M = N N оценивания, записанные последовательно для всех уравнений системы al = M −1 ml , l = 1, . . . , k. Ситуация резко усложняется, если для коэффициентов матрицы A имеются априорные ограничения. Пусть, например, эта матрица  a1 0   0 a2   ... ...  имеет следующую структуру:  ··· 0  ··· 0   . . . ...  ,  0 · · · ak где al — nl -вектор-столбец коэффициентов в l-м уравнении (для l-й изуk P чаемой переменной), nl = n, т.е. многие элементы матрицы A априорl=1 но приравнены нулю. Фактически это означает, что для каждой изучаемой переменной имеется свой набор объясняющих факторов с N × nl -матрицей наблю дений Ẑl Ẑ = Ẑ1 · · ·Ẑk , и система уравнений (1) представляется как совокупность внешне не связанных между собой уравнений: X̂l = Ẑl al + εl , l = 1, . . . , k. (3) Сразу можно заметить, что теперь оператор (2) применить невозможно, т.к. система нормальных уравнений, решением которой является этот оператор, записывается следующим образом:     m11 · · · m1k M11 a1 · · · M1k ak  .. ..  =  .. . . . ..  , ... .  .   .  . mk1 · · · mkk Mk1 a1 · · · Mkk ak (4) 1 ′ ′ N Ẑl Ẑl , mll′ = N1 Ẑl′ X̂l′ , т.е. вектор оценок параметров каждого уравнения должен удовлетворять k взаимоисключающим, в общем случае, системам уравнений. Правильная оценка параметров регрессии дается решением следу- где Mll′ = ющих уравнений: k X l′ =1 ωll−1′ Mll′ al′ = k X ωll−1′ mll′ , l = 1, . . . , k, l′ =1 где ωll−1′ — элемент матрицы Ω−1 . 96 Или в матричной записи:  −1    −1 −1 −1 ω11 M11 a1 + · · · +ω1k M1k ak ω11 m11 + · · · +ω1k m1k     .. .. .. .. ... ... . . . .  , = −1 −1 −1 −1 mkk mk1 + · · · +ωkk Mkk ak ωk1 Mk1 a1 + · · · +ωkk ωk1 (5) которая при сравнении с (4) оказывается результатом умножения в (4) всех Mll′ и mll′ на ωll−1′ и сложения столбцов в обеих частях этого выражения. Эта оценка совпадает с обычной МНК-оценкой al = Mll−1 mll , если матрица Ω диагональна, т.е. ошибки изучаемых переменных не коррелированы. Взаимозависимые или одновременные уравнения. Проблема идентификации Далее в этом разделе уравнения регрессии записываются в форме со скрытым свободным членом. X — N × k-матрица наблюдений за изучаемыми переменными x; Z — N ×(n+1)-матрица наблюдений за независимыми факторами z; B — k × k-матрица параметров регрессии при изучаемых перемен- ных; B 6= Ik , иначе система была бы невзаимозависимой; |B| 6= 0 и βll = 1 — условия нормализации, т.е. предполагается, что, в конечном счете, в левой части l-го уравнения остается только l-я переменная, а остальные изучаемые переменные переносятся в правую часть; A — (n + 1) × k-матрица параметров регрессии (последняя строка — свободные члены в уравнениях); ε — N × k-матрица значений случайных ошибок по наблюдениям; XB = ZA + ε. (6) Такая запись одновременных уравнений называется структурной формой. Умножением справа обеих частей этой системы уравнений на B −1 она приводится к форме, описанной в предыдущем пункте. Это — приведенная форма системы: X = ZAB −1 + εB −1 . 97 D = AB −1 — (n + 1) × k-матрица параметров регрессии приведенной формы. Для их оценки можно использовать МНК: D = (Z ′ Z)−1 Z ′ X. Таким образом, матрица D оценивается без проблем, и ее можно считать известной. Однако задача заключается в оценке параметров B и A системы в приведенной форме. Эти параметры, по определению, удовлетворяют следующим условиям: DB − A = 0 (7) или W H = 0, где i h W — (n + 1) × (n + k + 1)-матрица D In+1 , " # B . H — (n + k + 1) × k-матрица −A Это — условия для оценки параметров структурной формы. В общем случае эти условия достаточно бессмысленны, т.к. они одинаковы для параметров всех уравнений. Они описывают лишь множество допустимых значений параметров (одинаковое для всех уравнений), поскольку для n + k + 1 параметров каждого уравнения структурной формы имеется только n + 1 одинаковых уравнений. Необходимы дополнительные условия, специальные для каждого уравнения. Пусть для параметров l-го уравнения кроме требования W Hl = 0 ((Z ′ Z)−1 Z ′ XBl − Al = 0) (8) имеется дополнительно rl условий: Rl Hl = 0, (9) где Rl — rl × (n + k + 1)-матрица дополнительных условий, " # Bl Hl — (n + k + 1)-вектор-столбец параметров l-го уравне−Al ния — l-й ! столбец матрицы H. W Hl = Wl Hl = 0 — общие условия для определения структурRl ных параметров l-го уравнения, где Wl — (n + rl + 1) × (n + k + 1)-матрица. 98 Они позволяют определить искомые параметры с точностью до постоянного множителя (при выполнении условий нормализации βl = 1 параметры определяются однозначно), если и только если ранг матрицы Wl равен n + k. Для этого необходимо, чтобы rl > k − 1. (10) Однако, это условие не является достаточным. Имеется необходимое и достаточное условие для определения параметров l-го уравнения (более операциональное, чем требование равенства n + k ранга матрицы Wl ): rank(Rl H) = k − 1. (11) Доказательство данного утверждения опускается по причине сложности. Теперь вводятся определения, связанные с возможностью нахождения параметров уравнения структурной формы: l-е уравнение не идентифицировано, если rl < k − 1; оно точно идентифицировано, если rl = k−1 и ранг Wl равен n+k; сверхидентифицировано, если rl > k−1. В первом случае параметры не могут быть оценены, и, хотя формально, например, используя МНК, оценки можно получить, они никакого смысла не имеют; во втором случае параметры уравнения оцениваются однозначно; в третьем — имеется несколько вариантов оценок. Обычно строки матрицы Rl являются ортами, т.е. дополнительные ограничения исключают некоторые переменные из структурной формы. Тогда, если kl и nl — количества, соответственно, изучаемых переменных, включая l-ю, и независимых факторов в l-м уравнении, то для его идентификации необходимо, чтобы kl + nl 6 n + 1. (12) В таком случае условие (11) означает, что матрица, составленная из коэффициентов во всех прочих уравнениях, кроме l-го, при переменных, которые исключены из l-го уравнения, должна быть не вырождена. При этом l-й столбец матрицы Rl H из (11), равный нулю, как это следует из (9), исключается из рассмотрения. Дальнейшее изложение ведется в предположении, что строки матрицы Rl — орты. 99 Оценка параметров отдельного уравнения Вводятся дополнительные обозначения: X l — N × kl -матрица наблюдений за изучаемыми переменными xl , входящими в l-е уравнение; Xl — N -вектор-столбец наблюдений за l-й переменной xl ; X−l — N × (kl − 1)-матрица X l без столбца Xl наблюдений за xl− ; β l — kl -вектор-столбец параметров при изучаемых переменных в l-м уравнении; βl — (kl − 1)-вектор-столбец β l с обратным знаком и без l-го элемента βll = 1; Z l — N × (nl + 1)-матрица наблюдений за независимыми факторами z l , входящими в l-е уравнение, включая единичный столбец, соответствующий свободному члену; αl — (nl + 1)-вектор-столбец параметров при этих факторах вместе со свободным членом; εl — N -вектор-столбец остатков в l-м уравнении по наблюдениям. Тогда l-е уравнение регрессии можно записать следующим образом: X l β l = Z l αl + εl (13) Xl = X−l βl + Z l αl + εl . (14) или Применение обычного МНК к этому уравнению дает в общем случае смещенные и несостоятельные оценки, прежде всего потому, что остатки εl скорее всего коррелированы с регрессорами X−l , которые к тому же недетерминированы и наблюдаются с ошибками. Если данное уравнение точно идентифицировано, то для оценки его параметров можно использовать косвенный метод (КМ) наименьших квадратов: с помощью МНК оцениваются параметры приведенной формы системы уравнений, через которые однозначно выражаются структурные параметры данного уравнения. Можно записать уравнения для оценки косвенным методом в общем случае. 100 Сначала следует обратить внимание на то, что условия (9) эквивалентны требованиям TlB β l = Bl , TlA αl = Al , (15) где TlB — k × kl -матрица, полученная из Ik вычеркиванием столбцов, соответствующих тем изучаемым переменным, которые исключены из l-го уравнения; TlA – аналогичная (n + 1) × (nl + 1)-матрица для Al . Bl и Al имеют нулевые компоненты, соответствующие исключенным из l-го уравнения переменным. Далее необходимо учесть, что параметры структурной формы, удовлетворяющие условиям (15), должны для своей идентификации еще удовлетворять соотношениям (8). Тем самым получается система уравнений для нахождения параметров структурной формы: DTlB bl − TlA al = 0, или по определению матрицы TlB : Dl bl − TlA al = 0, где Dl – оценки параметров приведенной формы уравнений для изучаемых переменных, вошедших в l-е уравнение, или, наконец, l Dl = D− bl + TlA al , (16) где Dl — оценки параметров l-го уравнения в приведенной форме, l — оценки параметров приведенной формы уравнений для изуD− чаемых переменных, вошедших в правую часть l-го уравнения. Эти матрицы коэффициентов приведенной формы представляются следующим образом: l Dl = (Z ′ Z)−1 Z ′ X l , Dl = (Z ′ Z)−1 Z ′ Xl , D− = (Z ′ Z)−1 Z ′ X−l . Система уравнений (16) может быть также получена умножением обеих частей системы (14) слева на (Z ′ Z)−1 Z ′ , т.к. третье слагаемое правой части отбрасывается (МНК-остатки должны быть ортогональны 101 регрессорам), а во 2-м слагаемом (Z ′ Z)−1 Z ′ Z l заменяется на TlA (т.к. по определению этой матрицы Z l = ZTlA ). l В общем случае, матрица этой системы D− TlA имеет размерность (n + 1)×(kl +nl ). Первый ее блок имеет размерность (n+1)×(kl −1), второй — (n + 1) × (nl + 1). В случае точной идентификации и строгого выполнения условий (12) эта матрица квадратна и не вырождена. Система (16) дает единственное решение — оценку параметров структурной формы l-го уравнения косвенным методом наименьших квадратов. Если уравнение не идентифицировано, переменных в системе (14) оказывается больше, чем уравнений, и эта система представляет бесконечное множество значений параметров структурной формы. Чтобы выбрать из этого множество какое-то решение, часть параметров структурной формы надо зафиксировать, т.е. сделать уравнение идентифицированным. Для сверхидентифицированного уравнения система (14) является переопределенной, и ее уравнения не могут выполняться как равенства. Различные методы оценки такого уравнения реализуют различные подходы к минимизации невязок по уравнениям этой системы. Одним из таких методов является двухшаговый метод (2М) наименьших квадратов. На первом шаге с помощью МНК оцениваются параметры приведенной формы для переменных X−l : l X−l = ZD− + V l, где V l — N × (kl − 1)-матрица остатков по уравнениям; и определяются расчетные значения этих переменных уже без ошибок: l . X−lc = ZD− На втором шаге с помощью МНК оцениваются искомые параметры структурной формы из уравнения: Xl = X−lc bl + Z l al + el . (17) Применим обычный МНК. 102 Можно определить единый оператор 2M-оценивания. Поскольку X−lc = F X−l , где F = Z(Z ′ Z)−1 Z ′ , уравнение (15) записывается как: ! bl Xl = F X−l Z l + el , al а оператор, входящий в него, как: ! !−1 ! l′ l l′ l l′ X− F X− X− Z bl X− F Xl = . ′ ′ ′ al Z l X−l Zl Zl Z l Xl (18) (19) Такой оператор оценивания сверхидентифицированного уравнения можно получить, если МНК применить к системе (14) (в этом случае она переопределена и в ее уравнениях возникают невязки), умножив предварительно обе ее части слева на Z. Отсюда, в частности, следует, что для точно идентифированного уравнения 2М-оценка совпадает с КМ-оценкой, т.к. параметры структурной формы уравнения, однозначно определяемые соотношениями (14), удовлетворяют в этом случае и условиям (16). Соотношения (19) — первая форма записи оператора 2Мc оценивания. Если в (15) учесть, что X−l = X−l − V l , этот оператор можно записать в более прозрачной второй форме: !−1 ! ! l′ l l′ l l′ l l′ l′ bl X− X− − V V X− Z (X− − V )Xl = . (20) ′ ′ ′ al Z l X−l Zl Zl Z l Xl Попытка применить оператор 2М-оценивания для не идентифицированного уравнения не имеет смысла, т.к. обращаемая матрица в данном операторе вырождена. Для сверхидентифицированного уравнения можно использовать также метод наименьшего дисперсионного отношения (МНДО). Строгое обоснование его применимости вытекает из метода максимального правдоподобия. Пусть bl в уравнении (13) оценено, и X l bl рассматривается как единая эндогенная переменная. В результате применения МНК опреде103 ляются: ′ ′ al = (Z l Z l )−1 Z l X l bl , ′ ′ где F l = Z l (Z l Z l )−1 Z l , el = (IN − F l )X l bl , (21) ′ ′ где W l = X l (IN − F l )X l . e′l el = bl W l bl , Теперь находится остаточная сумма квадратов при условии, что ′ все экзогенные переменные входят в l-е уравнение. Она равна bl W bl , ′ где W = X l (IN − F )X l . Тогда bl должны были бы быть оценены так, чтобы ′ bl W l bl λ = l′ → min b W bl Иначе было бы трудно понять, почему в этом уравнении присутствуют не все экзогенные переменные. Решение этой задачи приводит к следующим условиям: (W l − λW )bl = 0. (22) Следовательно, λ находится как минимальный корень характеристического уравнения W l − λW = 0, а bl определяется из (22) с точностью до постоянного множителя, т.е. с точностью до нормировки bll = 1. В общем случае λmin > 1, но при правильной спецификации модели λmin −→ 1. N →∞ Оператор ! bl = al ′ X−l X−l l′ − kV V ′ Z l X−l l ′ X−l Z l l′ l Z Z !−1 ′ (X−l l′ − kV )Xl ′ Z l Xl ! позволяет получить так называемые оценки k-класса (не путать с k — количеством эндогенных переменных в системе). При k = 0, они являются обычными МНК-оценками для l-го уравнения, что легко проверяется; при k = 1, это — 2М-оценки; при k = λmin — МНДО-оценки (принимается без доказательства). 2М-оценки занимают промежуточное положение между МНК- и МНДО-оценками (т.к. λmin > 1). Исследования показывают, что эффективные оценки получаются при k < 1. 104 Оценка параметров системы идентифицированных уравнений Из приведенной формы системы уравнений следует, что x′ ε = (B −1 )′ A′ z ′ ε + (B −1 )′ ε′ ε. Как и прежде, в любом наблюдении E(ε) = 0, E(ε′ ε) = σ 2 Ω, и ошибки не коррелированы по наблюдениям. Тогда E(x′ ε) = (B −1 )′ E(ε′ ε) = σ 2 (B −1 )′ Ω, т.е. в общем случае все эндогенные переменные коррелированы с ошибками во всех уравнениях. Это является основным препятствием для применения обычного МНК ко всем уравнениям по отдельности. Но в случае, если в матрице B все элементы, расположенные ниже главной диагонали, равны нулю, т.е. в правой части l-го уравнения могут появляться только более младшие эндогенные переменные xl′ , l′ < l, и последней компонентой любого вектора xl является xl , а матрица Ω диагональна, то εl не коррелирует с переменными xl− при любом l. Это — рекурсивная система, и для оценки ее параметров можно применять МНК к отдельным уравнениям. Для оценки параметров всех идентифицированных уравнений системы можно применить трехшаговый метод (3М) наименьших квадратов. Первые два шага 3М совпадают с 2М, но представляются они по сравнению с предыдущим пунктом в несколько иной форме. Предполагается, что идентифицированы все k уравнений: Xl = X−l βl + Z l αl + εl = Ql γl + εl , l = 1, . . . , k, где Ql = [X−l , Z l ], γl = [ βl αl ]′ . Учитывая указанные выше свойства остатков: E(εl ε′l ) = σ 2 ωll IN , E(εl′ ε′l ) = σ 2 ωl′ l IN . Теперь обе части l-го уравнения умножаются слева на Z ′ : Z ′ Xl = Z ′ Ql γl + Z ′ εl , (23) 105 и Z ′ Xl рассматривается как вектор n + 1 наблюдений за одной эндогенной переменной, а Z ′ Ql — как матрица n + 1 наблюдений за nl + kl экзогенными переменными, включая свободный член. Так как все уравнения идентифицированы, и выполнено условие (12), во всех этих новых регрессиях количество наблюдений не меньше количества оцениваемых параметров. Для сверхидентифицированных уравнений количество наблюдений в новой регрессии будет превышать количество оцениваемых параметров. Это более естественный случай. Поэтому 3М-метод обычно применяют для всех сверхидентифицированных уравнений системы. Матрица ковариации остатков по уравнению (23) равна σ 2 ωll Z ′ Z. Она отлична от σ 2 IN , и для получения оценок cl параметров γl этого уравнения нужно использовать ОМНК: ′ ′ cl = (Ql Z(Z ′ Z)−1 Z ′ Ql )−1 Ql Z(Z ′ Z)−1 Z ′ Xl , или ′ ′ cl = (Ql F Ql )−1 Ql F Xl . Сравнив полученное выражение с (19), легко убедится в том, что cl — 2М-оценка. Если 2М на этом заканчивается, то в 3М полученные оценки cl используются для того, чтобы оценить el , и затем получить оценки W матрицы σ 2 Ω: 1 1 wll = e′l el , wl′ l = e′l′ el . N N Теперь все уравнения (23) записываются в единой системе:        Z ′ ε1 γ1 Z ′ Q1 ··· Z ′ X1    ′   ′   ′ 2  γ2  Z ε2  Z X2   0 Z Q · · · ,   +  =  (24) . . . .. .       ...   ... . . . . . . . . .        Z ′ Xk · · · Z ′ Qk γk Z ′ εk или Y = Qγ + η, где Y — соответствующий k · (n + 1)-вектор-столбец наблюдений за изучаемой переменной; k P Q — k(n + 1) × (kl + nl )-матрица наблюдений за экзогенными пеl=1 ременными; 106 γ— k P (kl + nl )-вектор-столбец параметров регрессии; l=1 η — k(n + 1)-вектор-столбец остатков по наблюдениям. Легко проверить, что матрица ковариации остатков η удовлетворяет следующему соотношению: E(ηη ′ ) = σ 2 Ω ⊗ (Z ′ Z). Для нее имеется оценка: k(n + 1) × (n + 1)-матрица Σ = W ⊗ (Z ′ Z). Эта матрица отлична от σ 2 Ik(n+1) , поэтому на третьем шаге 3М-оценивания к единой системе (24) применяется ОМНК и получается окончательная оценка c параметров γ: c = (Q′ Σ−1 Q)−1 Q′ Σ−1 Y. 107 Тема 3.3. Основные понятия и модели дисперсионного анализа Лекция 3.3.1. Основные понятия дисперсионного анализа. Однофакторная дисперсионная модель Дисперсионным анализом называется метод организации (планирования), статистического анализа и интерпретации результатов экспериментов, в которых изучается зависимость количественной переменной y от сочетания градаций качественных переменных X. Предположим, что нас интересует зависимость объема выпуска продукции в цехе от типа производственного процесса, уровня образования рабочих, стиля руководства администрации и др. Использование дисперсионного анализа (далее — ДА) позволяет установить наличие либо отсутствие влияния каждого качественного фактора, а также оценить величину «вклада» каждого качественного фактора в изменение результирующего количественного признака. В приведенном примере рассматривается модель с постоянными факторами. Если же нас интересует не объем выпуска продукции отдельным цехом, а «вклад» в общую изменчивость выпуска, которую вносит разная работа цехов, то постоянный фактор, связанный с характеристикой работы отдельного цеха, заменяют на случайную величину (случайный фактор). Модели ДА, содержащие только случайные факторы, называют моделями со случайными факторами. Модели, куда входят одновременно постоянные и случайные факторы, называют смешанными моделями дисперсионного анализа. Возникают ситуации, когда необходимо в модель дисперсионного анализа ввести дополнительные количественные переменные (называемые регрессионными). Тогда методы изучения моделей, в которых часть переменных является неколичественными, а часть количественными (регрессионными) называются ковариационным анализом. Для дисперсионного анализа существенна классификация, основанная на способе организации исходных данных, т. е. на том, как градации одних факторов (переменных) в исходных данных сочетаются с 108 теми или иными градациями других переменных и как распределено общее число имеющихся наблюдений между различными возможными сочетаниями градаций переменных. Поэтому ДА наиболее эффективен тогда, когда исследователь активно вмешивается в организацию сбора данных (или участвует в планировании экспериментов). Предположим, что в исследование включено K факторов (i = 1, K), причем i-ый фактор имеет P градаций (j = 1, P ). Если каждому из возможных условий соответствует хотя бы одно наблюдение, то такую организацию экспериментов называют полным K-факторным планом. Практически это трудно организовать, поэтому больше распространены неполные планы. В случае, когда требуется сравнить в эксперименте совокупности условий, группируют эксперименты в блоки (например, цеха по типу производственного процесса) так, чтобы внутри блока результаты эксперимента (выпуск продукции) были бы более похожи друг на друга, чем на результаты экспериментов в других блоках. Если внутри каждого блока удается разместить весь набор условий, то такой план эксперимента называют полным блочным планом, если только часть из них — то неполным блочным планом. Для того, чтобы нивелировать влияние не учитываемых при анализе факторов, размещение условий внутри блоков часто производят случайно и тогда такие планы экспериментов называют случайными или рандомизированными планами. Рассмотрим модель однофакторного дисперсионного анализа, когда оценивается влияние одного качественного признака на количественную переменную. Математическая модель однофакторного ДА имеет вид: yij = y + αj + εij , 109 где yij — значение результирующего показателя для i-го (i = 1, nj ) наблюдения при уровне градации j (j = 1, P ) качественного признака; nj — количество наблюдений, ! когда фактор находится на n P уровне j nj = N, j = 1, P ; j=1 y — среднее значение результирующего показателя по всем наблюдениям всех градаций качественного признака; αj — эффект влияния фактора на j-ом уровне; εij — случайная компонента, отражающая влияние всех прочих факторов (предполагается, что случайные погрешности независимы между собой и имеют нормальное распределение с нулевым средним и дисперсией σ 2 ). С содержательной точки зрения однофакторный ДА можно рассматривать как P рядов (каждый длины nj ) независимых наблюдений над нормально распределенными случайными величинами. Рассмотрим табличную форму представления исходных данных для проведения однофакторного ДА (см. таблицу 6). В ДА обычно проверяется гипотеза об отсутствии влияния рассматриваемых неколичественных переменных на результирующий показатель. Для проверки этой гипотезы общая вариация зависимой переменной раскладывается на две составляющие: 1. обусловленную влиянием неколичественного фактора (межгрупповую или объясненную сумму квадратов). Эта составляющая вычисляется как сумма квадратов отклонений групповых средних yj от общего среднего y; 2. обусловленную случайной вариацией зависимого признака (внутригрупповую или остаточную сумму квадратов). Эта составляющая вычисляется как сумма квадратов отклонений наблюдаемых значений от соответствующих групповых средних. 110 111 ... y1j , y2j , . . . , ynj j ... y1P , y2P , . . . , ynP P ... j ... P N= j=1 P P nP ... nj ... n1 nj nj yij y11 , y21 , . . . , yn1 1 Количество наблюдений в группе Значения результирующего показателя 1 Градации качественного фактора yi1 yij yij j=1 i=1 yij yiP nj P P P i=1 nP P ... i=1 nj P ... i=1 n1 P i=1 nj P ... ... yj = yi1 yij N j=1 i=1 yij yij nP i=1 nP P nj i=1 nj P n1 i=1 n1 P yij nj nP P P P yP = yj = y1 = yj = P Среднее значение Сумма наблюдений в наблюдений в группе группе Таблица 6 Таким образом, Dобщ = Dвнутригр + Dмежгр или в обозначениях данных для дисперсионного анализа: nj P X X j=1 i=1 2 (yij − y) = nj P X X j=1 i=1 (yij − yj + yj − y)2 = = nj P X X j=1 i=1 (yij − yj )2 + nj P X X j=1 i=1 (yj − y)2 . Поделив суммы квадратов на соответствующие числа степеней свободы, получим оценки дисперсий: Dобщ = S 2 общ; N −1 Dвнутригр 2 ; = Sвнутригр N −P Dмежгр 2 ; = Sмежгр P −1 При этом внутригрупповая дисперсия характеризует рассеяние внутри групп и отражает влияние неучтенных факторов, межгрупповая дисперсия равна той части дисперсии результирующего показателя, которая отражает разброс относительно общего среднего (причем разброс объясняется влиянием анализируемого неколичественного фактора). Вернемся к проверке гипотезы об отсутствии влияния неколичественного фактора на результирующий показатель Y . Основная гипотеза записывается как 2 2 . = σвнутригр H0 : σобщ Альтернативная гипотеза 2 2 H1 : σобщ > σвнутригр . Для проверки строится статистика, имеющая распределение Фишера и равная отношению общей дисперсии к внутригрупповой: F = 2 Sобщ 2 Sвнутригр . Расчетное значение сравнивается с табличным значением F распределения, соответствующим уровню значимости α, числу степеней свободы числителя ν1 = N − 1 и знаменателя ν2 = N − P . 112 113 «Полная» сумма квадратов факторов) Ошибки (влияние неучтенных качественного признака) Между градациями (влияние Источник вариации Dобщ = (yij − y) j=1 i=1 2 (yij − yj )2 j=1 i=1 nj P P P (yj − y)2 j=1 i=1 nj P P P Dвнутригр = Dмежгр = nj P P P Сумма квадратов N −1 N −P P −1 Число степеней свободы 2 Sобщ Dвнутригр N −P Dмежгр P −1 Dобщ = N −1 2 Sвнутригр = 2 = Sмежгр Дисперсия (или средние квадраты) F = 2 Sвнутригр 2 Sобщ Критерий F Таблица 7 Если Fрасч > Fтабл , то нулевая гипотеза отвергается с уровнем значимости α. В таком случае с вероятностью, равной p = 1 − α, делается вывод о существенности влияния данного качественного признака на результирующий показатель. Процедуру ДА обычно представляют в форме таблицы 7. 114 Лекция 3.3.2. Модель двухфакторного дисперсионного анализа Исследуется ситуация, когда необходимо установить влияние на зависимый количественный показатель двух качественных признаков A и B с числом градаций соответственно P (i = 1, P ) и Q (j = 1, Q), а также их взаимодействия. Обозначим как θij среднее значение результата эксперимента (эффект взаимодействия) при сочетании i-го уровня фактора A с j-ым уровнем фактора B (среднее значение в (i, j)-ой ячейке прямоугольной таблицы, где строкам соответствуют градации фактора A, а столбцам — градации фактора B). Число наблюдений в ячейке (i, j) равно n, и тогда общее количество наблюдений определяется как N = nP Q. Главным эффектом фактора A на i-ом уровне будем считать число αi , а главным эффектом фактора B на уровне j будем считать число βj . Пусть yijk — k-ое наблюдение зависимого признака в ячейке (i, j), соответствующее i-му уровню фактора A и j-му уровню фактора B (k = 1, n; i = 1, P ; j = 1, Q), y — среднее значение зависимого признака, εijk — случайная составляющая для k-го наблюдения в ячейке (i, j). В модели полного двухфакторного ДА предполагается, что уровни факторов фиксированы. Рассмотрим случай, когда n > 1. Модель двухфакторного ДА примет вид yijk = y + αi + βj + θij + εijk , i = 1, P ; j = 1, Q; k = 1, n. Предполагается, что случайные составляющие независимы и имеют нормальное распределение с нулевым средним и дисперсией σ 2 . Результаты наблюдений для указанного полного двухфакторного ДА удобнее представлять в виде таблицы 8 Среднее значение для сочетания факторов (i, j) определяется как: yij = n P yijk k=1 n , (k = 1, n). 115 116 yP 11 , yP 12 , . . . , yP 1n P P n P AP Средние y1 = .. . .. . Pn yi1k P P n P yi11 , yi12 , . . . , yi1n Ai i=1 k=1 yP 21 , yP 22 , . . . , yP 2n .. . .. . y2 = yi2k Pn i=1 k=1 .. . yi21 , yi22 , . . . , yi2n .. . y221 , y222 , . . . , y22n y211 , y212 , . . . , y21n A2 y121 , y122 , . . . , y12n B2 y111 , y112 , . . . , y11n B1 ... ... .. . ... .. . ... ... ... Bj yj = yijk Pn i=1 k=1 P P n P yP j1 , yP j2 , . . . , yP jn .. . yij1 , yij2 , . . . , yijn .. . y2j1 , y2j2 , . . . , y2jn y1j1 , y1j2 , . . . , y1jn Градации фактора B A1 Градации фактора A ... ... .. . ... .. . ... ... ... yQ = Pn yiQk yP Q1 , yP Q2 , . . . , yP Qn i=1 k=1 Q P n P yP jk yijk Общее среднее: Q P P P n P yijk i=1 j=1 k=1 y= P Qn Qn j=1 k=1 .. . .. . Qn j=1 k=1 yiQ1 , yiQ2 , . . . , yiQn P P n P y2jk Qn j=1 k=1 Q P n P Q P n P yP = y1jk Qn .. . yi = y2 = y1 = j=1 k=1 Q P n P .. . y2Q1 , y2Q2 , . . . , y2Qn y1Q1 , y1Q2 , . . . , y1Qn BQ Средние Таблица 8 Общую сумму квадратов отклонений наблюдений зависимой переменной (Dy ) можно разложить на несколько составных частей: — сумму квадратов, обусловленную влиянием фактора A (DA ); — сумму квадратов, обусловленную влиянием фактора B (DB ); — сумму квадратов, обусловленную влиянием взаимодействия факторов A и B (DAB ); — остаточную сумму квадратов (Dост ). Тогда Dy = Q X P X n X i=1 j=1 k=1 или Q X n P X X i=1 j=1 k=1 2 (yi − y) + + Q X n P X X i=1 j=1 k=1 Q X n P X X i=1 j=1 k=1 или Qn P X i=1 2 (yi − y) + P n Q X j=1 (yijk − y)2 (yj − y)2 + 2 (yij − yi − yj + y) + 2 (yj − y) + n Q P X X i=1 j=1 Q X n P X X i=1 j=1 k=1 (yijk − yij )2 (yij − yi − yj + y)2 + + Q X P X n X i=1 j=1 k=1 (yijk − yij )2 . Результаты двухфакторного ДА также представим в виде таблицы 9. Для степеней свободы выполняется балансовое соотношение: N − 1 = (P − 1) + (Q − 1) + (P − 1)(Q − 1) + N − P Q Оценка значимости влияния каждого фактора, а также их взаимодействия на зависимый показатель проводится так: формируются следующие нулевые гипотезы, свидетельствующие об отсутствии влияния на зависимый показатель того или иного фактора, либо их взаимодействия: 2 H0 : все αi = 0 (тогда σA2 = σост ); 117 118 Dост = Dy = «Полная» сумма квадратов j=1 Q P (yj − y) (yi − y) i=1 (yijk − y)2 i=1 j=1 k=1 Q P n P P P i=1 j=1 k=1 Q P P P n P (yijk − yij )2 (yij − yi − yj + y)2 i=1 j=1 Q P P P Остаточная вариация AиB DAB = n DB = P n Фактор B Взаимодействия DA = Qn P P Сумма квадратов Фактор A Источник изменчивости N −1 N − PQ (P −1)(Q−1) Q−1 P −1 Число степеней свободы — Dост N − PQ DAB (P − 1)(Q − 1) DB = Q−1 DA = P −1 2 Sост = 2 SAB = SB2 SA2 (дисперсия зависимой переменной) «Средние» квадраты — — FAB = 2 SAB 2 Sост SB2 FB = 2 Sост SA2 FA = 2 Sост Критерий F Таблица 9 2 ); H0 : все βj = 0 (тогда σB2 = σост 2 2 ). = σост H0 : все θij = 0 (тогда σAB Для проверки этих гипотез вычисляются значения распределения Фишера FA , FB , FAB (см. формулы в предыдущей таблице), которые затем сравниваются с табличными значениями F -распределения, соответствующими уровню значимости α и числу степеней свободы ν1 (число степеней свободы числителя) и ν2 (число степеней свободы знаменателя) следующим образом: если FAрасч > FAтабл (α, ν1 = P − 1, ν2 = N − P Q); FBрасч > FBтабл (α, ν1 = Q − 1, ν2 = N − P Q); FABрасч > FABтабл (α, ν1 =)(P − 1)(Q − 1), ν2 = N − P Q); то нулевые гипотезы отвергаются и делается вывод о существенности влияния факторов (либо их взаимодействия) на зависимый показатель. Оценки главных эффектов и взаимодействия факторов в модели двухфакторного ДА равны: ai = yi − y (i = 1, P ); bi = yj − y (j = 1, P ); cij = yij − yi + yj + y (i = 1, P , j = 1, Q). 119 Список литературы [1] Айвазян, С. А. Прикладная статистика. Исследование зависимостей. / С. А. Айвазян, И. С. Енюков, Л. Д. Мешалкин. — М.: Финансы и статистика, 1985. [2] Айвазян, С. А. Прикладная статистика и основы эконометрики. / С. А. Айвазян, В. С. Мхитарян. — М.: ЮНИТИ, 1998. [3] Андерсон, Т. Статистический анализ временных рядов. / Т. Андерсон. — М.: Мир, 1976. [4] Гомбаров, Г. М. Статистическое моделирование и прогнозирование: Учеб. пособие. / Г. М. Гомбаров, Н. М. Журавель, Ю. Г. Королев и др.; под ред. А. Г. Гранберга. — М.: Финансы и статистика, 1990. [5] Громыко, Г. Л. Статистика. / Г. Л. Громыко. — М.: МГУ, 1981. [6] Джонстон, Дж. Эконометрические методы. / Дж. Джонстон. — М.: Статистика, 1980. [7] Доугерти, К. Введение в эконометрику. / К. Доугерти. — М.: ИНФРА-М, 1997. [8] Дубров, А. М. Многомерные статистические методы. / А. М. Дубров, В. С. Мхитарян, Л. И. Трошин. — М.: Финансы и статистика, 1998. [9] Дрейпер, Н. Прикладной регрессионный анализ: в 2 кн. / Н. Дрейпер, Г. Смит. — М.: Финансы и статистика. Кн. 1. — 1986. Кн. 2. — 1987. [10] Замков, О. О. Математические методы в экономике: Учеб. / О. О. Замков, А. В. Толстопятенко, Ю. Н. Черемных. — М.: МГУ, изд-во «ДИС», 1997. 120 [11] Карасев, А. И. Теория вероятностей и математическая статистика: Учеб. для эконом. спец. вузов. / А. И. Карасев. — М.: Статистика, 1979. [12] Клейнер, Г. Б. Эконометрические зависимости: прицнипы и методы построения. / Г. Б. Клейнер, С. А. Смоляк. — М.: Наука, 2000. [13] Лапо, В. Ф. Теория вероятностей, математическая статистика и эконометрика: Учеб. пособие, кн. 2. / В. Ф. Лапо. — Красноярск: Краснояр. гос. ун-т, 1999. [14] Лизер, С. Эконометрические методы и задачи. / С. Лизер. — М.: Статистика, 1971. [15] Львовский, Е. Н. Статистические методы построения эмпирических формул: Учеб. пособие. / А. И. Карасев. — М.: Высш. шк., 1988. [16] Льюис, К. Д. Методы прогнозирования экономических показателей. / К. Д. Льюис. — М.: Финансы и статистика, 1986. [17] Магнус, Я. Р. Эконометрика. Начальный курс. / Я. Р. Магнус, П. К. Катышев, А. А. Пересецкий. — М.: Дело, 1997. [18] Маленво, Э. Статистические методы эконометрии. / Э. Маленво. — М.: Статистика. Вып. 1. — 1975. Вып. 2. — 1976. [19] Нейман, В. Г. Решение научных, инженерных и экономических задач с помощью ППП STATGRAPHICS. / В. Г. Нейман. — М.: Память, 1993. [20] Сошникова, Л. А. Многомерный статистический анализ в экономике: Учеб. пособие для вузов / Л. А. Сошникова, В. Н. Тамашевич, Г. Уебе, М. Шефер; под ред. проф. В. Н. Тамашевича. — М.: ЮНИТИ-ДАНА, 1999. 121 [21] Сулицкий, В. Н. Методы статистического анализа в управлении: Учеб. пособие. / В. Н. Сулицкий. — М.: Дело, 2002. [22] Тинтнер, Г. Введение в эконометрию. / Г. Тинтнер. — М.: Статистика, 1965. [23] Тюрин, Ю. Н. Анализ данных на компьютере. / Ю. Н. Тюрин, А. А. Макаров; под ред. В. Э. Фигурнова. — М.: ИНФРА-М, Финансы и статистика, 1995. [24] Четыркин, Е. М. Вероятность и статистика. / Е. М. Четыркин, Калихман И. Л. — М.: Финансы и статистика, 1983. [25] Эддоус, М. Методы принятия решения. / М. Эддоус, Р. Мэнсфилд. — М.: Аудит, ЮНИТИ, 1997. [26] Айвазян, С. А. Основы эконометрики: Т. 2. / С. А. Айвазян. — М.: ЮНИТИ, 2001. [27] Бриллинджер, Д. Временные ряды. Обработка данных и теория. / Д. Бриллинджер. — М.: Мир, 1980. [28] Кейн, Э. Экономическая статистика и эконометрия. / Э. Кейн. — М.: Статистика, 1977. [29] Badi H. B. Econometrics. — 2nd edition. — Springer, 1999. [30] Russel D., James G. M. Estimation and Inference in Econometrics. — Oxford University Press, 1993. [31] Greene W. H. Econometric Analysis. — Prentice-Hall, 2000. [32] Judge G. G., Hill R. C., Griﬃths W. E., Lütkepohl H., Lee T. Econometric Analysis. — Introduction to the Theory and Practice of Econometric. — John Wiley & Sons, 1993. [33] Maddala G. S. Introduction to Econometrics. — 2nd edition. — Prentice Hall, 1992. [34] Ruud Paul A. An Introduction to Classical Econometric Theory. — 2nd edition. — Oxford University Press, 2000. 122 [35] Griﬃths W. E., Hill R. C., Judge G. G. Learning and Practicing econometrics. — John Wiley & Sons, 1993. 123 Предметный указатель Анализ корреляционный, 16 Данные Метод наименьшего дисперсионного отношения, 103 Метод наименьших квадратов Пространственные, 6 Дисперсия, 9 Эконометрика, 3 Форма двухшаговый, 102 косвенный, 100 обычный, 106 трехшаговый, 105 приведенная, 97 структурная, 97 Гистограмма, 15 Идентификация, 99 Интервал групповой, 13 Кластер, 4 Коэффициент корреляции Мода, 11, 14 Модель авторегрессии, 5 корреляционная, 16 генеральный, 17 парный, 17 выборочный, 16 Коэффициент вариации, 10, 12 Квантиль, 9 выборочная, 11 Математическое ожидание, 16 Медиана, 14 второй центральный, 9 Невзаимозависимая система уравнений, 95 Объем выборки, 10 Оценки k-класса, 104 Переменная объясняемая, 5 объясняющая, 5 Момент, 9 центральный, 10 начальный, 10 произвольный порядка k, 9 выборочная, 11 Показатель Мера асимметрии, 14 линейной статистической связи, Показатель эксцесса, 14 16 Поле рассеяния, 12 корреляционное, 16 124 Предложение, 6 Распределение нормальное, 17 Рекурсивная система, 105 Система регрессионных уравнений, 95 Совокупность генеральная, 17 Спрос, 6 Среднее значение признака, 9 наблюдаемого Среднеквадратичное отклонение, 12 Выборочное, 10 Сверхидентифицируемость, 99, 102 Тренд, 5 Уравнение регрессии, 4 Уравнения одновременные, 97 Вариационный размах, 12 Временной ряд, 4–6 Взаимообусловленность, 17 Закон распределения Нормальный, 14 нормальный, 13, 15, 16 125