При формировании прогнозов с помощью экстраполяции обычно исходят из статистически складывающихся тенденций изменения тех или иных количественных характеристик объекта. Экстраполируются оценочные функциональные системные и структурные характеристики. Экстраполяционные методы являются одними из самых распространенных и наиболее разработанных среди всей совокупности методов прогнозирования.
С помощью этих методов экстраполируются количественные параметры больших систем, количественные характеристики экономического, научного, производственного потенциала, данные о результативности научно-технического прогресса, характеристики соотношения отдельных подсистем, блоков, элементов в системе показателей сложных систем и др.
Однако степень реальности такого рода прогнозов и соответственно мера доверия к ним в значительной мере обусловливаются аргументированностью выбора пределов экстраполяции и стабильностью соответствия "измерителей" по отношению к сущности рассматриваемого явления. Следует обратить внимание на то, что сложные объекты, как правило, не могут быть охарактеризованы одним параметром. В связи с этим можно сделать некоторое представление о последовательности действий при статистическом анализе тенденций и экстраполировании, которое состоит в следующем:
- во-первых, должно быть четкое определение задачи, выдвижение гипотез о возможном развитии прогнозируемого объекта, обсуждение факторов, стимулирующих и препятствующих развитию данного объекта, определение необходимой экстраполяции и её допустимой дальности;
- во-вторых, выбор системы параметров, унификация различных единиц измерения, относящихся к каждому параметру в отдельности;
- в-третьих, сбор и систематизация данных. Перед сведением их в соответствующие таблицы еще раз проверяется однородность данных и их сопоставимость: одни данные относятся к серийным изделиям, а другие могут характеризовать лишь конструируемые объекты;
- в-четвертых, когда вышеперечисленные требования выполнены, задача состоит в том, чтобы в ходе статистического анализа и непосредственной экстраполяции данных выявить тенденции или симптомы изменения изучаемых величин. В экстраполяционных прогнозах особо важным является не столько предсказание конкретных значений изучаемого объекта или параметра в таком-то году, сколько своевременное фиксирование объективно намечающихся сдвигов, лежащих в зародыше назревающих тенденций.
Для повышения точности экстраполяции используются различные приемы. Один из них состоит, например, в том, чтобы экстраполируемую часть общей кривой развития (тренда) корректировать с учетом реального опыта развития отрасли-аналога исследований или объекта, опережающих в своем развитии прогнозируемый объект.
Под трендом понимается характеристика основной закономерности движения во времени, в некоторой мере свободной от случайных воздействий. Тренд - это длительная тенденция изменения экономических показателей. При разработке моделей прогнозирования тренд оказывается основной составляющей прогнозируемого временного ряда, на которую уже накладываются другие составляющие. Результат при этом связывается исключительно с ходом времени. Предполагается, что через время можно выразить влияние всех основных факторов.
Под тенденцией развития понимают некоторое его общее направление, долговременную эволюцию. Обычно тенденцию стремятся представить в виде более или менее гладкой траектории.
Анализ показывает, что ни один из существующих методов не может дать достаточной точности прогнозов на 20-25 лет. Применяемый в прогнозировании метод экстраполяции не дает точных результатов на длительный срок прогноза, потому что данный метод исходит из прошлого и настоящего, и тем самым погрешность накапливается. Этот метод дает положительные результаты на ближайшую перспективу прогнозирования тех или иных объектов не более 5 лет.
Для нахождения параметров приближенных зависимостей между двумя или несколькими прогнозируемыми величинами по их эмпирическим значениям применяется метод наименьших квадратов. Его сущность состоит в минимизации суммы квадратов отклонений между наблюдаемыми (фактическими) величинами и соответствующими оценками (расчетными величинами), вычисленными по подобранному уравнению связи.
Этот метод лучше других соответствует идее усреднения как единичного влияния учтенных факторов, так и общего влияния неучтенных.
Рассмотрим простейшие приемы экстраполяции. Операцию экстраполяции в общем виде можно представить в виде определения значения функции:
, (2.7)
где - экстраполируемое значение уровня; L – период упреждения; Уt – уровень, принятый за базу экстраполяции.
Под периодом упреждения при прогнозировании понимается отрезок времени от момента, для которого имеются последние статистические данные об изучаемом объекте, до момента, к которому относится прогноз.
Экстраполяция на основе среднего значения временного ряда. В самом простом случае при предположении о том, что средний уровень ряда не имеет тенденции к изменению или если это изменение незначительно, можно принятьт.е. прогнозируемый уровень равен среднему значению уровней в прошлом.
Доверительные границы для средней при небольшом числе наблюдений определяются следующим образом:
(2.8)
где ta – табличное значение t – статистики Стьюдента с n-1 степенями и уровнем вероятности p;- средняя квадратическая ошибка средней величины. Значение ее определяется по формуле . В свою очередь, среднее квадратическое отклонение для выборки равно:
(2.9)
где yt – фактические значения показателя.
Доверительный интервал, полученный как ta, учитывает неопределенность, которая связана с оценкой средней величины.
Общая дисперсия, связанная как с колеблемостью выборочной средней, так и с варьированием ндивидуальных значений вокруг средней, составит величину S2+S2/n. Таким образом, доверительные интервалы для прогностической оценки равны:
(2.10)
Экстраполяция по скользящей и экспоненциальной средней. Для краткосрочного прогнозирования наряду с другими приемами могут быть применены адаптивная или экспоненциальная скользящие средние. Если прогнозирование ведется на один шаг вперед, то или , где Мt - адаптивная скользящая средняя; Nt - экспоненциальная средняя. Здесь доверительный интервал для скользящей средней можно определить по формуле (2.10), в которой число наблюдений обозначено символом n. Поскольку при расчете скользящей средней через m обозначалось число членов ряда, участвующих в расчете средней, то заменим в этой формуле n на m, равным нечетным числам.
При экспоненциальном сглаживании дисперсия экспоненциальной средней равна , где S -среднее квадратическое отклонение, вместо величины в формуле (2.10) при исчислении доверительного интервала прогноза следует взять величину или . Здесь a- коэффициент экспоненциального сглаживания, изменяется от 0 до 1. Если 0<a<0,5, то при расчете прогноза учитываются прошлые значения временного ряда, а при 0,5<a<1 – значения, близкие к периоду упреждения. Примерное значение коэффициента сглаживания определяют по формуле Р.Брауна:
(2.11)
где m – число уровней временного ряда, входящих в интервал сглаживания.
Экстраполяция на основе среднего темпа. Если в основу прогностического расчета положен средний темп роста, то экстраполируемое значение уровня можно получить с помощью формулы: , где - средний темп роста, Уt - уровень, принятый за базу для экстраполяции. Здесь принят только один путь развития - развитие по геометрической прогрессии, или по экспонентной кривой. Во многих же случаях фактическое развитие явления следует иному закону, и экстраполяция по среднему темпу нарушает основное допущение, принимаемое при экстраполяции, - допущение о том, что развитие будет следовать основной тенденции - тренду, наблюдавшемуся в прошлом. Чем больше фактический тренд отличается от экспоненты, тем больше данные, получаемые при экстраполяции тренда, будут отличаться от экстраполяции на основе среднего темпа.
Средний темп или определяется на основе изучения прошлого, или оценивается каким-либо другим путем (например, подбор вариантов для различных ситуаций). В качестве исходного (базового) уровня для экстраполяции представляется естественным взять последний уровень ряда, поскольку будущее развитие начинается именно с этого уровня.
Статистическая надежность вышеприведенных методов оценивается с помощью коэффициента вариации:
(2.12)
где- среднее квадратическое отклонение;
- среднее значение временного ряда.
Метод считается статистически надежным и может быть использован для прогнозирования, если значение коэффициента вариации не превышает 10%.
Однофакторные прогнозирующие функции
Это такие функции, в которых прогнозируемый показатель зависит только от одного факториального признака.
В научно-техническом и экономическом прогнозировании в качестве главного фактора аргумента обычно используют время. Вполне очевидно, что не ход времени определяет величины прогнозируемого показателя, а действие многочисленных влияющих на него факторов. Однако каждому моменту времени соответствуют определенные характеристики всех этих факториальных признаков, которые со временем в той или иной мере изменяются. Таким образом, время можно рассматривать как интегральный показатель суммарного воздействия всех факториальных признаков.
В качестве фактора-аргумента в однофакторной прогнозирующей функции можно использовать не только время, но и другие факторы, если известна их количественная оценка на перспективу.
Наиболее простым из методов прогнозирования является экстраполяция тренда явления (процесса) за истекший период. Тренд (или вековая тенденция) характеризует процесс изменения показателя за длительное время, исключая случайные колебания. Тренд явления находят путем аппроксимации фактических уровней временного ряда на основе выбранной функции. Наиболее часто применяемые при прогнозировании функции показаны в табл. 2.3. В них фактор-аргумент обозначен символом t.
Таблица 2.3 Однофакторные прогнозирующие функции
Наименования функции |
Вид функции |
Степенной полином |
y = a0 + a1t + a2t2 +…antn |
Парабола |
y=a0+a1t+a2t2 |
Линейная функция |
у = а0+а1t |
Экспоненциальная (показательная) |
, |
Степенная |
|
Логарифмическая |
у = а0+а1lnt |
Комбинация линейной и логарифмической функций |
у = а0+a1t+а2lnt |
Функция Конюса |
|
Функция Торнквиста |
|
Логистическая (сигмоидальная) |
|
Частный случай логистической функции |
|
Гипербола |
, |
Комбинация линейной функции и гиперболы |
у = а0+а1t + |
При прогнозировании колебательных (циклических) процессов применяют тригонометрические функции, ряды Фурье.
Степенной полином может описать любые процессы изменения показателя y в зависимости от значений t. Корреляционное отношение для степенного полинома, служащее мерой тесноты корреляционной связи в нелинейных моделях, приближается к единице по мере увеличения числа степеней полинома до числа уровней временного ряда. Одновременно линия регрессии приближается к фактическим уровням показателя за прошедшее время, что не позволяет установить его тренд и экстраполировать его на перспективу. Поэтому для прогнозирования обычно не применяют полином выше третьей степени. Таким образом, в качестве прогнозирующей функции целесообразно использовать лишь три частных случая степенного полинома: линейную модель, параболу и полином третьего порядка.
Однофакторная линейная модель отражает постоянный ежегодный абсолютный прирост в размере a1, т.е. арифметическую прогрессию. Парабола (степенной полином) второго порядка описывает случаи увеличения абсолютного ежегодного прироста на постоянную величину 2a2, а третьего порядка – S – образную кривую с двумя точками изгибов.
Экспонента первого порядка (показательная функция) предусматривает постоянный ежегодный темп роста, равный процентов (т.е. геометрическую прогрессию), а второго порядка – постоянное увеличение ежегодных темпов роста в раз. Степенная функция соответствует случаю ускоряющегося при а1>1 или замедляющегося при а1<1 роста абсолютного ежегодного прироста. Логарифмическая функция выражает случай сокращения абсолютного ежегодного прироста, а функции Торнквиста и Конюса, комбинация линейной функции с логарифмической – затухающий рост абсолютного ежегодного прироста. Логистическая (сигмоидальная) кривая представляет собой модифицированную геометрическую прогрессию, в которой возрастание затухает по мере приближения к определенному пределу. Наконец, гиперболы характерны для тех случаев, когда в начальной стадии абсолютные уровни показателя резко сокращаются, а на последующих этапах этот процесс сокращения постепенно затухает
Коэффициенты в однофакторных прогнозирующих функциях а0 и а1 определяются с помощью метода наименьших квадратов, сущность которого заключается в минимизации суммы квадратов отклонений фактических значений от расчетных:
(2.13)
где- вид исследуемой функции (см. табл.2.3)
Пусть временной ряд может быть описан линейной функцией:
.
Подставим это выражение в формулу (2.13), получим:
.
Возьмем частные производные по а0 и а1:
,
.
В результате алгебраических преобразований данной системы: (сокращений, раскрытия скобок, переноса известных величин вправо, а неизвестных влево) - получим систему нормальных уравнений:
Из первого уравнения найдем а0, из второго – а1.
Формулы расчета а0 и а1 имею вид:
(2.14)
или
Прогнозируемые значения показателя у определяется по формуле:
=а0+а1(t+L), где L=1,2,…,(2.15)
если фактором-аргументом является время t. В случае, когда фактор-аргумент – независимая переменная (любой показатель х) то необходимо найти его прогнозируемые значения. Тогда:
=а0+а1хt+L, где L=1,2,… (2.16)
Для оценки качества и надежности анализа регрессии используются следующие показатели: корреляционное отношение (η), коэффициент парной корреляции (r), коэффициент детерминации (r2), средняя ошибка предвидения (Sс), средняя ошибка коэффициента регрессии (Sаj, j=0, 1,2, …).
Корреляционное отношение (η) указывает на степень взаимозависимости между у и х. Принимает значения между 0 и 1:
(2.17)
Коэффициент парной корреляции может быть определен по формуле:
(2.18)
где S11, S22, S12 – соответственно остаточные дисперсии для функции, фактора-аргумента и их произведения: определяются по формулам:
;
;
.
Коэффициент корреляции, рассчитывается по формуле (2.18) и принимает значения от -1 до +1. Чем ближе значения коэффициента к единице, тем большая связь существует между функцией и аргументом.
Для проверки гипотезы о наличии связи определим критерий Стьюдента:
(2.19)
Если tr>tтабл, то принимаем гипотезу о наличии связи, в противном случае – она отсутствует.
Коэффициент детерминации (r2) показывает, насколько уравнение регрессии подходит к значениям временного ряда или какой процент составляют учтенные факторы в уравнении регрессии.
Точность регрессионной модели определяется с помощью средней ошибки предвидения или среднего отклонения по формуле:
(2.20)
Средняя ошибка коэффициентов регрессии определяется по формуле:
(2.21)
или ,
где j=1, 2, … , m; m – число факторов;
t=1, 2, … , n; n – число данных.
Оценка Стьюдента (tаj) показывает удельный вес фактора-аргумента х при объяснении у. Она вычисляется делением коэффициентов aj на их средние ошибки Saj:
(2.22)
Оценка Стьюдента показывает, во сколько раз значения j-го коэффициента превосходят его среднюю ошибку. Любое значение taj больше 2 или меньше -2 считается приемлемым. Чем больше величина taj, тем больше значимость коэффициентов регрессии, тем надежнее уравнение регрессии.
Статистическая надежность аппроксимирующей функции или коэффициента парной корреляции устанавливается также с помощью критерия Стьюдента (2.19).
С вероятностью ошибки р и с (n-2) степенями свободы выбранная функция признается статистически надежной, если рассчитанное значение критерия tr превышает табличное.
Ошибкой прогноза называется отклонение предсказанного значения от наблюдаемого (фактического). Для оценки совокупной ошибки прогноза используются два показателя: средняя абсолютная ошибка ( ) и средняя относительная ошибка ( ), которые определяются по формулам:
(2.23)
(2.24)
С помощью метода наименьших квадратов могут быть определены а0 и а1 во всех однофакторных прогнозирующих функциях, если эти функции предварительно линеаризовать, т.е. преобразовать в линейную модель. Линеаризация достигается логарифмированием или получением обратных значений функции, а также заменой переменных, представляющих собой преобразованные значения показателей у и t.
Многофакторные прогнозирующие функции
Каждый прогнозируемый показатель уt (t=1,2…,n) можно рассматривать не только как функцию одного фактора-аргумента, но и от нескольких:
- в виде линейной многофакторной модели:
уt=а0+а1х1t+а2х2t+…+аjхjt+…+аmхmt(2.25)
где а0, аj – коэффициенты модели при j=1, 2, … , k;
хjt – факторы-аргументы, влияющие на прогнозируемый показатель уt, при j=1, 2, … , m; t=1,2,…, n;
- в виде нелинейной многофакторной модели (степенного типа):
(2.26)
которая путем логарифмирования преобразуется в линейную. Более сложные виды нелинейных многофакторных моделей редко используются в практике прогнозирования и планирования.
Коэффициенты а0, аj в моделях типа (2.25) и (2.26) определяются с помощью метода наименьших квадратов (2.13) из системы нормальных уравнений, представляющих собой частные производные по а0, аj равные нулю:
В результате решения данной системы уравнений находятся такие а0 и аj, при которых (2.13) стремится к нулю.
Факторы-аргументы должны отвечать следующим условиям: во-первых, иметь количественное измерение и отражаться в отчетах или, по крайней мере, определяться на основе специального анализа отчетных данных; во-вторых, иметь перспективные оценки значений на прогнозируемый период; в-третьих, число включаемых в модель факторов должно быть меньше числа данных ряда в три раза; в-четвертых, быть линейно независимыми.
Факторы считаются зависимыми (мультиколлинеарными), если линейный (парный) коэффициент корреляции (см. формулу 2.18) двух факторов более 0,8. Из них в модели оставляют тот, который имеет больший коэффициент корреляции с функцией у.
Оптимальное количество факторов-аргументов можно установить с помощью так называемого метода исключений. Сущность его заключается в следующем.
В модель типа (2.25) включают все возможные факторы, удовлетворяющие указанным выше условиям и строят эту модель. Для каждого j-го фактора-аргумента по формуле (2.22) находят оценки Стьюдента. Выбирают наименьшую величину оценки min ta1 и сравнивают с табличным значением – tp при (n-k-1) – степенях свободы и выбранном уровне значимости р (обычно принимают р=0,05 или 5%). Если минимальная из рассчитанных оценок ta>tp, то модель оставляют в полученном виде. Если же tap, то фактор а1 исключается из модели как незначимый. Затем с оставшимися факторами строят новую модель, определяют новое значение оценок Стьюдента, находят минимальную из них и т.д. до тех пор, пока в модели останутся все значимые факторы.
Тесноту связей между функцией и факторами-аргументами можно установить с помощью квадрата коэффициента множественной корреляции:
(2.27)
где
Квадрат коэффициента множественной корреляции показывает, какая часть общего рассеяния зависимой переменной может быть объяснена функцией вида (2.25) или вида (2.26).
Статистическая надежность многофакторной регрессионной модели (или коэффициента детерминации) устанавливается с помощью критерия Фишера:
(2.28)
где n – число данных;
m – число факторов-аргументов в модели;
R2 – квадрат коэффициента множественной корреляции.
Если расчетное значение критерия Фишера превышает табличное при (n-m) и (m-1) степенях свободы и принятом р – уровне значимости то модель признается статистически надежной и значимой. Многофакторная регрессионная модель может быть использована для прогнозирования не более трехлетнего периода упреждения. Ошибки прогноза определяются по формулам (2.23-2.24).
Метод экспоненциального сглаживания
Сущность этого метода заключается в том, что прогноз ожидаемых величин (объемов, продаж и т.д.) определяется путем взвешенных средних величин текущего периода и сглаженных значений, сделанных в предшествующий. Такой процесс продолжается назад к началу временного ряда и представляет собой простую экспоненциальную модель для временных рядов с устойчивым трендом и малыми (независимыми) периодическими колебаниями.
Для многих временных рядов (показателей) наблюдается очевидная картина периодичности и случайности. Поэтому простая экспоненциальная модель расширяется с включением в нее двух последних компонент.
а) С устойчивым трендом
Пусть глаженное значение в момент времени t определяется по рекуррентной формуле:
(2.29)
где уt – фактическое значение в момент времени t; ;
а – параметр сглаживания, определяется по формуле (2.11)
Тогда сглаженное значение в момент времени (t-1) равно:
(2.30)
Подставив в выражение (2.29), получим:
(2.31)
Продолжая этот процесс, прогноз может быть выражен в величинах прошлых значений временного ряда, т.е.:
, (2.32)
где L – период предсказания, но не более трех-пяти лет.
При t=1,2,…, n сглаженные значения в момент времени t определяются по формуле (2.29). Для этого же периода времени определяется среднее квадратическое отклонение (см. формулу 2.9) и коэффициент вариации (см. формулу 2.12), чтобы оценить точность выбранного параметра сглаживания. При t=1
.
В случае если коэффициент вариации превышает 10%, то необходимо изменить интервал сглаживания, а следовательно, и параметр сглаживания .
При ,…, n прогнозы в момент времени t определяются по формуле (2.32) для оценки точности предсказания по среднему квадратическому отклонению и коэффициенту вариации.
При t=n+1, n+2, … определяются соответственно прогнозы данного показателя, в предположении, что текущее значение в момент времени t=n+1 совпадает с прогнозным в момент времени t=n.
б) С периодической компонентой
Пусть - сглаженное значение в момент времени t с учетом периодической компоненты. Периодичность совпадает с периодом предсказания. На практике обычно рассматриваются годовые или месячные изменения. Тогда оценка сглаженного значения запишется так:
(2.33)
.
где ft-T – оценка периодической компоненты в предшествующем периоде; Т – длина периода.
В момент времени t периодическая компонента определяется по формуле:
(2.34)
.
Весовые параметры α и β подбираются либо с учетом текущих значений , либо с учетом прошлых значений . Оптимальные их значения устанавливаются по минимуму среднего квадратического отклонения.
Прогноз ожидаемых значений для оценки выбранных параметров α и β может быть определен мультипликативным образом по формуле:
(2.35)
где .
При t=n+1, n+2,…, N определяются собственно прогнозы по формуле:
(2.36)
где - прогноз сглаженного значения определяемый по формуле (2.32).
в) С периодической и случайной компонентами
Пусть оценка сглаженного значения с учетом периодической и случайной компоненты имеет вид:
(2.37)
где εt-1 – оценка случайной компоненты в момент времени (t-1), текущее значение εt определяется по формуле:
(2.38)
где γ – параметр сглаживания для случайной компоненты, .
Прогноз ожидаемых значений для оценки выбранных параметров α, β и γ может быть получен по формуле:
(2.39)
где Т – период предсказания, Т=1, 2, …, 5;
,…, n.
При t=n+1, n+2, …, N определяются собственно прогнозы по формуле:
(2.40)
где - прогноз сглаженного значения, определяется по формуле (2.32).
Метод авторегрессионного преобразования
Сущность его заключается в построении модели по отклонениям значений временного ряда от выравненных по тренду значений. Пусть эти отклонения представляют собой случайные колебания временного ряда в каждый момент времени t:
(2.41)
Тогда для случайной величины εt можно построить модель авторегрессии, т.е. регрессионную модель линейного вида для остатков значений временного ряда. Эти случайные переменные распределены со средним значением 0 и конечным рассеиванием (дисперсией) и подчиняются закону стохастического линейного разностного уровня 1-го порядка с постоянными коэффициентами (процесс Маркова), то есть:
(2.42)
где εt-1 – временной ряд случайной компоненты, сдвинутый на один шаг, t=1, 2, …, n.
По формулам вида (2.14) определим b0 и b1, получим:
;
(2.43)
гдеи - соответственно средние значения по данному временному ряду и сдвинутому на один шаг.
Прогнозируемые значения случайной компоненты определяются по формуле:
(2.44)
где L=1, 2, …
При L=1 , при L=2, 3, … справедлива формула (2.44).
Определяем коэффициент автокорреляции r2 по формуле парного коэффициента корреляции (см. формулу 2.18). Тогда коэффициент автокорреляции для авторегрессионной модели 1-го порядка равен:
(2.45)
Затем строим авторегрессионную модель 2-го порядка:
(2.46)
где εt-2 – временный ряд случайной компоненты, сдвинутой на два шага, при t=1, 2, …, n.
Коэффициенты b0, b1, b2 находятся с помощью метода наименьших квадратов из системы нормальных уравнений.
Находим:
(2.47)
Если , то случайная компонента следует закону линейного разностного уравнения 1-го порядка (2.42), а прогнозы определяются по формуле (2.44). Если же , то строится линейное разностное уравнение 3-го порядка рассчитывается и т.д. Эти расчеты продолжаются до тех пор, пока , при τ=1,2,…, n/2. Выбирается авторегрессионная модель (τ-1) порядка. Оценка точности и надежности авторегрессионной модели определяется по среднему квадратическому отклонению (см. формулу 2.9) и коэффициенту вариации (см. формулу 2.12).