Анализ временных рядов и прогнозирование. Методы прогнозирования временных рядов

Таблица Excel с исходными данными имеет следующий вид (рис. 2.33).

Рис. 2.33. Таблица Excel с исходными данными

При анализе временных рядов широко применяются графические методы. Это объясняется тем, что табличное представление временного ряда и описательные характеристики чаще всего не позволяют понять характер процесса, а по графику временного ряда можно сделать определенные выводы, которые потом могут быть проверены с помощью расчетов. Графический анализ ряда обычно задает направление его дальнейшего анализа.

Выделим диапазон ячеек А2:К2 и, используя команду График вкладки Вставка (рис. 2.34), построим график (рис. 2.35).


Рис. 2.34. Вкладка Вставка . Команда График

Рис. 2.35. График – Динамика продаж автомашин

До вставки линии тренда получите еще четыре копии графика, чтобы каждый тип линии тренда был построен на отдельном графике. Для вставки линии тренда, щелкните правой кнопкой мыши на одном из значений данных графика и выберите команду Добавить линию тренда , как показано на рис. 2.36.

Рис. 2.36. Команда Добавить линию тренда

контекстного меню

В диалоговом окне Формат линии тренда (рис. 2.37) выбираются предлагаемые типы линии тренда и активизируются опции показывать уравнение на диаграмме и поместить на диаграмму величину достоверности аппроксимации.

Рис. 2.37. Выбраны параметры линии тренда

В результате получим графики следующего вида (рис. 2.38 -2.).

Рис. 2.38. Тип линии тренда - Линейная

Рис. 2.39. Тип линии тренда - Логарифмическая

Рис. 2.40. Тип линии тренда – Полиномиальная

Рис. 2.41. Тип линии тренда - Степенная

Рис. 2.42. Тип линии тренда – Экспоненциальная

В качестве аппроксимирующей функции выбран полином второй степени – парабола, так как имеет наибольшее значение R 2 =0,9905, по этому типу тренда и построен прогноз на два шага вперед (рис. 2.43). В нашем примере прогнозируется число проданных автомашин на 11 и 12 неделях (рис. 2.44).

Рис. 2.43. Задан прогноз на два периода вперед

Рис. 2.44. Прогноз на два периода вперед

Так же для построения прогноза можно использовать встроенную статистическую функцию ТЕНДЕНЦИЯ. Заполним диапазон ячеек L1:M1 соответственно числами 11 и 12. Так как функция ТЕНДЕНЦИЯ дает массив ответов, то перед ее вызовом необходимо выделить диапазон ответов, в нашем случае L2:M2. Используя кнопку Мастера функций , вызовем диалоговое окно функции и заполним поля аргументов, как показано на рис. 2.45.

Рис. 2.45. Статистическая функция ТЕНДЕНЦИЯ

По окончании ввода формулы: =ТЕНДЕНЦИЯ(B2:K2;B1:K1;L1:M1) нажмите комбинацию клавиш Ctrl+Shift+Enter .

Результат вычислений показан на следующем рис. 2.46.

Получили следующий прогноз, если предприятие сохранит динамику продаж автомобилей, то на 11 неделе оно продаст 78 автомашин, а на 12 неделе – 84.

Линейная регрессия

В таблице заданы два временных ряда: первый из них представляет нарастающую по кварталам прибыль коммерческого банка (У ), второй ряд – процентную ставку этого банка по кредитованию юридических лиц (Х ) за тот же период (табл. 3).

Требуется:

1. Построить однофакторную модель регрессии;

2. Оценить прибыль банка при заданной (принимается пользователем самостоятельно) процентной ставке;

3. Отобразить на графике исходные данные, результаты моделирования.

Таблица 3

Таблица с исходными данными в Excel имеет следующий вид (рис. 2.47).


Рис. 2.47. Таблица с исходными данными

Для вычисления параметров модели составим расчетную таблицу следующего вида (рис. 2.48).


Рис. 2.48. Расчетная таблица

Эта же таблица в режиме индикации формул выглядит так, как показано на следующем рис. 2.49.


Рис. 2.49. Расчетная таблица в режиме

индикации формул

В ячейки С19 и С20 введены формулы для вычисления параметров а 1 и а 0 (рис. 2.50):

Рис. 2.50. Формулы для вычисления параметров а 1 и а 0

Значения самих параметров приведены на рис. 2.51.

Рис. 2.51. Значения параметров а 1 и а 0

Построенная модель зависимости прибыли от величины процентной ставки имеет вид:

Для того чтобы определить прибыль при величине процентной ставке равной 30%, необходимо подставить значение х в полученную модель.

В ячейку С22 введена следующая формула (рис 2.52):

Рис. 2.52. Формула для вычисления прогнозной величины прибыли

Прогнозное значение прибыли составит 13 тыс. руб. (рис. 2.53).

Рис. 2.53. Прогнозное значение прибыли

Рассчитаем таблицу остатков (рис. 2.54).

Рис. 2.54. Таблица остатков

Таблица остатков в режиме индикации формул имеет следующий вид (рис. 2.55).


Рис. 2.55. Таблица остатков в режиме индикации формул

Величина отклонения от линии регрессии вычисляется по следующей формуле:

В ячейку С38 введена формула для вычисления величины отклонения с использованием встроенной математической функции КОРЕНЬ (рис. 2.56).


Рис. 2.56. Встроенная математическая функция КОРЕНЬ

Величина отклонения от линии регрессии составляет 3,4401 (рис. 2.57).

Рис. 2.57. Величина отклонения от линии регрессии

На следующем этапе рассчитываются верхняя граница прогноза и нижняя. Для расчета доверительного интервала воспользуемся следующей формулой:

которая введена в ячейку С40.

Коэффициент t a является табличным значением t – статистики Стьюдента при заданном уровне значимости a и числе наблюдений. Если задать вероятность попадания прогнозируемой величины внутрь доверительного интервала, равную 90% (a = 0,01), число степеней свободы df = 10-1-1, то t a =1,8595.

Значение U=6,804 (рис. 2.58).

Рис. 2.58. Величина доверительного интервала

Для расчета верхней и нижней границ прогноза соответственно вводим в ячейки С42 и С43 формулы, как показано на следующем рис. 2.59.

Рис. 2.59. Формулы для расчета границ прогноза

Верхняя граница прогноза равна 19,81 тыс. руб., нижняя – 6,20 тыс. руб. (рис. 2.60).

Рис. 2.60. Значения границ прогноза

График исходных данных и результаты моделирования приведены на рис. 2.61.

Рис. 2.61. График модели парной регрессии

Для вычисления параметров модели можно было также использовать встроенные статистические функции, такие как НАКЛОН, ОТРЕЗОК, ЛИНЕЙН, СТОШУХ и др.

Функция НАКЛОН вычисляет наклон линии регрессии, в нашем примере это параметр а 1 .

Функция ОТРЕЗОК вычисляет параметр а 0 .

Функция ЛИНЕЙН одновременно вычисляет оба эти параметра. Перед вводом функции необходимо выделить диапазон ответов (две ячейки), а после заполнения аргументов функции нажать комбинацию клавиш Ctrl+Shift+Enter .

Функция СТОШУХ вычисляет стандартную ошибку, в нашем примере это величина S y .

Диалоговое окно встроенной статистической функции НАКЛОН с введенными аргументами показано на рис. 2.62.


Рис. 2.62. Встроенная статистическая функция НАКЛОН

Диалоговое окно встроенной статистической функции ОТРЕЗОК с введенными аргументами показано на рис. 2.63.


Рис. 2.63. Встроенная статистическая функции ОТРЕЗОК

Диалоговое окно встроенной статистической функции ЛИНЕЙН с введенными аргументами показано на рис. 2.64.


Рис. 2.64. Встроенная статистическая функция ЛИНЕЙН

Диалоговое окно встроенной статистической функции СТОШУХ с введенными аргументами показано на рис. 2.65.


Рис. 2.65. Встроенная статистическая функция СТОШУХ

Результат вычислений по встроенным статистическим функциям показан на рис. 2.65.


Рис. 2.66. Результат вычислений по встроенным статистическим функциям

Методы прогнозирования временных рядов

Для математических методов прогнозирования характерен подбор и обоснование математической модели исследуемого процесса, а также способ определения ее неизвестных параметров. Среди математических методов выделяют методы экстраполяции ввиду их простоты. Методологическая предпосылка экстраполяции состоит в признании преимущественной связи между прошлым, настоящим и будущим.

В настоящее время разработана большая группа экстраполяционных методов прогнозирования временных рядов:

1) Методы, основанные на построении корреляционно-регрессионных моделей. При этом строится модель, включающая набор переменных, от которых зависит поведение функции. Прогноз отличается невысокой точностью, используется при прогнозировании показателей конкретных объектов.

y t = a 0 + a 1 y t -1 + …..+ a n y t-n .

3) Методы, основанные на разложении временного ряда на компоненты – главная тенденция, сезонные колебания, случайная составляющая.

4) Методы, позволяющие учесть неравнозначность исходных данных: метод авторегрессии с последующей адаптацией коэффициентов уравнения, метод взвешенных отклонений.

5) Метод прямой экстраполяции, при котором используются различные трендовые модели. Такие модели используются для краткосрочного прогнозирования временных рядов, например, на небольшое число шагов и т.д.

Построение и анализ коррелограммы позволяет оценить характер и тенденцию изменения во времени прогнозируемого процесса. Если анализируемый ряд имеет тренд и колебания вокруг него или существует явная зависимость между прошлым и будущим ряда (рис.1), коррелограмма при тенденции анализируемого ряда к росту будет отражать убывание положительных коэффициентов корреляции с увеличением временного сдвига

-0,4
-0,2
0,2
0,4
0,6
0,8

Рисунок 2 - Автокорреляционная функция процесса

Если убывание автокорреляционной функции быстрое, носит экспоненциальный характер, то такие ряды имеют «кратковременную память» и могут быть описаны более сложными моделями автокорреляции – скользящего среднего (модели Бокса- Дженкинса). Более сложным случаем является колебательный затухающий характер корреляционной функции (рис. 2).

Наиболее часто используются простейшие алгоритмы прогнозирования:

По среднему абсолютному приросту при линейной тенденции развития показателя во времени;

По среднему темпу роста, когда тенденция ряда характеризуется показательной кривой;

Аналитическим описанием линии тренда, когда на показатель оказывают влияние множество факторов, и ее рассматривают в виде временной функции;

По корреляционным связям между показателями ряда на ограниченном по времени интервале наблюдения;

По среднему уровню ряда динамики в случае стационарного характера изменения во времени анализируемого показателя и др.

Алгоритм выбирается по характеру линии тренда:

Прогнозирование по среднему абсолютному приросту проводится по формуле:

у пр = у + (Dу)t ;

Прогнозирование по среднему темпу роста Т р:

у пр = уТ р t ,

Прогнозирование средним значением уровня ряда у ср:

у пр = у ср,

4 января 2011 в 21:36

Прогнозирование временных рядов

  • Алгоритмы

Привет.
Я хочу рассказать об одной задаче, которая очень заинтересовала меня в свое время, а именно, о задаче прогнозирования временных рядов и решении этой задачи методом муравьиного алгоритма.

Для начала вкратце о задаче и о самом алгоритме:

Прогнозирование временных рядов подразумевает, что известно значение некой функции в первых n точках временного ряда. Используя эту информацию необходимо спрогнозировать значение в n+1 точке временного ряда. Существует множество различных методов прогнозирования, но на сегодняшний день одними из самых распространенных являются метод Винтерса и ARIMA модель. Подробнее о них можно почитать .

О том что такое муравьиный алгоритм говорилось уже довольно много. Для тех кому лень лезть, например, сюда , перескажу. Вкратце, муравьиный алгоритм это моделирование поведения муравьиной колонии в их стремлении найти кратчайший путь к источнику еды. Муравьи, при движении оставляют за собой след феромона, который влияет на вероятность выбора муравьем данного пути. Учитывая то, что муравьи будут за один и тот же промежуток времени пройти короткий путь бОльшее количество раз, на нем будет оставаться больше феромона. Таким образом, с течением времени, все больше муравьев будут выбирать кратчайший путь к источнику пищи.
Для наглядности, вставлю картинку:

Теперь, перейдем непосредственно к решению задачи прогнозирования методом муравьиных колоний.
Первая проблема с которой мы сталкиваемся - необходимо представить временной ряд в виде графа, на котором будем запускать муравьиный алгоритм.
Было найдено два возможных решения:
1. Представить временной ряд в виде мультиграфа где из каждой точки временного ряда можно перейти в каждую набором определенных приростов. (Для облегчения задачи будем брать нормализованные значения на промежутке от -1 до 1). Это был первый подход, который мы попробовали. Он показал неплохой результат на временных рядах малой размерности, но с увеличением размерности стала резко падать как точность прогноза, так и производительность, поэтому от этого варианта отказались.
2. Представить временной ряд в виде набора сцепленых графов, где каждый граф отвечает за свою величину прироста значения временного ряда. иначе говоря, имеем граф который отвечает за прирост -1, -0,9… и так до 1. Шаг, естественно, можно уменьшить, или увеличить, что скажется на точности прогноза и ресурсоемкости задачи.(в конечном итоге этот вариант оказался наиболее удачным.)

На этом наборе сцепленных графов, запускался муравьиный алгоритм(на каждом графе свой), который откладывал феромон на ребрах, соответствующих известным значениям временного ряда. Причем, при откладывании феромона на графе i, феромон также откладывался на графах i-1и i+1, но в гораздо меньшем количестве(в нашем случае 1/10 от базового количества феромона) таким образом, муравьи выделяли наиболее часто встречающиеся последовательности прироста значения временного ряда, а за счет откладывания феромона на смежные графы, нивелировалась возможная погрешность и изначальная зашумленность временного ряда.

Данный алгоритм мы тестировали на искусственно подготовленных временных рядах с разным уровнем периодичности и шума. Результат получился двояким. С одной стороны, при уровнях шума до 0,3 алгоритм показывает высокие результаты прогноза, сравнимые с результатами ARIMA модели. На более высоких уровнях шума возникает большой разброс результатов: прогноз то очень точный, то совершенно неправильный.

В настоящий момент мы работаем над подбором оптимального значения параметров алгоритма и некоторыми методами его улучшения, о которых я напишу как только они будут в достаточной степени проверены.

Спасибо всем за внимание.

Upd: Постараюсь ответить на возникшие вопросы.
Мультиграф - это граф, каждая вершина которого соединена с каждой.

Хаотические ряды, как уже писали ниже, не случайны. Вы можете посмотреть на изображения ряда Лоренца в 3-х мерном пространстве и увидите цикличность движения. Просто определить эту цикличность сложно, и на первый взгляд ряд выглядит случайным.

Значения временного ряда нормализуются на промежутке -1...1 и записываются в граф. Граф - в данном случае таблица переходов из вершины в вершину. Феромон откладывается на ребра(в ячейки таблицы).

В случае со сцепленными графами используется несколько таблиц, каждая из которых отвечает только за свою величину перехода.

В зависимости от количества феромона в той, или иной ячейке, выбирается то, или иное значение временного ряда, как результат прогноза.

Алгоритм тестировали, преимущественно, на ряде Лоренца.

На данный момент рано говорить о том насколько он лучше или хуже. Похоже, что алгоритм подвержен нахождению псевдопериодов и с ростом уровня шума количество ложных периодов возрастает.
С другой стороны, при удачно подборе параметров точность прогноза достаточно высокая(отклонение до 7-10 процентов, что для хаотического ряда неплохо.)

К тестированию на реальных данным перейдем позже. Картинки постараюсь подготовить и добавить в ближайшее время.

Спасибо за внимание.

Международный консорциум «Электронный университет»

Московский государственный университет экономики, статистики и информатики

Евразийский открытый институт

Н. А. Садовникова Р. А. Шмойлова

Анализ временных рядов и прогнозирование

Учебное пособие Руководство по изучению дисциплины

Практикум

Тесты Учебная программа

Москва 2004

С 143

Садовникова Н. А., Шмойлова Р.А. АНАЛИЗ ВРЕМЕННЫХ РЯДОВ И ПРОГ-

НОЗИРОВАНИЕ. Вып. 2: Учебное пособие, руководство по изучению дисциплины, практикум, тесты, учебная программа / Московский государственный университет экономики, статистики и информатики. - М., 2004. - 200 с.

1.1. Система статистических понятий и категорий, применяемых в моделировании и прогнозировании социально-экономических

явлений и процессов...............................................................................................

1.2. Модель как отображение действительности........................................................

1.3. Понятие и основные принципы экономико-статистического анализа..............

1.4. Характеристика информационной базы и основные принципы

ее формирования.....................................................................................................

РАЗДЕЛ II. Моделирование динамики социально-экономических явлений

2.1. Временные ряды, их характеристики и задачи анализа.

Требования к исходной информации. ..................................................................

2.2. Основные особенности статистического анализа одномерных

временных рядов по компонентам ряда. ..............................................................

Моделирование тенденции....................................................................................

Выбор формы тренда..............................................................................................

Моделирование случайного компонента.............................................................

Модели периодических колебаний.......................................................................

2.7. Модели связных временных рядов.......................................................................

КОНТРОЛЬНЫЕ ВОПРОСЫ К РАЗДЕЛУ II.....................................................................

РАЗДЕЛ III. Прогнозирование динамики социально-экономических явлений

и процессов....................................................................................................

3.1. Сущность и классификация статистических прогнозов.....................................

Простейшие методы прогнозирования.................................................................

3.3. Прогнозирование на основе экстраполяции тренда............................................

3.4. Прогнозирование с учетом дисконтирования информации...............................

3.5. Прогнозирование на основе кривых роста...........................................................

3.6. Прогнозирование рядов динамики, не имеющих тенденции.............................

3.7. Оценка точности и надежности прогнозов..........................................................

КОНТРОЛЬНЫЕ ВОПРОСЫ К РАЗДЕЛУ III ...................................................................

ТЕСТЫ ДЛЯ САМОПРОВЕРКИ.........................................................................................

КОНТРОЛЬНАЯ РАБОТА...................................................................................................

Приложения к контрольной работе.....................................................................................

ГЛОССАРИЙ.........................................................................................................................

Заключение.............................................................................................................................

Приложения............................................................................................................................

РУКОВОДСТВО ПО ИЗУЧЕНИЮ ДИСЦИПЛИНЫ.................................................

ПРАКТИКУМ.......................................................................................................................

ТЕСТЫ..................................................................................................................................

УЧЕБНАЯ ПРОГРАММА.................................................................................................

Учебное пособие

ВВЕДЕНИЕ

Введение

Развитие и повышение социально-экономического статуса и положения страны выдвигает на первый план задачу анализа и перспектив развития субъектов рыночных отношений на различных иерархических уровнях управления с целью выбора оптимальных управленческих решений, направленных на повышение эффективности и деловой активности их функционирования.

В этой связи возрастает роль методологии статистического моделирования и прогнозирования состояния, структуры и основных тенденций развития субъектов рыночных отношений вне зависимости от отраслевой принадлежности, форм собственности и внутренней структурной градации.

Учебное пособие «Анализ временных рядов и прогнозирование» включает в себя комплексную методологию моделирования и прогнозирования динамической информации, представленнойвременными рядами социально-экономических явлений и процессов.

В пособии нашло отражение обобщение отечественного и зарубежного опыта использования математико-статистических методов моделирования и прогнозирования со- циально-экономических явлений и процессов.

Важнейшая задача прогнозирования явлений и процессов - выявление закономерностей и установление основных тенденций развития. Для анализа общих тенденций не целесообразно рассматривать каждый случай в отдельности. Чем больше по числу единиц статистическая совокупность, тем, при прочих равных условиях, качественнее проявляется закономерность, присущая изучаемому явлению или процессу.

Устойчивые пропорции в экономических явлениях и процессах проявляются при действии закона больших чисел.

Моделирование и прогнозирование позволяют управлять массовыми экономическими явлениями и процессами и предвидеть их развитие.

Для моделирования и прогнозирования социально-экономических явлений и процессов решающее значение имеет принцип взаимной связи и взаимной обусловленности явлений. Для того, чтобы глубоко понять явление, необходимо изучить внешние и внутренние причинные взаимосвязи, познать конкретное состояние и условия его возникновения и существования.

Общественные явления находятся не только во взаимной связи, но и в непрерывном движении, изменении, развитии - именно это обусловливает необходимость прогнозирования.

Предметом моделирования и прогнозирования в сфере бизнеса является система, воспроизводящая объект исследования так, что на ее основе могут быть изучены структура и размещение социально-экономических явлений, их изменения во времени, связи и зависимости.

При моделировании объект, интересующий исследователя, заменяется некоторым другим объектом, который называется моделью.

Каковы же объективные основания замены одного объекта другим?

Предметы материального мира - целостные системы свойств, связей, отношений, процессов. Закономерная связь элементов является объективной основой моделирования и прогнозирования.

Элементы включены в совокупности не случайно, а закономерно координированы друг с другом, и, если два объекта сходны в каком-то существенном отношении, то они будут сходны и в другом отношении. Отсюда следует, что объектом моделирования и прогнозирования в сфере бизнеса являются статистические совокупности, их численность.

ВВЕДЕНИЕ

РАЗДЕЛ I. Теоретико-методологические аспекты моделирования явлений и процессов в сфере бизнеса

1. 1. Система статистических понятий и категорий, применяемых в моделировании и прогнозировании социально-экономических явлений и процессов

Моделирование и прогнозирование явлений и процессов предполагает использование системы статистических понятий, категорий и методов, трактовка которых углубляется в соответствии с их статистическими особенностями.

К важнейшим понятиям и категориям относится статистическая совокупность, статистическая закономерность, закон больших чисел, статистическая взаимосвязь, а также такие философские категории как качество и количество, мера, явление и сущность, единичное и всеобщее, случайное и необходимое.

Важнейшими методами, используемыми при моделировании социально-экономи- ческих явлений, являются методы статистического наблюдения, группировок, обобщающих показателей, корреляционного и регрессионного анализа и так далее.

Статистическая закономерность выражает конкретные казуальные отношения, она предопределяет типичное распределение единиц статистической совокупности на некоторый моментвремениподвоздействиемвсейсовокупностифакторов.

Условиями ее проявления являются: наличие статистической совокупности и действие закона больших чисел.

Зная статистическую закономерность, можно выявить условия и причины, порождающие ее, для того, чтобы направлять ее действия в заданное «русло», то есть либо поддерживать эти условия для ее устойчивости во времени, либо, меняя их, стремиться получить нужный результат.

Зная статистическую закономерность, можно с той или иной степенью точности предсказать развитие явления, раскрыть сущность и изучить его структуру.

Под статистической совокупностью (множеством) понимается множество единиц, обладающих массовостью, однородностью, определенной целостностью, взаимозависимостью состояний отдельных единиц и наличием вариации.

Статистические совокупности состоят из элементов, единиц совокупности, которые являются носителем свойств изучаемого явления или процесса.

Признаки бывают существенные и несущественные, прямые и косвенные, атрибутивные и количественные, первичные и вторичные, факторные и результативные, альтернативные.

Классификация статистических признаков имеет важное значение для построения статистических моделей и осуществления прогноза. Так, при моделировании в ряде случаев важно правильно выделить факторные и результативные признаки. Среди факторных признаков необходимо отбирать лишь самые существенные, определяющие основное содержание явлений.

Закон больших чисел выявляет устойчивые пропорции и соотношения в экономических явлениях и процессах. Он служит основой для моделирования процессов, создает возможность управлять ими и предвидеть их развитие.

Закон больших чисел определяет общее, существенное в явлениях, в их массе единиц, благодаря чему происходит взаимоотношение индивидуальных случайных различий.

Итак, моделирование - воспроизведение свойств исследуемого объекта в специально построенной модели. Для этой цели используются такие статистические методы

ГЛАВА I. ТЕОРЕТИКО-МЕТОДОЛОГИЧЕСКИЕ АСПЕКТЫ МОДЕЛИРОВАНИЯ ЯВЛЕНИЙ И ПРОЦЕССОВ В СФЕРЕ БИЗНЕСА

как статистическое наблюдение, метод группировок, обобщающих показателей, корреляционный и регрессионный анализ.

С помощью статистического наблюдения и социального эксперимента получают исходную информацию для моделирования и прогнозирования.

Метод группировок устанавливает наличие и направление связи между факторными и результативными признаками. Для объективных заключений о связи необходимо предварительно определить границу, за пределами которой влияние группировочного признака отсутствует.

На основе регрессионного и корреляционного анализа связи получают свое аналитическое выражение, устанавливается теснота связей между факторными и результативными признаками.

Значимость корреляционных характеристик определяется объективными особенностями исследуемой совокупности, а показатели регрессии и корреляции вычисляются как средние величины для совокупности в целом.

1.2. Модель как отображение действительности

Наши представления об окружающей действительности по природе своей являются приближенными копиями объективной реальности.

Термин «модель» отражает как раз эту условность, приблизительность знания об объективной действительности.

Что же такое модель?

В «Философском словаре» дается следующее определение: « Моделирование - воспроизведение свойств исследуемого объекта на специально построенном по определенным правилам аналоге его. Этот аналог называется моделью».

В «Философской энциклопедии» говорится: « Модель - условный образ (изображение, схема, описание) какого-либо объекта (или системы объектов) служит для выражения отношения между человеческими знаниями об объектах и этими объектами».

Таким образом, под моделью понимается условный образ какого-либо объекта, приближенно воссоздающий этот объект. Между объектом и его моделью существуют отношения сходства, условности.

Модель дает возможность установить в каждом явлении, объекте, процессе те основные, главные закономерности, которые присущи этим явлениям.

Отношения объекта и модели устанавливаются на основе объективно присущих оригиналу и модели свойств и отношений.

Прежде всего между моделью и объектом существует отношение соответствия (сходства), которое и позволяет исследовать моделируемый объект посредством изучения модели.

Но модель используется и для получения таких данных об объекте, которые или затруднительно, или невозможно получить путем непосредственного изучения оригинала. Для того, чтобы модель могла выполнить эту задачу, она должна быть не только сходной с оригиналом, но иотличаться от него. Отличие от оригинала - обязательный признак модели.

В процессе моделирования от установления отношений сходства между одними элементами модели и оригинала переходим к установлению отношений сходства между другими элементами оригинала и модели. Именно наличие такого перехода дает возможность получить новые данные об оригинале, о его свойствах, связях и отношениях.

Возможны два направления в моделировании.

ГЛАВА I. ТЕОРЕТИКО-МЕТОДОЛОГИЧЕСКИЕ АСПЕКТЫ МОДЕЛИРОВАНИЯ ЯВЛЕНИЙ И ПРОЦЕССОВ В СФЕРЕ БИЗНЕСА

Одно из направлений охватывает множество задач, в которых основное внимание уделено отысканию оптимальных характеристик процесса.

В качестве таких моделей часто выступают модели линейного программирования. Эти модели часто называют экономико-математическими , поскольку их применение связано главным образом с моделированием функциональных зависимостей.

Сущность статистического моделирования состоит в построении для данного явления модели, на основании которой изучается поведение элементов системы и взаимодействие между ними с учетом многих, имеющих случайный характер, факторов. Данное направление включает всебя корреляционный анализ, изучение законов распределения и другие.

Модели, выражающие количественно закономерность, которая проявляется в массе событий, называют экономико-статистическими моделями .

Повышенный интерес, проявляемый в последние годы к статистическим моделям, обусловлен наличием электронно-вычислительных машин, позволяющих обрабатывать большие массивы информации.

Статистические модели можно подразделить на два типа: статистические и временные . В первом случае речь идет об исследовании статистической совокупности. Единицей наблюдения здесь служат отдельные единицы пространственной совокупности, а в качестве статистической информации используются их показатели по состоянию на определенный период времени.

Временная модель рассматривает процесс изменения явления во времени. В качестве единицы наблюдения здесь выступает время, а исходной информацией служат ряды динамики явления и определяющие его факторы.

По своим познавательным функциям статистические модели подразделяются на

структурные, динамические и модели взаимосвязей.

1.3. Понятие и основные принципы экономико-статистического анализа

Анализ и обобщение данных исследования - заключительный этап статистического исследования, конечной целью которого является получение теоретических выводов и практических заключений о тенденциях и закономерностях изучаемых социальноэкономических явлений и процессов.

Анализ - это метод научного исследования объекта путем рассмотрения его отдельных сторон и составных частей.

Экономико-статистический анализ - это разработка методики, основанной на широком применении традиционных статистических и математико-статистических методов с целью контроля адекватного отражения исследуемых явлений и процессов.

Задачами анализа являются: определение и оценка специфики и особенностей изучаемых явлений и процессов, изучение их структуры, взаимосвязей и закономерностей их развития.

В качестве этапов статистического анализа выделяются:

1) формулировка цели анализа;

2) критическая оценка данных;

3) сравнительная оценка и обеспечение сопоставимости данных;

4) формирование обобщающих показателей;

5) фиксация и обоснование существенных свойств, особенностей, сходств и различий, связей и закономерностей изучаемых явлений и процессов;

6) формулировка заключений, выводов и практических предложений о резервах и перспективах развития изучаемого явления.

Привет.
Я хочу рассказать об одной задаче, которая очень заинтересовала меня в свое время, а именно, о задаче прогнозирования временных рядов и решении этой задачи методом муравьиного алгоритма.

Для начала вкратце о задаче и о самом алгоритме:

Прогнозирование временных рядов подразумевает, что известно значение некой функции в первых n точках временного ряда. Используя эту информацию необходимо спрогнозировать значение в n+1 точке временного ряда. Существует множество различных методов прогнозирования, но на сегодняшний день одними из самых распространенных являются метод Винтерса и ARIMA модель. Подробнее о них можно почитать .

О том что такое муравьиный алгоритм говорилось уже довольно много. Для тех кому лень лезть, например, сюда , перескажу. Вкратце, муравьиный алгоритм это моделирование поведения муравьиной колонии в их стремлении найти кратчайший путь к источнику еды. Муравьи, при движении оставляют за собой след феромона, который влияет на вероятность выбора муравьем данного пути. Учитывая то, что муравьи будут за один и тот же промежуток времени пройти короткий путь бОльшее количество раз, на нем будет оставаться больше феромона. Таким образом, с течением времени, все больше муравьев будут выбирать кратчайший путь к источнику пищи.
Для наглядности, вставлю картинку:

Теперь, перейдем непосредственно к решению задачи прогнозирования методом муравьиных колоний.
Первая проблема с которой мы сталкиваемся - необходимо представить временной ряд в виде графа, на котором будем запускать муравьиный алгоритм.
Было найдено два возможных решения:
1. Представить временной ряд в виде мультиграфа где из каждой точки временного ряда можно перейти в каждую набором определенных приростов. (Для облегчения задачи будем брать нормализованные значения на промежутке от -1 до 1). Это был первый подход, который мы попробовали. Он показал неплохой результат на временных рядах малой размерности, но с увеличением размерности стала резко падать как точность прогноза, так и производительность, поэтому от этого варианта отказались.
2. Представить временной ряд в виде набора сцепленых графов, где каждый граф отвечает за свою величину прироста значения временного ряда. иначе говоря, имеем граф который отвечает за прирост -1, -0,9… и так до 1. Шаг, естественно, можно уменьшить, или увеличить, что скажется на точности прогноза и ресурсоемкости задачи.(в конечном итоге этот вариант оказался наиболее удачным.)

На этом наборе сцепленных графов, запускался муравьиный алгоритм(на каждом графе свой), который откладывал феромон на ребрах, соответствующих известным значениям временного ряда. Причем, при откладывании феромона на графе i, феромон также откладывался на графах i-1и i+1, но в гораздо меньшем количестве(в нашем случае 1/10 от базового количества феромона) таким образом, муравьи выделяли наиболее часто встречающиеся последовательности прироста значения временного ряда, а за счет откладывания феромона на смежные графы, нивелировалась возможная погрешность и изначальная зашумленность временного ряда.

Данный алгоритм мы тестировали на искусственно подготовленных временных рядах с разным уровнем периодичности и шума. Результат получился двояким. С одной стороны, при уровнях шума до 0,3 алгоритм показывает высокие результаты прогноза, сравнимые с результатами ARIMA модели. На более высоких уровнях шума возникает большой разброс результатов: прогноз то очень точный, то совершенно неправильный.

В настоящий момент мы работаем над подбором оптимального значения параметров алгоритма и некоторыми методами его улучшения, о которых я напишу как только они будут в достаточной степени проверены.

Спасибо всем за внимание.

Upd: Постараюсь ответить на возникшие вопросы.
Мультиграф - это граф, каждая вершина которого соединена с каждой.

Хаотические ряды, как уже писали ниже, не случайны. Вы можете посмотреть на изображения ряда Лоренца в 3-х мерном пространстве и увидите цикличность движения. Просто определить эту цикличность сложно, и на первый взгляд ряд выглядит случайным.

Значения временного ряда нормализуются на промежутке -1...1 и записываются в граф. Граф - в данном случае таблица переходов из вершины в вершину. Феромон откладывается на ребра(в ячейки таблицы).

В случае со сцепленными графами используется несколько таблиц, каждая из которых отвечает только за свою величину перехода.

В зависимости от количества феромона в той, или иной ячейке, выбирается то, или иное значение временного ряда, как результат прогноза.

Алгоритм тестировали, преимущественно, на ряде Лоренца.

На данный момент рано говорить о том насколько он лучше или хуже. Похоже, что алгоритм подвержен нахождению псевдопериодов и с ростом уровня шума количество ложных периодов возрастает.
С другой стороны, при удачно подборе параметров точность прогноза достаточно высокая(отклонение до 7-10 процентов, что для хаотического ряда неплохо.)

К тестированию на реальных данным перейдем позже. Картинки постараюсь подготовить и добавить в ближайшее время.

Спасибо за внимание.