Доклад
по
Софтуер за анализ на времеви редове
Дата: 19.06.2016г.
1
Съдържание:
1.
Увод …………………………………………………………………………… 3стр.
2.
Същност и аспекти на статистическия анализ на динамика……………….. 4стр.
3.
Анализ на компонентите на времевите редове……………………………… 6стр.
3.1.
Анализ на тенденцията на развитие……………………………………… 6стр.
3.2.
Анализ на сезонния компонент…………………………………………....7стр.
3.3.
Адаптивни методи и модели за прогнозиране……………………………8стр.
3.3.1.
Експоненциално изглаждане………………………………………8стр.
3.3.2.
ARIMA модели……………………………………………………...9стр.
4.
Представяне на трендови модели – работа с SPSS…………………………..10стр.
4.1.
Прогнозиране тенденцията на развитие при ред, съдържащ тренд и случаен
компонент…………………………………………………………………...10стр.
4.2.
Прогнозиране тенденцията на развитие при ред, съдържащ тренд, случаен и
сезонен компонент…………………………………………………………..14стр.
5.
Представяне на адаптивни методи и модели за прогнозиране – работа с SPSS
5.1.
Експоненциално изглаждане……………………………………………….19стр.
5.1.1.
Прогнозиране на тенденцията на развитие при ред, съдържащ тренд и
случаен компонент………………………………………………….19стр.
5.1.2.
Прогнозиране на тенденцията на развитие при ред, съдържащ тренд,
случаен и сезонен компонент………………………………………22стр.
5.2.
ARIMA модел……………………………………………………………..... 26стр.
5.2.1.
Прогнозиране на тенденцията на развитие при ред, съдържащ тренд и
случаен компонент……………………………………………….... 26стр.
2
5.2.2.
Прогнозиране на тенденцията на развитие при ред, съдържащ тренд,
случаен и сезонен компонент……………………………………. . 28стр.
6.
Сравняване на прогнози, получени при трендовата прогноза, експоненциалното
изглаждане и ARIMA модел………………………………………………….. 31стр.
7.
Източници……………………………………………………………………… 32стр.
1.Увод:
SPSS
е програма за обработка и анализ на данни от социални и маркетингови
проучвания. Програмата позволява :
• сравнително лесно да се получават агрегирани разпределения на стойностите на
дадена променлива, като заедно с тях се извеждат и повечето статистически показатели,
характеризиращи тези разпределения;
• възможност масивът от данни да бъде модифициран и преструктуриран;
• възможност масивът от данни да бъде обобщаван в разрез по всяка
една от променливите в него;
• възможност сравнително лесно да се прилагат сложни методи на
статистически анализ на динамика
В настоящата курсова работа ще се илюстрира степента на усвояване на съответния
софтуерен продукт и възможностите, които предоставя програмата, с помощта на
задачи и изведени решения. Програмата е лесно приложима и предлага редактор на
данни, редактиране на резултата, многомерни таблици, графики с добра резолюция,
достъп до бази данни, трансформации на данни, онлайн помощ и команден език.
Решените задачи са представени чрез данни, изтеглени от информационна система
ИНФОСТАТ
на
НСИ
. Те са
времеви редове на отработени човекочасове на заетите
лица при финансовите и застрахователните дейности, които са представени в период
от 1995г. до 2015г. – съответно по годишни и тримесечни данни.
3
2.Същност и аспекти на статистическия анализ на динамика:
Динамичните статистически редове
са информационна база за осъществяване на
анализа на динамиката. Те са подредени в хронологична последователност
статистически величини, които изразяват изменението в дадено явление, настъпващо с
течение на времето.
Анализът на времеви редове включва пет ключови момента:
1)
Построяване на графиката на времевия ред;
2)
Описание на времевия ред с помощта на елементарни показатели за развитие
(динамика). Това са абсолютен обем, абсолютен прираст, темп на растеж, темп
на прираст, среден темп на растеж, среден темп на прираст и т.н.
3)
Изследване на основните компоненти във времевия ред. Компонентите, които
могат да се съдържат: тренд, сезонност, цикличност, случаен компонент;
4)
Изследване на зависимости при времеви редове;
5)
Прогнозиране на времеви редове;
Задачи на статистическия анализ на динамика:
да се установи и анализира изменението, респ. развитието, което настъпва в дадено
явление с течение на времето;
да се разработи прогноза за бъдещето развитие на дадено изследвано явление;
Елементи на динамичните редове:
А) Заглавие
Б) Основание – групи, обособени на базата на отрязъци от време
4
В) Членове – статистически величини, които изразяват обем на съвкупност или сводна
характеристика за съвкупността
Видове динамични редове:
В зависимост от отрязъка от време, който е в ролята на основание на реда, те
биват:
• Моментни: в ролята на основание на реда са моменти от времето. Например: срочни
депозити на населението на България към 31.12. през периода 2000 – 2015г.
• Периодни – в ролята на основание на реда са периоди от времето (години). Например:
отработени човекочасове на заетите лица при финансовите и застрахователните
дейности за период 1995 – 2015г. ( темата на курсовата работа ).
В зависимост от това дали динамичните редове съдържат, или не съдържат
тенденция на развитие, биват:
•
Стационарни
– не съдържат тенденция на развитие;
•
Нестационарни
– съдържат тенденция на развитие;
• Динамичните статистически редове, характеризиращи развитието на явленията във
икономиката, преобладаващо са еволюционни. Еволюционните редове биват
регресивни, съдържат тенденция на намаление и прогресивни, които съдържат
тенденция на нарастване.
В настоящата курсова работа се работи с динамични редове.
Изисквания за построяване на времеви редове:
А) съпоставимост по време;
Б) съпоставимост по място;
В) съпоставимост по обхват;
Г) съпоставимост в методологията;
Д) съпоставимост по отношение на мярката;
Компоненти на развитие:
Развитието е резултат от различни по характер причини. Въпреки тяхното многообразие
те се обособяват в четири основни групи:
- Тренд (Т): трайно действуващи причини, които не променят силата и посоката си на
въздействие;
- сезонен компонент (S): трайно действуващи причини, които променят силата и
посоката си на въздействие със смяната на годишните времена;
- Цикличен (C): трайно действуващи причини, които променят своята сила и посока на
въздействие през определен период от време, обикновено включващ няколко години;
- Случайни причини (
ε )
: те имат временен характер;
5
Модели (връзки):
Адитивен:
Y= T+S+C+ε
Този модел е сума на компонентите на времевия ред;
Мултипликативен:
Y=
T*S*C*ε
Този модел е съставен като произведение на компонентите;
Смесен:
Y= T * S * C + ε
3.Анализ на компонентите на времевите редове:
Построяването на различните модели се извършва чрез разделяне на компонентите.
Операцията се нарича декомпозиция на времеви ред. Съответно декомпозицията зависи
от модела.
Анализът на отделните компоненти се извършва в реда:
1)
Анализ на тенденцията на развитие;
2)
Анализ на сезонния компонент;
3)
Анализ на цикличния компонент – в настоящата курсова работа този компонент
не представлява интерес и няма да бъде изследван;
4)
Анализ на случайния компонент;
5)
Изследването на всеки отделен компонент на развитие се осъществява на
принципа на елиминирането на останалите;
3.1.Анализ тенденцията на развитие
Моделиране тенденцията на развитие:
Тенденцията на развитие е основният компонент, включващ всички систематични
елементи на изменението на изследваното явление или процес. Чрез изучаването и
моделирането на тенденцията на развитие се описват закономерностите в динамиката
на явленията в областта на бизнеса. Статистическите методи за изучаване на тренда се
основават на допускането, че общото развитие може да се представи като проста сума
от съставните му компоненти. Моделирането на тренда съответства на хипотезата, че
при формирането на анализираното явление са действали само съществени
закономерни причини, т.е. елиминира се влиянието на случайните и сезонните фактори.
6
За моделирането на тенденцията на развитие се използват т.нар. методи за изглаждане
на временни статистически редове.
Критерии за наличието на тренд:
1)
На основата на графичния образ може да се направи предположение за
наличието или отсъствието на тренд. За целта се използва линейната диаграма
на развитието, на абсцисната ос на която се нанасят времевите поделения, а на
ординатната ос – достигнатите равнища или обеми. В практиката в областта на
бизнес анализите се срещат и такива явления, при които тенденцията на
развитие не е ясно очертана. В тези случаи е целесъобразно да се използват
специфични критерии за проверка наличието на тренд.
2)
По-точни измерители за наличието или отсъствието на тренд са коефциентите на
Кендел, Спирман и коефициент на автокорелация от първи порядък. В
настоящия доклад, в който се използва статистическия софтуер SPSS, ще се
покаже как се извежда автокорелационната функция, която показва графично
автокорелационните коефициенти. Наличието или отсъствието на тренд се
установява от първия автокорелационен стълб – ако той излиза извън интервала
на доверителност, следователно се доказва наличието на тренд и обратно – ако
първият автокорелационен стълб е под интервала на доверителност, то се
доказва, че няма тренд.
Избор на най-добър модел:
Обикновено изборът на най-добър модел се основава на коефициента на детерминация
(
)
R2
–
моделът с най-висока стойност на този коефициент се избира за най-подходящ.
В SPSS изборът на най-добър модел следва следните няколко момента:
Определят се кои модели са адекватни – или тези, при които равнището на значимост
SIG е по-малко от алфа (0,05);
Измежду адекватните модели се избира този с най-голяма стойност на коефициента
на детерминация;
Неговата стойност се сравнява с тази на линейната функция и ако разликата между
тях е по-малка от 0,1, за най-добър модел се избира линейният или ако разликата е по-
голяма от 0,1, за най-добър се избира този модел с най-голяма стойност на коефициента
на детерминация. Това се прави, защото линейният модел е по-прост модел и има
висока обяснителна способност.
3.2. Анализ на сезонния компонент
7
Определение:
Сезонните колебания са периодично повтарящи се вътрешно годишни
колебания с относително постоянна амплитуда и ширина на сезонната вълна.
В разлагането на динамичния ред на компоненти, сезонните колебания се изразяват
чрез сезонния компонент. Той се установява на база месечни, тримесечни данни или
седмични и дневни.
От графиката на реда може да се определи вида на връзката между компонентите – ако
амплитудата е променяща се, моделът е мултипликативен, но ако амплитудата е
относително постоянна и не се променя, то връзката е адитивна.
Наличието или отсъствието на сезонността и тук се установява чрез
автокорелационната функция, но тук се гледа автокорелационния стълб, който съвпада с
периодичността на реда – ако стълбът е над доверителния интервал – то има сезонност
и обратно – ако стълбът е под доверителния интервал, не се доказва наличието на
сезонен компонент.
Методи за изследване на сезонния компонент:
•
Метод на простите средни – използва се, когато в реда не е изразен тренд
• Метод на отношения на фактическите към изгладените стойности ( МОФИС ), който
се прилага за редове, при които е установено наличието на тренд, сезонен компонент и
случаен. Прилага се, за да се установи количествено сезонния компонент. В SPSS е
записан като Seasonal Decomposition и разграничава количествено трите компонента –
тренд, сезонност и случаен компонент.
При прогнозата се спазва следната последователност:
1)
Извършване на декомпозиция на изследвания ред;
2)
Моделиране на тренда на реда след направената декомпозиция и спрямо него да
се направи прогноза за съответен период, която ще съдържа само тренд;
3)
Получената прогноза да се умножи по сезонния фактор;
3.3. Адаптивни методи и модели за прогнозиране
В доклада ще се разгледат освен трендовите модели, също и експоненциалното
изглаждане и ARIMA модели.
3.3.1. Експоненциално изглаждане:
•
Същността на метода на експоненциалното изглаждане се корени в един по-прост
метод за прогнозиране, чието развитие води до експоненциално изглаждане. Това е
методът на плъзгащите се средни;
8
• При формирането на прогнозата най-голямо тегло се дава на предходното наблюдение
и колкото по-отдалечено е наблюдението, толкова е по-малко теглото, като самите тегла
намаляват експоненциално;
• Прогнозата по този метод се влияе най-силно от параметъра
а
– колкото по-голяма
стойност има
а
( по-близо до 1 ), толкова по-голяма тежест се придава на последните
наблюдения на времевия ред и обратно – колкото е по-близо до 0, толкова по-голяма
тежест се придава на първите членове на времевия ред.
• В SPSS се проиграват модели, когато
а
= 0; 0,1; 0,2 – докато се стигне до 1.
Изборът на най-добър модел става като:
-
Проиграват се всички стойности на параметрите;
-
За най-добър се избира този с най-малка грешка;
-
Грешките на модела могат да бъдат: абсолютна, стандартна грешка, коефициент
на детерминация, коефициент на Акайке и коефциент на Шварц. За избора на
най-добър модел ще се използва коефициента на Шварц – моделът с най-ниска
стойност на този коефициент. Друг критерий може да бъде и коефициента на
детерминация – при него моделът е най-добър, когато този коефициент е с най-
висока стойност. За най-прецизен се посочва коефициента на Шварц, защото
държи сметка за броя на параметрите в модела.
• При времеви редове, които съдържат тренд - експоненциално изглаждане моделът е с
два параметъра – алфа и гама, като и двата параметъра се променят от 0 до 1 и вторият
от тях (гама) е пряко свързан с тренда. Методът е известен като метод на
Holt.
• Когато в един времеви ред има тренд и сезонност, експоненциалното изглаждане има 3
параметъра (алфа, гама и делта). Като делта е свързан със сезонността. Проиграват се
всички модели със стойности на трите параметъра от 0 до 1 и се избира най-добър. Този
метод е известен като метод на
Winter`s
и има 2 разновидности – адитивен и
мултипликативен.
3.3.2. ARIMA модели:
Те спадат към групата на така наречените адаптивни модели. Известни са още като
модели на Дженкинс и Бокс. Тези модели са специално разработени за прогнозиране.
• Моделът се състои от две части – авторегресионна част и плъзгащи се средни;
• Кратък начин за записване на модела – ARMA (p, q), важи само за стационарни
времеви редове;
Първата задача е да се определят параметрите p и q, така че да изберем най-добрия
модел. Параметрите заемат стойности не по-големи от 2, което означава, че могат да
бъдат 0;1;2. При това положение всички възможни комбинации между p и q са осем,
защото ( 3
2
- 1 ). Проиграват се и по-определен критерий се избира най-добрият модел.
Това важи за стационарни времеви редове.
Когато редът е нестационарен, което се среща по-често, трябва спрямо него да се
направи някаква трансформация, която да го направи стационарен. Това са най-често
9
последователните разлики – правят се дотогава, докато редът стане стационарен. Така
моделът придобива следният вид: ARIMA (p, d, q) – където d са последователните
разлики, чрез които редът се превръща в стационарен. На практика d също приема
стойности не по-големи от 2. Тогава всички възможни модели са 3х3х3=27, но 0,0,0;
0,1,0; и 0,2,0 – няма, следователно възможните модели са 24. Проиграват се всички
модели и по критерия на Шварц се избира най-добрият и се прави прогноза. Това важи
за трендови времеви редове, но без сезонен компонент.
4.Представяне на трендови модели – работа с SPSS
4.1. Прогнозиране тенденцията на развитие при времеви ред, съдържащ тренд и
случаен компонент:
Задача:
Да се моделира тренда за отработени човекочасове на заетите лица при
финансовите и застрахователните дейности по години от 1995г. до 2015г. като се избере
най-добър модел. Да се тълкуват резултати от модела, ако е възможно. Да се направи
прогноза на този модел за следващите 3 години.
1)
Необходимо е данните да бъдат подготвени за обработка в софтуера SPSS. Това
става като:
• Създава се зависима променлива Y: брой отработени човекочасове за период 1995-
2015г.:
Variable View
Name: Y, Type: Numeric, Width: 8, Decimals: 1, Measure: Scale, след това
въвеждаме данните, които сме изтеглили предварително, в Data View.
• Необходимо е да се укаже на софтуера, че работим с времеви ред, за това:
Data
Define Dates
Years
оказваме първата година: 1995 и Okay
Създадени са две нови служебни променливи – Year и Date.
10
2)
Да се начертае графиката на модела и да се уточнят компонентите му:
Analyze
Forecasting
Create Models
Dependent variables: Y (отработени човекочасове), Independent variables: Years
Okay
Графиката показва, че:
• Няма сезонен компонент – данните са годишни;
• Не се наблюдава цикличност. Изискването е редът да е минимум 80;
• Наблюдава се възходящ тренд на развитие;
• Случаен компонент –
е
;
Извод:
Моделът е от вида: (Y) = f (T , ε)
3)
Необходима е проверка за наличието на тренд. Използва се първият
автокорелационен коефициент. За целта:
Analyze
Forecasting
Autocorrelations
11
Предмет: | Статистика, Икономика |
Тип: | Доклади |
Брой страници: | 35 |
Брой думи: | 5430 |
Брой символи: | 32325 |