Liukuva Keskiarvo Autoregressive Mallit


Autoregressiivinen liikkuvan keskimääräinen ARMA (p, q) - mallit aikasarjan analyysiin - osa 2 Osassa 1 pidettiin järjestyksen autoregressiivista mallia p, joka tunnetaan myös AR (p) - mallina. Esitimme sen satunnaisen kävelymallin laajennukseksi yritettäessä selittää lisää sarjakorjausta rahoitussarjoissa. Lopulta ymmärsimme, että se ei ollut riittävän joustava, jotta kaikki sulautumishinnat Amazon Inc: n (AMZN) ja SampP500 US Equity Index - indeksin sulautumishinnoista todella saataisiin. Ensisijainen syy tähän on se, että molemmat varat ovat ehdollisesti heteroskedastisia. mikä tarkoittaa, että ne eivät ole staattisia ja niillä on vaihtelevia varianssi - tai volatiilisuusklusterointijaksoja, joita AR (p) - malli ei ota huomioon. Tulevissa artikkeleissa voimme lopulta rakentaa autogressiivisen integroituneen liikkuvan keskiarvon (ARIMA) mallit sekä ARCH - ja GARCH-perheiden ehdollisesti heteroskedastiset mallit. Nämä mallit tarjoavat meille ensimmäiset realistiset yritykset varojen hintojen ennakoimiseksi. Tässä artikkelissa esitämme kuitenkin mallin q muuttuvan keskimääräisen keskiarvon, joka tunnetaan nimellä MA (q). Tämä on osa yleisempää ARMA-mallia ja sellaisenaan meidän on ymmärrettävä se ennen siirtymistä eteenpäin. Suosittelen, että luet aiemmat artikkelit Time Series Analysis-kokoelmasta, jos et ole niin tehnyt. Kaikki löytyy täältä. Muuttuva keskiarvo (MA) Tilausmallit q Moving Average - malli on samanlainen kuin Autoregressive-malli, paitsi että se on aikaisemman aikasarjan arvojen lineaarinen yhdistelmä, mutta se on lineaarinen yhdistelmä aikaisemmista valkoisista meluhaasteista. Intuitiivisesti tämä tarkoittaa sitä, että MA-malli näkee tällaisia ​​satunnaisia ​​valkoisen meluiskuja suoraan mallin jokaisessa nykyisessä arvossa. Tämä on ristiriidassa AR (p) - mallin kanssa, jossa valkoiset kohinasokit näkyvät vain epäsuorasti. kautta regressio edellisiin ehdoin sarjan. Tärkein ero on se, että MA-malli näkee koskaan vain viimeiset q-iskuja mille tahansa MA (q) - mallille, kun taas AR (p) - malli ottaa kaikki aikaisemmat häiriöt huomioon, vaikkakin heikosti heikolla tavalla. Määritelmä Matemaattisesti MA (q) on lineaarinen regressiomalli ja se on rakenteeltaan samanlainen kuin AR (p): Muuttuva keskimääräinen järjestysmalli q Aikasarjamalli on liikuteltava keskimääräinen q-järjestysmalli. MA (q), jos: Aloita xt wt beta1 w ldots betaq w pään Missä on valkoinen kohina E (wt) 0 ja varianssi sigma2. Jos katsomme Taaksepäin Vaihtotoimintaa. (ks. edellinen artikkeli), voimme kirjoittaa edellä olevan funktion phi: n: begin xt (1 beta1 beta2 2 ldots betaq q) wt phiq () wt end Käytämme phi-funktiota myöhemmissä artikkeleissa. Toisen tilaisuuden ominaisuudet Kuten AR (p), MA (q) - menetelmän keskiarvo on nolla. Tämä on helppo nähdä, koska keskiarvo on yksinkertaisesti summa valkoisen meluntarpeen summasta, jotka kaikki ovat nollia. Aloita teksti enspace mux E (xt) summa E (wi) 0 loppu alku teksti enspace sigma2w (1 beta21 ldots beta2q) loppu teksti enspace rhok vasen 1 teksti enspace k 0 summa betai beta sumq beta2i teksti enspace k 1, ldots, q 0 teksti enspace k gt q loppu oikealle. Missä beta0 1. Ajattelin nyt tuottaa simuloituja tietoja ja käyttää sitä korrelointitietojen luomiseen. Tämä tekee edellä esitetyn kaavan rhokille jonkin verran konkreettisempaa. Simulaatiot ja korrelogrammit Aloitetaan MA (1) - prosessilla. Jos asetetaan beta1 0.6, saadaan seuraava malli: Kuten edellisessä artikkelissa AR (p) - malleissa, voimme käyttää R: tä simuloimaan tällaista sarjaa ja piirtää sitten korrelointitiedosto. Koska weveillä oli paljon käytäntöä aikaisemmissa Time Series Analysis - sarjan sarjojen toteuttamisessa, kirjoitan R-koodin kokonaan sen sijaan, että halkaisin sen: Lähtö on seuraava: Kuten yllä rhok-kaavassa , k gt q, kaikkien autokorrelaatioiden tulisi olla nolla. Koska q 1, meidän pitäisi nähdä merkittävä huippu k1: ssä ja sen jälkeen merkityksettömiä huippuja. Kuitenkin näytteenottovirheen takia meidän pitäisi odottaa 5 (marginaalisesti) merkittävää piikkiä näytteen autokorrelaatiokuviona. Juuri tämä korrelointigraaali osoittaa meille tässä tapauksessa. Meillä on merkittävä huippu k1: ssä ja sitten merkityksettöminä huippuina k gt 1: lle, paitsi k4: ssä, jossa meillä on marginaalisesti merkittävä huippu. Itse asiassa tämä on hyödyllinen tapa nähdä, onko MA (q) malli sopiva. Tarkastelemalla tietyn sarjan korrelointimallia näemme, kuinka monta peräkkäistä ei-nolla-viivettä on olemassa. Jos q tällaiset viiveet ovat olemassa, voimme oikeutetusti yrittää asentaa MA (q) - mallin tiettyyn sarjaan. Koska meillä on todisteita simuloiduista MA (1) - prosessin tiedoista, he yrittäisivät nyt käyttää MA (1) - mallia simuloituun dataamme. Valitettavasti ei ole vastaavaa ma-komentoa autoregressiiviselle mallille ar komennolla R. Sen sijaan meidän on käytettävä yleisempää arima-komentoa ja asetettava autoregressiiviset ja integroidut komponentit nollaksi. Teemme tämän luomalla 3-vektorin ja asettamalla kaksi ensimmäistä komponenttia (autogressiiviset ja integroidut parametrit) nollaan: Saamme arima-komennosta hyödyllisen tuotoksen. Ensinnäkin voimme nähdä, että parametri on arvioitu hatuksi 0.602, joka on hyvin lähellä beta1 0.6: n todellista arvoa. Toiseksi standardivirheet on jo laskettu meille, joten luotettavuusvälien laskeminen on helppoa. Kolmanneksi saamme arvioitu varianssi, log-todennäköisyys ja Akaike Information Criterion (tarvitaan mallin vertailuun). Suurin ero ariman ja ar: n välillä on se, että arima arvioi leikkauskäskyn, koska se ei vähennä sarjan keskiarvoa. Siksi meidän on oltava varovaisia, kun arima-komennolla tehdään ennusteita. Palaan myöhemmin tähän. Koska nopeat tarkistukset olivat menossa laskemaan luotettavuusvälien hattua varten: Voimme nähdä, että 95: n luottamusväli sisältää beta1 0.6: n todellisen parametriarvon ja siten voimme arvioida, että malli on hyvä sopivuus. On selvää, että tämä olisi odotettavissa, koska simuloimme tietoja ensiksi. Miten asiat muuttuvat, jos muokkaamme beeta1: n merkin -0,6: een. Suoritetaan sama analyysi: Tuotos on seuraava: Voimme nähdä, että k1: llä on merkittävä korrelaattorissa, paitsi että se osoittaa negatiivisen korrelaation, kuten Wed odottaa MA (1) - mallilta negatiivisella ensimmäisellä kertoimella. Jälleen kaikki yli k1: n piikit ovat merkityksettömiä. Mahdollistaa MA (1) - mallin sovittamisen ja arvioi parametrin hattu -0.730, mikä on pienempi aliarviointi beta1 -0.6: sta. Lopuksi luotettavuusvälin laskeminen: Voimme nähdä, että beta1-0.6: n todellinen parametriarvo sisältyy 95: n luottamusväliin, mikä antaa meille todisteet hyvän mallin sovittamisesta. Käytetään samaa menettelyä varten MA (3) - prosessissa. Tällä kertaa meidän pitäisi odottaa merkittäviä huippuja k: ssa ja merkityksettömiä huippuja k gt 3: een. Käytämme seuraavia kertoimia: beta1 0.6, beta2 0.4 ja beta3 0.2. Mahdollistaa simuloida MA (3) - prosessia tästä mallista. Ive kasvatti satunnaisnäytteiden määrää 1000: een tässä simulaatiossa, mikä helpottaa todellisen autokorrelaatiorakenteen selvittämistä alkuperäisen sarjan vaikeamman tulkinnan kustannuksella. Tulos on seuraava: odotetusti kolme ensimmäistä piikkiä ovat merkittäviä . Kuitenkin myös neljäs. Mutta voimme oikeutetusti ehdottaa, että tämä voi johtua näytteenottovirheestä, koska odotamme, että 5 huippua on merkittäviä yli kq: n. Mahdollistaa nyt MA (3) - mallin koettamalla parametrien arvioimiseksi: Estimaattihattu 0,544, hattu 0,345 ja hattu 0,298 ovat lähellä beta 10.6: n, beta20.4: n ja beta30.3: n todellisia arvoja. Voimme myös tuottaa luotettavuusvälejä käyttäen vastaavia standardivirheitä: Kussakin tapauksessa 95: n luottamusväli sisältää todellisen parametriarvon ja voimme päätellä, että olemme hyvässä kunnossa MA (3) - mallimme kanssa, kuten pitäisi odottaa. Taloudelliset tiedot Osassa 1 pidimme Amazon Inc. (AMZN) ja SampP500 US Equity Index. Panimoimme AR (p) - mallin molempiin ja havaitsimme, että malli ei kyennyt tehokkaasti kaappaamaan sarjakorrelaation monimutkaisuutta, etenkin SampP500: n valetuksessa, jossa näyttävät olevan pitkä muisti-vaikutukset. En tapaa kaavioita uudelleen hintojen ja autokorrelaation sijaan, vaan viittaan edelliseen viestiin. Amazon Inc. (AMZN) Aloittaa yrittämällä valita MA (q) - malleihin AMZN: lle, nimittäin q in. Kuten osassa 1, käytä AMDN: n päivittäisten hintojen lataamista quantmodille ja muunna ne sitten suljettujen hintojen hirsivaihtotuotteeksi: Nyt, kun meillä on log-palautus, voimme käyttää arima-komentoa MA (1): n, MA: n (2) ja MA (3) malleista ja arvioi sitten kunkin parametrit. MA: lla (1) meillä on: Voimme piirtää päivittäisten log-palautusten ja sovitetun mallin jäännökset: Huomaa, että meillä on muutamia merkittäviä huippuja viiveissä k2, k11, k16 ja k18, mikä osoittaa, että MA (1) - malli on ei todennäköisesti ole hyvä sopivuus AMZN-log-palautusten käyttäytymiseen, koska tämä ei näytä valkoisen melun toteutumiselta. Kokeile MA (2) - mallia: Molemmat beta-kertoimien arviot ovat negatiivisia. Jäljitellään vielä kerran: Voimme nähdä, että ensimmäisten viiveiden lähes olematon autokorrelaatio on lähes olematon. Meillä on kuitenkin viisi marginaalisesti merkittävää piikkiä viiveissä k12, k16, k19, k25 ja k27. Tämä viittaa siihen, että MA (2) - mallissa on paljon autokorrelaatiota, mutta ei kaikkia pitkävaikutteisia vaikutuksia. Entä MA (3) malli Jälleen kerran voimme piirtää jäännökset: MA (3) jäännösmalli näyttää lähes identtiseltä MA (2) - mallin kanssa. Tämä ei ole yllättävää, koska ne lisäsivät uutta parametria mallille, joka on näennäisesti selittänyt paljon korrelaatioista lyhyemmissä viiveissä, mutta tällä tavoin on paljon vaikutusta pidemmän aikavälin viiveisiin. Kaikki nämä todisteet viittaavat siihen, että MA (q) - malli ei todennäköisesti ole hyödyllinen selittäessään koko sarjakorrelaatiota erikseen. ainakin AMZN: lle. SampP500 Jos muistat, osassa 1 näimme, että SampP500: n päivittäisen log palautusrakenteen ensimmäisellä kertaluvulla oli monta merkittävää piikkiä lyhyillä ja pitemmillä viiveillä. Tämä osoitti sekä ehdollisen heteroskedasticiteetin (eli volatiliteettiklusterointi) että pitkän muistin vaikutukset. Se johtaa meidät päättelemään, että AR (p) - malli ei riitä ottamaan kaiken läsnä olevan autokorrelaation. Kuten edellä nähdään, MA (q) - malli ei riittänyt ottamaan lisää sarjakorjausta sovitetun mallin jäännöksissä ensimmäiseen kertaluonteiseen erilaiseen päivittäiseen hintasarjaan. Nyt yritämme asentaa MA (q) - mallin SampP500: een. Voisimme kysyä, miksi teemme tämän, jos tiedämme, että on epätodennäköistä, että se sopii hyvin. Tämä on hyvä kysymys. Vastaus on se, että meidän on tarkasteltava tarkalleen, miten se ei ole hyvä sopivuus, koska tämä on lopullinen prosessi, jota seuraamme, kun kohtaamme paljon kehittyneempiä malleja, joita on mahdollisesti vaikeampi tulkita. Aloitetaan hankkimalla tiedot ja muunntamalla se ensimmäisen kertaluvun logaritmisesti muunnettujen päivittäisten sulkemishintojen ensimmäiseen kertaluonteiseen sarjaan kuten edellisessä artikkelissa. Aiomme nyt sovittaa MA (1), MA (2) ja MA (3) mallin sarja, kuten teimme yllä AMZN: lle. Aloitetaan MA: lla (1): Antaa piirtää tämän sovitetun mallin jäännökset: Ensimmäinen merkittävä huippu esiintyy k2: ssa, mutta k-arvoa on paljon enemmän. Tämä ei selvästikään ole valkoisen melun toteutuminen, joten meidän on hylättävä MA (1) - malli mahdolliseksi SampP500: n hyväksi. Tilanne paranee MA: n avulla (2) Jälleen kerran anna piirtää tämän sovitetun MA (2) - mallin jäännökset: Kun k2: n huippu on kadonnut (kuten odotettiin), jäämme edelleen merkittäviin piikkeihin monet jäävät kauemmin jäljelle jääneistä. Jälleen kerran löydämme MA (2) - mallin, ei ole hyvä sovitus. Odotamme, että MA (3) - mallissa nähdään vähemmän sarjakorkeutta k3: ssa kuin MA: ssa (2), mutta emme myöskään odota, että myöhemmät viiveet vähenisivät. Lopuksi, anna piirtää tämän sovitetun MA (3) - mallin jäännökset: Tämä on juuri se, mitä näemme jäännösten korreloinnissa. Tästä syystä MA (3), kuten muiden edellä mainittujen mallien kanssa, ei ole hyvä sopivuus SampP500: lle. Seuraavassa vaiheessa Weve tarkasteli nyt yksityiskohtaisesti kahta suurta aikasarjamallia, nimittäin tilauksen p, AR (p) autogressiivisen mallin ja sen jälkeen keskimääräisen järjestyksen q, MA (q). Olemme nähneet, että he pystyvät selittämään pois osan autokorrelaatiosta joukkovelkakirjalainojen ja indekseihin perustuvien ensimmäisen kertaluvun eriteltyjen päivittäisten hintaluokkien jäännöksissä, mutta volatiliteetin klusterointi ja pitkät muistin vaikutukset jatkuvat. On lopulta aikaa kääntää huomiomme näiden kahden mallin yhdistämiseen, nimittäin autoregressiivisen keskimääräisen järjestyksen keskiarvoon p, q, ARMA (p, q), onko se parantamaan tilannetta entisestään. Meidän on kuitenkin odotettava seuraavaan artikkeliin täyden keskustelun alkua vain määrällisen kaupankäynnin aloittamisestaA RIMA tarkoittaa Autoregressive Integrated Moving Average - malleja. Yksivaiheinen (yksittäinen vektori) ARIMA on ennustamistekniikka, joka esittelee sarjan tulevaisuuden arvot, jotka perustuvat täysin omaan inertiaan. Sen pääasiallinen sovellus on lyhytaikaisen ennusteen alueella, joka vaatii vähintään 40 historiallista tietopistettä. Se toimii parhaiten, kun tietosi näyttävät pysyvän tai johdonmukaisen mallin ajan kuluessa vähimmäismäärän kanssa. Joskus kutsutaan Box-Jenkins (alkuperäisten kirjoittajien jälkeen), ARIMA on yleensä ylivoimaisesti eksponentiaalisia tasoitusmenetelmiä, kun data on kohtuullisen pitkä ja aiempien havaintojen välinen korrelaatio on vakaa. Jos tiedot ovat lyhyitä tai erittäin haihtuvia, jokin tasoitusmenetelmä voi toimia paremmin. Jos sinulla ei ole vähintään 38 datapistettä, harkitse jotain muuta menetelmää kuin ARIMA. Ensimmäinen vaihe ARIMA-menetelmän soveltamisen yhteydessä on tarkistaa stationaarisuus. Stationarity tarkoittaa, että sarja pysyy melko vakiona ajan mittaan. Jos trendi on olemassa, kuten useimmissa talous - tai liiketoimintasovelluksissa, tietosi EI ole paikallaan. Tietojen on myös osoitettava jatkuvan vaihtelun vaihteluissaan ajan mittaan. Tämä näkyy helposti sarjassa, joka on voimakkaasti kausiluonteista ja kasvaa nopeammin. Tällaisessa tapauksessa kausivaihteluiden ylä - ja alamäki muuttuu ajan myötä dramaattisemmaksi. Ilman näitä stationaarisuusolosuhteita, monet prosesseihin liittyvät laskelmat eivät ole laskettavissa. Jos datan graafinen juoni osoittaa staattisen sijainnin, sinun tulisi erotella sarja. Erottelu on erinomainen tapa muuntaa staattinen sarja stationaariseksi. Tämä tehdään vähentämällä havainto nykyisestä ajankohdasta edellisestä. Jos tämä muutos tehdään vain kerran sarjassa, sanot, että tiedot on ensin erotettu toisistaan. Tämä prosessi poistaa olennaisesti trendin, jos sarjasi kasvaa melko vakiona. Jos se kasvaa yhä suuremmalla nopeudella, voit soveltaa samaa menettelyä ja erota tiedot uudelleen. Sinun tietosi olisi sitten toisella erotuksella. Autokorrelaatiot ovat numeerisia arvoja, jotka osoittavat, kuinka datasarja liittyy itsensä ajan myötä. Tarkemmin sanottuna se mittaa, kuinka voimakkaasti datan arvot tietyssä määrin jaksot erikseen korreloi toistensa kanssa ajan mittaan. Kauden jaksoja kutsutaan yleensä viiveeksi. Esimerkiksi autokorrelaatio viiveellä 1 mittaa kuinka arvot 1 jakso jakaantuvat toisiinsa koko sarjan aikana. Autokorrelaatio viiveellä 2 mittaa kuinka datan kaksi jaksoa toisistaan ​​korreloi koko sarjasta. Autokorrelaatiot voivat vaihdella 1: stä -1: een. Arvo lähellä 1 osoittaa suurta positiivista korrelaatiota, kun taas arvo, joka on lähellä -1, merkitsee suurta negatiivista korrelaatiota. Näitä toimenpiteitä arvioidaan useimmiten graafisilla pisteillä, joita kutsutaan korrelaarimoiksi. Korrelaattori piirtää tietyn sarjan autokorrelaatioarvot eri viiveille. Tätä kutsutaan autokorrelaatiofunktioksi ja on erittäin tärkeä ARIMA-menetelmässä. ARIMA-menetelmä pyrkii kuvaamaan liikkumattomien aikasarjojen liikkeitä funktioina, joita kutsutaan autoregressiiviseksi ja liikkuvaksi keskiarvoksi. Näitä kutsutaan AR-parametreiksi (autoregessive) ja MA-parametreiksi (liukuvat keskiarvot). AR-mallia, jossa on vain yksi parametri, voidaan kirjoittaa nimellä. X (t) E (t) missä X (t) aikasarja tutkimuksessa A (1) tilaajan 1 X (t-1) autoregressiivinen parametri aikasarjoissa viivästettynä 1 jakso E (t) mallin virhetermi Tämä tarkoittaa yksinkertaisesti, että mikä tahansa annet - tu arvo X (t) voidaan selittää edellisellä arvollaan X (t-1) jonkin funktion avulla ja lisäksi jonkin selittämättömän satunnaisvirheen E (t) avulla. Jos A (1): n arvioitu arvo oli .30, sarjan nykyinen arvo liittyisi 30 arvoon 1 aika sitten. Tietenkin sarja voisi liittyä enemmän kuin vain yhteen menneeseen arvoon. Esimerkiksi X (t) A (1) X (t-1) A (2) X (t-2) E (t) Tämä osoittaa, että sarjan nykyinen arvo on kahden välittömästi edeltävän arvon yhdistelmä, X (t-1) ja X (t-2) sekä jokin satunnaisvirhe E (t). Mallimme on nyt autoregressiivinen malli tilauksesta 2. Liikkuvat keskimääräiset mallit: Toista tyyppiä Box-Jenkins - mallia kutsutaan liikkuvan keskiarvon malliksi. Vaikka nämä mallit näyttävät hyvin samanlaisilta kuin AR-malli, niiden taustalla oleva käsite on melko erilainen. Keskimääräisten muuttuvien muuttujien keskimääräiset muuttujat kertovat, mitä tapahtuu ajanjaksossa t vain aiempiin aikajaksoihin, esim. E (t-1), E (t-2) jne., Satunnaisiin virheisiin kuin X (t-1), X t-2), (Xt-3), kuten autoregressiivisissa lähestymistavoissa. Liikkuvaa keskimääräistä mallia, jolla on yksi MA-termi, voidaan kirjoittaa seuraavasti. X (t) - B (1) E (t-1) E (t) Termiä B (1) kutsutaan järjestyksen MA: ksi 1. Parametrin edessä oleva negatiivinen merkki käytetään vain yleissopimukseen, automaattisesti useimmilla tietokoneohjelmilla. Edellä oleva malli yksinkertaisesti sanoo, että mikä tahansa X (t): n arvo liittyy suoraan edellisen jakson, E (t-1) satunnaisvirheeseen ja nykyiseen virhetilaan, E (t). Kuten autoregressiivisten mallien tapauksessa, liikkuvan keskimallin mallit voidaan laajentaa korkeampiin järjestysrakenteisiin, jotka kattavat erilaiset yhdistelmät ja liikkuvan keskipituudet. ARIMA-menetelmällä voidaan myös rakentaa malleja, jotka sisältävät sekä autoregressiivisen että liikkuvan keskimääräisen parametrin yhdessä. Näitä malleja kutsutaan usein sekamuotoiksi. Vaikka tämä tekee monimutkaisemmasta ennustustyökalusta, rakenne voi todellakin simuloida sarjaa paremmin ja tuottaa tarkemman ennusteen. Pure-mallit edellyttävät, että rakenne koostuu vain AR - tai MA-parametreista - ei molemmista. Tämän lähestymistavan avulla kehitettyjä malleja kutsutaan yleensä ARIMA-malleiksi, koska ne käyttävät autoregressiivisen (AR), integraation (I) yhdistelmää - viitaten erilaistumisen käänteiseen prosessiin ennusteiden tuottamiseksi ja liikkuvaa keskimääräistä (MA) toimintaa. ARIMA-malli mainitaan yleensä ARIMA: ksi (p, d, q). Tämä edustaa autoregressiivisten komponenttien (p) järjestystä, eri operaattoreiden määrää (d) ja liikkuvan keskiarvon suurinta järjestystä. Esimerkiksi ARIMA (2,1,1) tarkoittaa, että sinulla on toisen kertaluvun autoregressiivimalli, jossa on ensimmäisen kertaluvun liukuva keskiarvo-osa, jonka sarja on eriytetty kerran stationaarisuuden indusoimiseksi. Oikean erittelyn poistaminen: Klassisen Box-Jenkinsin suurin ongelma on yrittää päättää, mitä ARIMA-spesifikaatiota käytetään - i. e. kuinka monta AR - ja / tai MA-parametria sisällytetään. Tämä on mitä paljon Box-Jenkingissa 1976 oli omistettu tunnistusprosessille. Se riippui näytteen autokorrelaation ja osittaisten autokorrelaatiofunktioiden graafisesta ja numeerisesta arvosta. Teidän tehtävänne ei ole liian vaikea perusmalleissa. Jokaisella on autokorrelaatiofunktiot, jotka näyttävät tietyllä tavalla. Kuitenkin, kun nouset monimutkaisuuteen, kuvioita ei tunnisteta helposti. Jotta asiat saataisiin vaikeutumaan, tietosi ovat vain esimerkki taustalla olevasta prosessista. Tämä tarkoittaa, että näytteenottovirheet (poikkeamat, mittausvirheet jne.) Voivat vääristää teoreettista tunnistusprosessia. Siksi perinteinen ARIMA-mallinnus on taiteen sijaan tiedettä.2.1 Keskimääräiset siirrettävät mallit (MA-malleja) ARIMA-malleissa tunnettuja aikasarjan malleja voivat olla autoregressiiviset termit ja liikkuvat keskimääräiset termit. Viikolla 1 opimme autoregressiivisen termin aikasarjamallissa muuttujalle x t, joka on x t: n viivästynyt arvo. Esimerkiksi viive 1 autoregressiivinen termi on x t-1 (kerrottuna kertoimella). Tässä oppitunnissa määritellään liikkuvat keskimääräiset ehdot. Ajallisen sarjamallin liukuva keskimääräinen termi on aiempi virhe (kerrottuna kertoimella). Olkoon (wt overset N (0, sigma2w)), mikä tarkoittaa, että w t ovat identtisesti ja toisistaan ​​riippumattomasti jakautuneita, joista kullakin on normaali jakauma, jolla on keskiarvo 0 ja sama varianssi. Ensimmäisen kertaluvun keskimääräinen malli, jota merkitään MA (1) on (xt mu wt theta1w) 2. järjestysliike keskimääräinen malli, jota merkitään MA (2) on (xt mu wt theta1w theta2w) , merkitty MA (q) on (xt mu wt theta1w theta2w pistettä thetaqw) Huom. Monet oppikirjat ja ohjelmistot määrittelevät mallin negatiivisilla merkillä ennen termejä. Tämä ei muuta mallin yleisiä teoreettisia ominaisuuksia, vaikka se kääntyy arvioidun kerroinarvon algebrallisten merkkien ja (epäsuosittujen) termien kanssa kaavojen ACF ja varianssit. Sinun on tarkistettava ohjelmistosi tarkistaaksesi, onko negatiivisia tai positiivisia merkkejä käytetty arvioidun mallin kirjoittamiseen oikein. R käyttää positiivisia merkkejä sen perustana olevassa mallissa, kuten täälläkin. Ajoitussarjan teoreettiset ominaisuudet MA (1) - mallilla Huomaa, että teoreettisen ACF: n ainoa ei-arvo on viiveellä 1. Kaikki muut autokorrelaatiot ovat 0. Näin ollen näytteen ACF, jolla on merkittävä autokorrelaatio vain viiveellä 1, on mahdollisen MA (1) - mallin indikaattori. Kiinnostuneille opiskelijoille todisteet näistä ominaisuuksista ovat liitteenä tämän esitteen. Esimerkki 1 Oletetaan, että MA (1) - malli on x t 10 w t .7 w t-1. jossa (ylimitoitettu N (0,1)). Siten kerroin 1 0,7. Teoreettinen ACF annetaan tämän ACF: n piirroksella. Juuri näytetty tontti on teoreettinen ACF MA (1): lle, jossa on 1 0,7. Käytännössä näyte tavallisesti tarjoaa tällaisen selkeän kuvion. Käyttämällä R simuloitimme n 100 näytearvoja käyttäen mallia x t 10 w t .7 w t-1 missä w t iid N (0,1). Tätä simulaatiota varten noudatetaan näyteaineiston aikasarjaa. Emme voi kertoa paljon tästä tontista. Seuraavaksi seuraa simuloitujen tietojen näyte ACF. Nähdään piikki viiveellä 1, mitä seuraa yleisesti ei-merkittäviä arvoja viivästyneelle ohi 1: lle. Huomaa, että näyte ACF ei vastaa taustalla olevan MA: n teoreettista mallia (1), eli että kaikki autokorrelaatiot myöhästyneille 1 ovat 0 . Erilaisella näytteellä olisi hieman erilainen näyte ACF alla, mutta sillä olisi todennäköisesti samat laaja piirteet. MA (2) - mallin teoreettiset ominaisuudet Teoreettiset ominaisuudet ovat seuraavat: Huomaa, että teoreettisessa ACF: ssä vain ei-nolla-arvot ovat viiveille 1 ja 2. Autokorrelaatioita suuremmille viiveille ovat 0 , Joten näyte ACF, jolla on merkittäviä autokorrelaatioita viiveissä 1 ja 2, mutta ei-merkittävät autokorrelaatiot suuremmille viiveille osoittavat mahdollisen MA (2) - mallin. iid N (0,1). Kertoimet ovat 1 0,5 ja 2 0,3. Koska tämä on MA (2), teoreettisella ACF: llä on ei-arvoja vain viiveillä 1 ja 2. Näiden kahden nonzero-autokorrelaation arvot ovat teoreettisen ACF: n piirre. Kuten lähes aina on, näyte-tiedot käyttäytyvät aivan yhtä hyvin kuin teorian. Simuloimme n 150 mallinäytettä mallille x t 10 wt .5 w t-1 .3 w t-2. missä w t iid N (0,1). Aikasarjan tietue seuraa. Kuten MA: n (1) näytetietojen aikasarjoissa, et voi kertoa paljon siitä. Seuraavaksi seuraa simuloitujen tietojen näyte ACF. Kuvio on tyypillinen tilanteissa, joissa MA (2) malli voi olla hyödyllinen. Kaksi tilastollisesti merkitsevää piikkiä on viiveissä 1 ja 2, mitä seuraa ei-merkittäviä arvoja muille viiveille. Huomaa, että näytteenottovirheen vuoksi näyte ACF ei täsmälleen vastaa teoreettista mallia. ACF yleisille MA (q) - malleille MA (q) - mallien ominaisuus on yleensä se, että ensimmäisten q-viiveiden ja autokorrelaatioiden 0 osalta on kaikkiin viiveisiin gt q. Ei-ainutlaatuisuus yhteyden arvojen 1 ja (rho1) välillä MA (1) Malli. MA (1) - mallissa, mikä tahansa arvo on 1. vastavuoroinen 1 1 antaa saman arvon Esimerkille, käytä 0,5 1: lle. ja käytä sitten 1 (0,5) 2 1: lle. Youll saada (rho1) 0.4 molemmissa tapauksissa. Teoreettisen rajoituksen tyydyttämiseksi kutsutaan invertibility. rajoitamme MA (1) - malleja arvoihin, joiden absoluuttinen arvo on pienempi kuin 1. Jo annetussa esimerkissä 1 0,5 on sallittu parametriarvo, kun taas 1 10,5 2 ei. MA-malleiden invertibility MA-mallin sanotaan olevan käännettävissä, jos se on algebrallisesti samanlainen kuin yhdensuuntainen ääretön AR-malli. Lähentymällä tarkoitamme, että AR-kertoimet pienenevät arvoon 0 kun siirrymme ajassa taaksepäin. Invertibility on rajoitus, joka on ohjelmoitu aikasarjaohjelmistoihin, joita käytetään estimoimaan MA-termejä käyttävien mallien kertoimet. Se ei ole jotain, jota tarkistamme tietojen analysoinnissa. Lisätiedot MA (1) - malleista, jotka koskevat invertibility-rajoitusta, annetaan lisäyksessä. Advanced Theory Note. MA (q) - mallilla, jolla on määritetty ACF, on vain yksi muutettavissa oleva malli. Tarvittava edellytys vaihtovirtaukselle on, että kertoimilla on sellaiset arvot, että yhtälö 1- 1 y-. - q y q 0 on ratkaisuja y, jotka kuuluvat yksikön ympyrän ulkopuolelle. Esimerkkien R-koodi Esimerkissä 1 piirrettiin mallin x t 10 w t teoreettinen ACF. 7w t-1. ja simuloi sitten n 150 arvot tästä mallista ja piirrettiin näyteajasarjat ja näyte ACF simuloituun dataan. Teoreettisen ACF: n piirtämiseen käytetyt R-komennot olivat: acfma1ARMAacf (mac (0.7), lag. max10) 10: n ACF: n viiveet MA: lla (1) ja theta1 0.7 lags0: 10 luo muuttujan nimellisviiveet välillä 0-10. (h0) lisää horisontaalisen akselin juonteeseen Ensimmäinen komento määrittää ACF: n ja tallentaa sen objektille (viiveet, acfma1, xlimc (1,10), ylabr, tiph, pää ACF MA: lle (1) nimeltään acfma1 (nimemme valinta). Piirtokomento (kolmas komento) on viivästynyt vastaaviin arvoihin 1 - 10 verrattuna. Ylab-parametri merkitsee y-akselia ja pääparametri asettaa otsikon tontille. Nähdäksesi ACF: n numeeriset arvot käytä yksinkertaisesti komentoa acfma1. Simulaatio ja tontit tehtiin seuraavilla komennoilla. x (x1), list (mac (0.7))) Simuloi n 150 arvot MA: sta (1) xxc10 lisää 10 keskiarvon 10. Simulaatio oletusarvoilla tarkoittaa 0. tonttia (x, typeb, mainSimulated MA (1) acf (x, xlimc (1,10), mainACF simuloitua näytetietoa varten) Esimerkissä 2 piirrettiin mallin teoreettinen ACF 10 wt .5 w t-1 .3 w t-2. ja simuloi sitten n 150 arvot tästä mallista ja piirrettiin näyteajasarjat ja näyte ACF simuloituun dataan. Käytetyt R-komennot olivat: acfma2ARMAacf (mac (0.5,0.3), lag. max10) acfma2 lags0: 10 tontti (viiveet, acfma2, xlimc (1,10), ylabr, tiph, pää ACF MA: lle (2) (x, typeb, main simuloitu MA (2) sarja) acf (x, xlimc (1,10), xxc10 mainACF simuloituun MA (2) - tietoon) Liite: MA: n ominaisuuksien todistus (1) Kiinnostuneille opiskelijoille on esitetty todisteet MA (1) - mallin teoreettisista ominaisuuksista. Varianssi: (text (xt) text (mu wt theta1 w) 0 teksti (wt) teksti (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Kun h 1, edellinen lauseke 1 w 2. Missä tahansa h 2, edellinen lauseke 0 . Syy on se, että määritelmästä riippumattomuus wt. E (w k w j) 0 mille tahansa kj. Lisäksi koska w: n keskiarvo on 0, E (w j w j) E (wj 2) w 2. Käytä tätä aikasarjaa varten Käytä tätä tulosta saadaksesi edellä esitetyn ACF: n. Muunneltavissa oleva MA-malli on sellainen, että se voidaan kirjoittaa äärettömän AR-malliksi, joka konvergoituu siten, että AR-kertoimet konvergoituvat 0: een, kun siirrymme äärettömän ajassa taaksepäin. Hyvin osoittavat invertibility MA (1) - mallille. Sitten korvataan yhtälössä (1) (3) oleva wt-1-suhde (2) (zt wt theta1 (z-theta1w) wt theta1z-theta2w) Aikana t-2. yhtälö (2) tulee sitten korvaamaan suhde (4) w t-2: lle yhtälössä (3) (zt wt theta1 z-theta21w wt theta1z-theta21 (z-theta1w) wt theta1z-theta12z theta31w) Jos jatkamme ( äärettömän), saisimme ääretön AR-mallin (zt wt theta1 z-theta21z theta31z-theta41z-pisteet) Huomaa kuitenkin, että jos 1 1 kertoimet kerrottu z: n viiveille kasvaa (äärettömän) kooltaan kun siirrymme takaisin aika. Tämän estämiseksi tarvitsemme 1 lt1. Tämä on ehto invertible MA (1) - mallille. Infinite Order MA - malli Viikolla 3 nähdään, että AR (1) - malli voidaan muuntaa ääretöniseksi MA-malliksi: (xt - mu wt phi1w phi21w pistettä phik1 w dots sum phij1w) Tämä summaus aikaisemmista valkoisista meluista on tiedossa kuten AR: n (1) kausaalinen esitys. Toisin sanoen x t on erityinen MA, jolla on ääretön määrä termejä, jotka menevät ajassa taaksepäin. Tätä kutsutaan ääretöntä järjestystä MA tai MA (). Äärillinen tilaus MA on ääretön tilaus AR ja mikä tahansa äärellinen järjestys AR on ääretön tilaus MA. Muistutettaisiin viikolla 1, huomasimme, että kiinteän AR: n (1) vaatimus on, että 1 lt1. Lasketaan Var (x t) kausaalisen esityksen avulla. Tämä viimeinen vaihe käyttää perustietoa geometrisista sarjoista, jotka edellyttävät (phi1lt1) muuten sarja poikkeaa. Navigointi8.4 Keskimääräisten mallien siirtäminen Sen sijaan, että ennuste-muuttujan aikaisempia arvoja käytetään regressiossa, liikkuva keskiarvo käyttää aikaisempia ennustevirheitä regressiomainen malli. y c et theta e theta e dots theta, jossa et on valkoista kohinaa. Tätä viitataan MA (q) - mallina. Tietenkään emme noudata ET: n arvoja, joten ei todellakaan ole regressiota tavallisessa mielessä. Huomaa, että yt: n arvoa voidaan pitää viimeisten ennusteiden virheiden painotettuna liukuva keskiarvoisena. Liikkeessä olevia keskimääriä ei kuitenkaan pidä sekoittaa liikkuvan keskiarvon tasoittamiseen, josta keskusteltiin luvussa 6. Liikevän keskimallin mallia käytetään tulevien arvojen ennustamiseen samalla, kun keskimääräistä tasoitusta liikutetaan arvioitaessa aiempien arvojen trendikierrosta. Kuva 8.6: Kaksi esimerkkiä liikkuvan keskimallin malleista eri parametreilla. Vasen: MA (1) y t 20e t 0,8e t-1. Oikea: MA (2) y t e t - e t-1 0,8e t-2. Kummassakin tapauksessa e t on normaalisti jaettu valkoiseksi melulle keskiarvolla nolla ja varianssilla yksi. Kuva 8.6 esittää joitain tietoja MA (1) - mallista ja MA (2) - mallista. Parametrien muuttaminen theta1, pisteillä, thetaq johtaa eri aikasarjakuvioihin. Kuten autoregressiivisilla malleilla, virhetermin varianssi muuttuu vain sarjan asteikosta, ei kuvioista. Jokainen stationaarinen AR (p) - malli voidaan kirjoittaa MA: ksi. Esimerkiksi käyttämällä toistuvaa substituutioa, voimme osoittaa tämän AR (1) - mallille: aloittaa yh - teistyö ja amp phi1 (phi1y e) ja amp phi12y phi1 e et amp phi13y phi12e phi1 et et amptext-pää Jos -1 lt phi1 lt 1, phi1k: n arvo pienenee kun k saa suuremman. Joten lopulta saavutamme yt fi phi1 e phi12 e phi13 e cdots, MA (turmeltunut) prosessi. Päinvastainen tulos pysyy voimassa, jos asetamme rajoituksia MA-parametreille. Sitten MA-mallia kutsutaan avatuksi. Toisin sanoen voimme kirjoittaa minkä tahansa käännettävän MA (q) - prosessin AR (kykenemättömänä) prosessina. Vaihtovälineet eivät ole pelkästään mahdollisuuksia muuttaa MA-malleista AR-malleihin. Niillä on myös matemaattisia ominaisuuksia, jotka helpottavat niiden käyttämistä käytännössä. Vaihtovirran rajoitteet ovat samanlaisia ​​kuin stationaarisuusrajoitukset. MA (1) - mallin osalta: -1 lttheta1lt1. MA (2) - mallille: -1lttheta2lt1, theta2theta1 gt-1, theta1-theta2 lt 1. Monimutkaisemmat olosuhteet pidävät qge3: lle. Jälleen, R huolehtii näistä rajoituksista arvioitaessa malleja.

Comments

Popular Posts