Sunday 19 November 2017

Flytting Gjennomsnitt Prosess Stasjonær


Vurder den uendelige rekkefølge MA prosessen definert av yt epsilont en epsilon epsilon, hvor a er en konstant og epsilont s er iid N 0, v tilfeldig variabel. Hva er den beste måten å vise at yt er nonstationary Jeg vet at jeg må se på karakteristiske røtter av egenskapene polynom og døm hvorvidt de er utenfor enhetssirkelen, men hva er den beste måten å nærme seg dette problemet Skal jeg prøve å omskrive den uendelige rekkefølgen MA prosessen som en endelig AR-prosess eller er det lettere å jobbe MA prosessen. skrevet 19. oktober kl. 21 21. Hva er stasjonær autoregressiv AR, flytte gjennomsnittlig MA og stasjonære blandede ARMA prosesser. Stasjonær autoregressiv AR prosess Stasjonære autoregressive AR prosesser har teoretiske autokorrelasjonsfunksjoner ACFer som forfall mot null, i stedet avkutting til null Autokorrelasjonskoeffisientene kan alternere i tegn ofte, eller vise et bølgelignende mønster, men i alle tilfeller svinger de av mot null. I kontrast AR-prosessen ses med ordre p har teoretiske partielle autokorrelasjonsfunksjoner PACF som kuttes til null etter lag p Lagslengden til den endelige PACF-spissen tilsvarer AR-rekkefølgen av prosessen, p Flytende gjennomsnittlig MA-prosess De teoretiske ACFene av MA-bevegelige gjennomsnittsprosesser med rekkefølge q kuttet av til null etter lag q, MA-rekkefølgen av prosessen Imidlertid deres teoretiske PACFer forfall mot null Lagslengden til den endelige ACF-spissen tilsvarer MA-rekkefølgen av prosessen, q Stasjonær blandet ARMA-prosess Stasjonære blandede ARMA-prosesser viser en blanding av AR og MA kjennetegn Både den teoretiske ACF og PACF svinger av mot null. Copyright 2016 Minitab Inc Alle rettigheter reservert. Kort introduksjon til moderne tidsrekkefølge. Definisjon En tidsserie er en tilfeldig funksjon xt av et argument t i et sett T Med andre ord er en tidsserie en familie av tilfeldige variabler x t-1 xtxt 1 som tilsvarer alle elementene i settet T, hvor T skal være en avregnes, uendelig sett. Definisjon En observert tid seri es tte T o T betraktes som en del av en realisering av en tilfeldig funksjon xt Et uendelig sett med mulige realisasjoner som kunne ha blitt observert kalles et ensemble. For å sette ting strengere er tidsserien eller tilfeldig funksjon en reell funksjon xw, t av de to variablene w og t, hvor wW og t T Hvis vi fastsetter verdien av w, har vi en reell funksjon xtw av tiden t, som er en realisering av tidsserien Hvis vi fastsetter verdien av t, da har vi en tilfeldig variabel xwt For et gitt tidspunkt er det en sannsynlighetsfordeling over x Således kan en tilfeldig funksjon xw, t betraktes som enten en familie av tilfeldige variabler eller som en familie av realisasjoner. Definisjon Vi definerer distribusjonsfunksjonen av den tilfeldige variabelen w gitt t 0 som P oxx Tilsvarende kan vi definere fellesfordelingen for n tilfeldige variabler. Poengene som skiller tidsserieanalyse fra vanlige statistiske analyser er følgende 1 Beroendet mellom observasjoner ved forskjellige kronologisk Giske tidspunkter spiller en viktig rolle Med andre ord er rekkefølgen av observasjoner viktig. I vanlig statistisk analyse antas det at observasjonene er gjensidig uavhengige. 2 Domenet til t er uendelig. 3 Vi må gjøre en innledning fra en realisering. av den tilfeldige variabelen kan bare observeres én gang på hvert tidspunkt i multivariat analyse har vi mange observasjoner på et begrenset antall variabler Denne kritiske forskjellen krever antagelsen om stationaritet. Definisjon Den tilfeldige funksjonen xt sies å være strengt stasjonær dersom alle Endtidsdimensjonale distribusjonsfunksjoner som definerer xt, forblir det samme selv om hele gruppen av poeng t 1 t 2 tn forskyves langs tidsaksen. Det er, hvis. for alle heltall t 1 t 2 tn og k Grafisk kan man forestille realiseringen av en strengt stasjonær serie som ikke bare har samme nivå i to forskjellige intervaller, men også samme fordelingsfunksjon, helt ned til parametrene som definerer det. Forutsetningen om stasjonar gjør våre liv enklere og mindre kostbare. Uten stasjonæritet må vi prøve prosessen ofte på hvert tidspunkt for å bygge opp en karakterisering av distribusjonsfunksjonene i den tidligere definisjonen. Stasjonar betyr at vi kan begrense vår oppmerksomhet til noen av de enkleste numeriske funksjonene, dvs. distribusjonsmomentene De sentrale øyeblikkene er gitt ved Definisjon i Den gjennomsnittlige verdien av tidsserien t er det første ordens øyeblikk ii Autokovariansfunksjonen av t er det andre øyeblikket om gjennomsnittet Hvis ts så har du variansen av xt Vi vil bruke til å betegne autokovariansen til en stasjonær serie, hvor k betegner forskjellen mellom t og s iii Autokorrelasjonsfunksjonen ACF av t er. Vi vil bruke til å betegne autokorrelasjonen av en stasjonær serie hvor k betegner forskjellen mellom t og s iv Den delvise autokorrelasjonen PACF f kk er korrelasjonen mellom zt og ztk etter fjerning ng deres gjensidige lineære avhengighet av de mellomliggende variablene zt 1 zt 2 zt k-1 En enkel måte å beregne den delvise autokorrelasjonen mellom zt og ztk er å kjøre de to regressions. then beregne korrelasjonen mellom de to restvektorer eller, etter måling av variabler som avvik fra deres måte, kan den delvise autokorrelasjonen bli funnet som LS-regresjonskoeffisienten på zt i modellen. Der punktet over variabelen indikerer at det måles som en avvik fra dens gjennomsnitt v. Yule-Walker-ligningene gir en viktig forholdet mellom de delvise autokorrelasjonene og autokorrelasjonene Multiply begge sider av ligning 10 av zt kj og ta forventninger Denne operasjonen gir oss følgende forskjelllig likning i autocovariances. or, når det gjelder autokorrelasjoner. Denne tilsynelatende enkle representasjonen er virkelig et kraftig resultat Namely , for j 1,2 k kan vi skrive hele systemet av ligninger, kjent som Yule-Walker-ligningene. Fra lineær algebra du k Nå som matrixen av rs er fullstendig. Det er derfor mulig å anvende Cramers regel suksessivt for k 1,2 å løse systemet for de delvise autokorrelasjonene. De tre første er. Vi har tre viktige resultater på strengt stasjonære serier. Implikasjonen er at vi kan bruke en hvilken som helst endelig realisering av sekvensen til å estimere gjennomsnittet sekund hvis t er strengt stillestående og E t 2 da. Implikasjonen er at autokovariansen bare avhenger av forskjellen mellom t og s, ikke deres kronologiske punkt i tid. Vi kunne bruk noen parintervaller i beregningen av autokovariansen så lenge tiden mellom dem var konstant. Og vi kan bruke en hvilken som helst begrenset realisering av dataene til å estimere autocovariances. For det tredje er autokorrelasjonsfunksjonen ved strenge stasjonar gitt av. implikasjon er at autokorrelasjonen bare avhenger av forskjellen mellom t og s, og igjen kan de estimeres ved en endelig realisering av dataene. Hvis vårt mål er å anslå parametere som er beskrivende av de mulige realisasjonene av tidsseriene, så er kanskje strenge stasjonar for restriktive. For eksempel, hvis middelverdien og covariances av xt er konstant og uavhengig av kronologisk punkt i tid, er det kanskje ikke viktig for oss at fordelingsfunksjonen er den samme for ulike tidsintervaller. Definisjon En tilfeldig funksjon er stasjonær i vid forstand eller svakt stasjonær eller stasjonær i Khinchin s-forstand, eller kovarians stasjonær hvis m 1 tm og m 11 t, s. ikke i seg selv innebærer svak stasjonar. Svak stasjonaritet innebærer ikke strenge stasjonar. Sterk stasjonar med E t 2 innebærer svak stasjonar. Orginære teoremer er opptatt av spørsmålet om nødvendige og tilstrekkelige forhold for å gjøre avstand fra en enkelt realisering av en tidsserie. ned til antatt svak stasjonar. Tetningen Hvis t er svakt stasjonær med gjennomsnittlig m og kovariansfunksjon, så. That er for en gitt e 0 og h 0 det eksisterer noen tall T o slik at for alle TT o hvis og bare hvis. Denne nødvendige og tilstrekkelige betingelse er at autocovariances dør ut, i hvilket tilfelle prøven mener er en konsistent estimator for befolkningen betyr. Korollære Hvis t er svakt stasjonær med E tkxt 2 for noen t, og E tkxtxtskxts er uavhengig av t for noe heltall s, then. if og bare hvis where. A. konsekvens av konsekvensen er antakelsen om at xtxtk er svakt stasjonær Den ergotiske setningen er ikke mer enn en lov av store tall når observasjonene er korrelerte. Man kan kanskje spørre om de praktiske implikasjonene av stasjonar Den vanligste bruken av bruk av tidsserieteknikker er å modellere makroøkonomiske data, både teoretisk og atoretisk Som et eksempel på den tidligere, kan man ha en multiplikator-akseleratormodell For at modellen skal være stasjonær, må parametrene ha visse verdier En test av modellen er da å samle de relevante d ata og estimere parametrene Hvis estimatene ikke stemmer overens med stasjonar, må man revurdere enten den teoretiske modellen eller statistisk modell eller begge. Vi har nå nok maskiner til å begynne å snakke om modellering av univariate tidsseriedata. Det er fire trinn i prosessen 1 bygningsmodeller fra teoretisk og opplevelsesvitenskap 2 identifisere modeller basert på data observerte serie 3 tilpasse modellene estimere parametrene til modellen s 4 sjekke modellen Hvis vi ikke er fornøyd i det fjerde trinnet, går vi tilbake til trinn en Prosessen er iterativ til ytterligere kontroll og respektering gir ingen ytterligere forbedringer i resultatene Diagrammatisk. Definisjon Enkelte operasjoner inkluderer følgende Backshift-operatøren Bx tx t-1 Fremoveroperatøren Fx txt 1 Differensialoperatøren 1 - B xtxt - x t - 1 Differansen operatøren oppfører seg på en måte som er konsistent med konstanten i en uendelig serie. Det vil si at dens inverse er grensen til en uendelig summe Nemlig -1 -1 B 1 1 1-B 1 BB 2 Integreringsoperatøren S -1 Siden det er invers av differanseoperatøren, tjener integrasjonsoperatøren til å konstruere summen. MODUL BUILDING I denne delen vi gi en kort gjennomgang av de vanligste typene av tidsseriemodeller På grunnlag av en s-kunnskap om datagenereringsprosessen velger man en klasse av modeller for identifisering og estimering fra mulighetene som følger. Definisjon Anta at Ex tm er uavhengig av t En modell som med karakteristikkene kalles den autoregressive bestillingsmodellen p, AR p. Definisjon Hvis en tidsavhengig variabel stokastisk prosess t tilfredsstiller, er t sagt å tilfredsstille Markov-egenskapen På LHS er forventningen betinget av uendelig historie av xt På RHS er det betinget av kun en del av historien. Fra definisjonene er en AR p-modell sett til å tilfredsstille Markov-eiendommen. Ved hjelp av backshift-operatøren kan vi skrive vår AR-modell as. Theorem A necessary and sufficie nt betingelse for at AR p-modellen skal være stasjonær, er at alle røttene til polynomeren ligger utenfor enhetens sirkel. Eksempel 1 Vurder AR 1 Den eneste roten av 1 - f 1 B 0 er B 1 f 1 Forutsetningen for Stasjonar krever det. Hvis den observerte serien vil se ut som meget frenetisk, så vurderer den. Den hvite støybegrepet har en normal fordeling med nullverdier og en varians av en Observasjonsbryteren skilt med nesten alle observasjoner. Hvis den andre hånden, så vil den observerte serien bli mye jevnere. I denne serien har en observasjon en tendens til å ligge over 0 hvis forgjengeren var over null Variansen av et er se 2 for alle t Variasjonen av xt når den har null betyr, er gitt av Siden serien er stasjonær kan vi skrive Hence. The autocovariance-funksjonen til en AR 1-serie er å anta uten tap av generality m 0. For å se hvordan dette ser ut i forhold til AR-parametrene, vil vi gjøre bruk av det faktum at vi kan skriv xt som følger. Multiplying ved x tk og ta expec Tellingen. Note at autocovariances dør ut som k grows Autocorrelation funksjonen er autocovariance divideres med variansen av den hvite støy termen Eller, Ved hjelp av tidligere Yule-Walker formler for de delvise autokorrelasjoner vi har. For en AR 1 dør autokorrelasjonene ut eksponentielt og de delvise autokorrelasjonene viser en spike i ett lag og er null deretter. Eksempel 2 Vurder AR2 Det tilhørende polynomet i lagoperatøren er. Røttene kan bli funnet ved hjelp av den kvadratiske formelen Røttene er. Når røttene er ekte og som en konsekvens vil serien falle eksponentielt som svar på et sjokk Når røttene er komplekse og serien vil vises som en dempet tegnbølge. Stasjonsarbeidsormen pålegger følgende forhold på AR-koeffisientene. Autokovariansen for en AR 2-prosess med null betyr, er. Dividing gjennom av variansen av xt gir autokorrelasjon funksjon Siden vi kan skrive Tilsvarende for andre og tredje autocorrelations. The andre Autokorrelasjoner løses for rekursivt. Mønsteret styres av røttene til den andre ordens lineære forskjellligning. Hvis røttene er ekte, vil autokorrelasjonene synke eksponentielt. Når røttene er komplekse, vil autokorrelasjonene vises som en dempet sinusbølge. Bruke Yule-Walker ligningene, de delvise autokorrelasjonene er. Again, de autokorrelasjoner dør ut sakte. Den delvise autokorrelasjonen derimot, er ganske særpreget. Den har pigger på en og to lags og er null deretter. Skjemaet Hvis xt er en stationær AR p-prosess, kan det være ekvivalent skrevet som en lineær filtermodell Det vil si at polynomet i backshift-operatøren kan inverteres, og AR p skrives som et bevegelig gjennomsnitt av uendelig rekkefølge istedenfor. Eksempel Anta at zt er en AR 1-prosess med null-middel. Hva er sant for gjeldende Perioden må også være sant for tidligere perioder Dermed ved rekursiv substitusjon kan vi skrive. Kant begge sider og ta forventninger. høyre side forsvinner som k siden f 1 Derfor summen konvergerer til zt i kvadratisk gjennomsnitt Vi kan omskrive AR p-modellen som et lineært filter som vi vet å være stasjonære. Autokorrelasjonsfunksjonen og Partial Autocorrelation Generellt Anta at en stasjonær serie zt med gjennomsnittlig null er kjent for være autoregressiv Autokorrelasjonsfunksjonen til en AR p er funnet ved å ta forventningene til og deles gjennom av variansen av z t. Dette forteller oss at rk er en lineær kombinasjon av tidligere autokorrelasjoner. Vi kan bruke dette ved å anvende Cramer s regel til jeg i løsningen for f kk Spesielt kan vi se at denne lineære avhengigheten vil forårsake f kk 0 for kp Dette karakteristiske trekk ved autoregressive serier vil være svært nyttig når det gjelder identifisering av en ukjent serie. Hvis du enten har MathCAD eller MathCAD Explorer, så Du kan eksperimentere interaktivley med noen av de AR p ideene presentert her. Gjennomgående Gjennomsnittsmodeller Vurder en dynamisk modell der serien av interesse bare avhenger av en del av t han historien om den hvite støytermen Diagrammatisk kan dette bli representert som. Definisjon Anta at det er en ukorrelert sekvens av iid tilfeldige variabler med null gjennomsnittlig og endelig varianse. Deretter er en glidende gjennomsnittlig prosess av rekkefølge q, MA q, gitt av. Theorem En bevegelse gjennomsnittlig prosess er alltid stasjonær Bevis I stedet for å starte med et generelt bevis vil vi gjøre det for et bestemt tilfelle Anta at zt er MA 1 Da Selvfølgelig har null null og endelig varians Gjennomsnittet av zt er alltid null Autocovariances vil bli gitt av. Du kan se at gjennomsnittet av tilfeldig variabel ikke avhenger av tid på noen måte. Du kan også se at autokovariansen bare avhenger av offset s, ikke hvor i serien vi starter. Vi kan bevise det samme resultatet mer generelt ved å begynne med, som har den alternative bevegelige gjennomsnittsrepresentasjonen. Vurder først variansen av z t. Ved rekursiv substitusjon kan du vise at dette er lik. Summen vi vet er en konvergent serie, slik at variansen er f init og er uavhengig av tiden. Kovariansene er for eksempel. Du kan også se at de auto covariances bare avhenger av de relative punktene i tid, ikke det kronologiske punktet i tid. Vår konklusjon fra alt dette er at en MA-prosess er stasjonær. generell MA q prosess autokorrelasjonsfunksjonen er gitt av. Den delvise autokorrelasjonsfunksjonen vil dø ut jevnt. Du kan se dette ved å invertere prosessen for å få en AR-prosess. Hvis du har enten MathCAD eller MathCAD Explorer, kan du eksperimentere interaktivt med noen av MA q ideer presentert her. Mixed Autoregressive - Moving Average Models. Definition Anta at er en ukorrelert sekvens av iid tilfeldige variabler med null gjennomsnittlig og endelig varianse Deretter gis en autoregressiv, bevegelig gjennomsnittlig prosess av orden p, q, ARMA p, q, av. Den autoregressive operatørens røtter må alle ligge utenfor enhetens sirkel. Antallet ukjente er pq. 2 P og q er åpenbare. Den 2 inneholder prosessnivået, m og th e variansen av det hvite støybegrepet, sa 2.Suppsatt at vi kombinerer våre AR - og MA-representasjoner slik at modellen er. og koeffisientene er normalisert slik at bo 1 Da blir denne representasjonen kalt en ARMA p, q hvis røttene på 1 alle ligger utenfor enhetens sirkel. Anta at yt måles som avvik fra gjennomsnittet slik at vi kan slippe ao da autokovariansfunksjonen er avledet fra. if jq, da MA-vilkårene faller ut i forventning om å gi. Det er autokovariansfunksjonen som ser ut som en typisk AR for lags etter q dør de jevnt ut etter q, men vi kan ikke si hvordan 1,2, q vil se. Vi kan også undersøke PACF for denne klassen av modellen. Modellen kan skrives som. Vi kan skrive dette som en MA inf prosess. Som antyder at PACF s dør ut sakte Med noen aritmetiske vi kunne vise at dette skjer bare etter de første p pigger bidratt av AR-delen. Empirisk lov I virkeligheten kan en stasjonær tidsserie godt bli representert av p 2 og q 2 Hvis virksomheten din er å gi en god tilnærming til virkeligheten og godhet av passform er ditt kriterium da en fortapt modell er foretrukket Hvis interessen din er prediktiv effektivitet, så er den parsimoniske modellen foretrukket. Eksperiment med ARMA ideene presentert ovenfor med et MathCAD-regneark. Utviklingsregistrere Integrere Moving Average Models. MA filter AR filter Integrere filter. Noen ganger prosessen eller serien vi prøver å modellere ikke er stasjonær i nivåer, men det kan være stasjonært i, for eksempel første forskjeller. Det er i sin opprinnelige form kanskje ikke autocovariances for serien ikke uavhengig av det kronologiske punktet i tid Men hvis vi bygger en ny serie som er de første forskjellene i den opprinnelige serien, oppfyller denne nye serien definisjonen av stasjonar. Dette er ofte tilfelle med økonomiske data som er svært trended. Definition Anta at zt er ikke stasjonær, men zt - z t - 1 tilfredsstiller definisjonen av stasjonar. Videre har den hvite støybegrepet endelige mål og varians. Vi kan skrive modellen som. Dette kalles en ARIMA p, d, q modell p identifiserer rekkefølgen til AR-operatøren, d identifiserer strømmen q identifiserer rekkefølgen til MA-operatøren Hvis røttene til f B ligger utenfor enhetens sirkel, så vi kan omskrive ARIMA p, d, q som et lineært filter. Jeg kan skrive det som en MA. Vi reserverer diskusjonen om deteksjon av enhetsrøtter for en annen del av forelesningsnotatene. Se på et dynamisk system med xt som inngangsserie og yt som en utgangsserie Diagrammatisk har vi. Disse modellene er en diskret analogi av lineære differensialligninger. Vi antar følgende forhold. hvor b indikerer en ren forsinkelse. Husk at 1-B Gjør denne substitusjonen modellen kan skrives. Hvis koeffisientpolynomet på yt kan omvendt, kan modellen skrives som. VB er kjent som impulsresponsfunksjonen. Vi vil komme over denne terminologien igjen i vår senere diskusjon av vektor autoregressive cointegration og feilkorreksjonsmodeller. MODELL IDENTIFIKASJON Å bestemme d på en klasse av modeller må man nå identifisere rekkefølgen av prosessene som genererer dataene. Det er man må gjøre beste gjetninger om rekkefølgen av AR - og MA-prosessene som kjører den stasjonære serien. En stasjonær serie er fullstendig preget av sin gjennomsnittlige og autocovariances Av analytiske grunner jobber vi vanligvis med autokorrelasjoner og delvise autokorrelasjoner. Disse to grunnleggende verktøyene har unike mønstre for stasjonære AR - og MA-prosesser. En kunne beregne utvalgsestimater av autokorrelasjon og delvise autokorrelasjonsfunksjoner og sammenligne dem med tabulerte resultater for standardmodeller. Eksempel Autocovariance Function. Sample Autocorrelation Function. The sample partial autocorrelations will be. Using autocorrelations og partial autocorrelations er ganske enkelt i utgangspunktet Anta at vi har en serie zt med null gjennomsnitt, som er AR 1 Hvis vi skulle kjøre regresjonen av zt 2 på zt 1 og zt ville vi forvente å finne at koeffisienten på zt ikke var forskjellig fra ze ro siden denne delvise autokorrelasjonen burde være null På den annen side bør autokorrelasjonene for denne serien falle eksponentielt for å øke lagene, se AR 1-eksemplet over. Anta at serien er virkelig et bevegelige gjennomsnitt. Autokorrelasjonen skal være null overalt, men ved første forsinkelse Den delvise autokorrelasjonen burde dø ut eksponentielt. Selv fra vår veldig oversiktlige rulle gjennom grunnleggende tidsserier, er det tydelig at det er en dualitet mellom AR og MA prosesser. Denne dualiteten kan oppsummeres i følgende tabell.

No comments:

Post a Comment