Bewegende gemiddelde Hierdie voorbeeld leer jy hoe om die bewegende gemiddelde van 'n tydreeks in Excel te bereken. 'N bewegende avearge gebruik te stryk onreëlmatighede (pieke en dale) om maklik tendense herken. 1. In die eerste plek kan 'n blik op ons tyd reeks. 2. Klik op die blad Data, kliek Data-analise. Nota: cant vind die Data-analise knoppie Klik hier om die analise ToolPak add-in te laai. 3. Kies bewegende gemiddelde en klik op OK. 4. Klik op die insette Range boks en kies die reeks B2: M2. 5. Klik op die boks interval en tik 6. 6. Klik in die uitset Range boks en kies sel B3. 8. Teken 'n grafiek van hierdie waardes. Verduideliking: omdat ons die interval stel om 6, die bewegende gemiddelde is die gemiddeld van die vorige 5 datapunte en die huidige data punt. As gevolg hiervan, is pieke en dale stryk uit. Die grafiek toon 'n toenemende tendens. Excel kan nie bereken die bewegende gemiddelde vir die eerste 5 datapunte, want daar is nie genoeg vorige datapunte. 9. Herhaal stappe 2 tot 8 vir interval 2 en interval 4. Gevolgtrekking: Hoe groter die interval, hoe meer die pieke en dale is glad nie. Hoe kleiner die interval, hoe nader die bewegende gemiddeldes is om die werklike data punte. Hou jy van hierdie gratis webwerf Deel asseblief hierdie bladsy op GoogleMoving gemiddeldes faseverskuiwing is die verskil in die opsporing van draaipunte tussen oorspronklike en stryk data. Hierdie effek is 'n nadeel as dit veroorsaak 'n vertraging in die opsporing van die draaipunte van die tydreeks, veral in die mees onlangse tydperk. Die simmetriese, gesentreer bewegende gemiddeldes is bestand teen hierdie effek. Maar aan die einde (en die begin) van tydreekse simmetriese tydreeks kan nie gebruik word nie. Met die oog op die stryk waardes in die beide kante van die tydreeks die asimmetriese filter gebruik word bereken, maar hulle veroorsaak dat die fase krag. Tags / Keywords: Jy kan kliek en sleep in die plot area in U zoom kan muis oor datapunte om die werklike waarde wat weergegee As daar 'n legende boks te sien, kliek op die naam reeks om weg te steek / toon hulle Introduction bewegende gemiddeldes is rekenkundige gemiddeldes van toepassing op opeenvolgende tyd strek van vaste lengte van die reeks. Wanneer dit toegepas word om die oorspronklike tydreekse produseer hulle 'n reeks van gemiddeld waardes. Die algemene formule vir bewegende gemiddelde M van koëffisiënte is: die bewegende gemiddeldes koëffisiënte is gewigte genoem. Die hoeveelheid p f 1 is die bewegende gemiddelde bestel. Die bewegende gemiddelde genoem gesentreer as die aantal waarnemings in die verlede is gelyk aan die aantal waarneming in die toekoms (bv as p gelyk is aan f). Bewegende gemiddeldes te vervang die oorspronklike tydreekse deur geweegde gemiddeldes van die huidige waardes, p Waarnemings voor die huidige waarneming en f Waarnemings na aanleiding van die huidige waarneming. Hulle word gebruik om die oorspronklike tydreekse gladder. Voorbeeld Die tabel toon die aantal passasiers gereis deur die lug deur Finland berig in 2001. Dieselfde data word op die grafiek: Tipe bewegende gemiddeldes op grond van gewig patrone, bewegende gemiddeldes kan wees: Simmetriese die gewig van patroon gebruik word vir die berekening van bewegende gemiddeldes is simmetries om die teiken data punt. Deur middel van simmetriese bewegende gemiddeldes is dit nie moontlik om die reëlmatige waardes vir die eerste p en laaste p waarnemings te verkry (vir simmetriese bewegende gemiddeldes PF). Voorbeeld Asimmetriese die gewig van patroon gebruik word vir die berekening van bewegende gemiddeldes is nie simmetries om die teiken data punt Voorbeeld bewegende gemiddeldes kan ook geklassifiseer word volgens hul bydrae tot die finale waarde as: Eenvoudige bewegende gemiddeldes, naamlik die bewegende gemiddeldes waarvoor alle gewigte is dieselfde in geval van 'n eenvoudige bewegende gemiddeldes al die waarnemings ewe bydra tot die finale waarde. Nodeloos om te sê, al eenvoudig bewegende gemiddeldes is simmetriese. Formeel, vir simmetriese bewegende gemiddelde van orde P 2p 1 al die gewigte is gelyk aan 1 / P. Voorbeeld Die prentjie hieronder vergelyk die mate van gladstryking bereik deur die toepassing van 3 termyn en 7 termyn eenvoudige bewegende gemiddeldes. Die uiterste Waarnemings (bv April 2010 of Junie 2011) het 'n laer impak op die langer bewegende gemiddelde as die korter een. Nie eenvoudige bewegende gemiddeldes, naamlik die bewegende gemiddeldes waarvoor alle gewigte is nie dieselfde nie. Die spesiale gevalle van nie-eenvoudige bewegende gemiddeldes is: Saamgestelde bewegende gemiddeldes, wat verkry word deur die saamstel van 'n eenvoudige bewegende gemiddelde van orde P, wie se koëffisiënte is almal gelyk aan 1 P en 'n eenvoudige bewegende gemiddelde van orde Q, wie se koëffisiënte is almal gelyk tot 1 Vraag Asimmetriese bewegende gemiddeldes. Eienskappe van bewegende gemiddeldes Die bewegende gemiddeldes gladder die tydreeks. Wanneer dit toegepas word om 'n tydreeks, verminder hulle die amplitude van die waargeneem skommelinge en op te tree as 'n filter wat onreëlmatige bewegings verwyder daaruit. Die bewegende gemiddeldes met toepaslike gewig patroon kan gebruik word om siklusse van 'n sekere lengte in die tyd reeks uit te skakel. In X-12-ARIMA seisoensaanpassing metode verskillende soorte bewegende gemiddeldes word gebruik om die tendens-siklus en seisoenale komponent skat. As die som van die koëffisiënte gelyk aan 1 is, dan is die bewegende gemiddelde behoud van die tendens. Bewegende gemiddeldes het twee belangrike gebreke: Hulle is nie sterk en kan diep geraak deur uitskieters Die smoothing aan die einde van die reeks kan nie gedoen word nie, maar met asimmetriese bewegende gemiddeldes watter fase verskuiwings en vertragings te voer in die opsporing van draaipunte in die X11 metode , simmetriese bewegende gemiddeldes speel 'n belangrike rol as hulle nie 'n faseverskuiwing in die stryk reeks bekend te stel. Maar, om te verhoed dat die verlies van inligting op die reeks eindig, is dit óf aangevul deur ad hoc asimmetriese bewegende gemiddeldes of toegepas op die reeks voltooi deur voorspellings. Reg boxMoving Gemiddeld 'n bewegende gemiddelde is 'n metode vir die glad tydreekse deur gemiddeld (met of sonder gewigte) 'n vaste aantal opeenvolgende terme. Die gemiddelde ldquomovesrdquo met verloop van tyd, in die sin dat elke datapunt van die reeks is agtermekaar in die gemiddelde, terwyl die oudste data punt in die span van die gemiddelde verwyder. Oor die algemeen, hoe langer die span van die gemiddelde, die gladder is die gevolg reeks. Bewegende gemiddeldes word gebruik om skommelinge glad in tydreekse of om tydreekse komponente, soos die tendens, die siklus, die seisoenale, identifiseer ens 'n bewegende gemiddelde vervang elke waarde van 'n tydreeks deur 'n (geweegde) gemiddeld van p voorafgaande waardes die gegewe waarde, en f volgende waardes van 'n reeks. As p f die bewegende gemiddelde word gesê dat centered. The bewegende gemiddelde is gesê simmetriese te wees indien dit gesentreer, en as vir elke k 1, 2, hellip. p f. die gewig van die k - ste voorafgaande waarde is gelyk aan die gewig van die k - ste volgende een. Die bewegende gemiddelde is nie gedefinieer vir die eerste p en die laaste f tydreekse waardes. Met die oog op die bewegende gemiddelde vir daardie waardes te bereken, moet die reeks word backcasted en voorspel. Bron: Taakmag op data en metadata aanbieding vir die OECD Korttermyn Ekonomiese Statistiek Werkgroep (STESWP), Parys, 2004 Konsep van stasionariteit Hipoteties, die huidige waarneming kan afhang van al die afgelope waarnemings. Sulke outoregressiewe model is onmoontlik om te skat as dit te veel parameters bevat. Maar as x t as 'n lineêre funksie van alle afgelope lags, dit bewys kan word dat outoregressiewe model is soortgelyk aan x t as 'n lineêre funksie van slegs 'n paar afgelope skokke. In 'n bewegende gemiddelde model die huidige waarde van x t word beskryf as 'n lineêre funksie van konkurrente skok (fout) en verlede skokke (foute). Inleiding Seisoene aanpassing resultate stabiel beskou as hulle relatief bestand teen kansellasie of byvoeging datapunte aan beide kante van die reeks. Stabiliteit is een van die belangrikste eienskappe van die SA uitkomste. As aanbring of vertraag paar waarnemings die seisoensaangepaste reeks of beraamde tendens-siklus aansienlik verander, sou die interpretasie van die seisoensaangepaste reeks onbetroubaar wees. Wat is die SI verhoudings Die SI verhoudings is waardes van seisoenale-onreëlmatige (SI) komponent, bereken as die verhouding van die oorspronklike reeks om die beraamde tendens. Met ander woorde, SI verhoudings is skattings van die detrended reeks. SI kaarte is handig vir ondersoek of kort termyn bewegings word veroorsaak deur seisoenale of onreëlmatige skommelinge. Hierdie grafiek is 'n diagnostiese hulpmiddel gebruik vir die ontleding van die seisoenale gedrag, vakansie patrone, uitskieters beweeg en die identifisering van die seisoenale breek in die reeks. Seisoenale aanpassing sagteware vertoon tipies die volgende inligting oor die RegARIMA model: Model keuringskriteria (inligting kriteria) is maatreëls van die relatiewe passingstoetse van 'n statistiese model. In seisoenale aanpassing programme wat hulle gebruik vir die kies van die optimale volgorde van die RegARMIA model. Vir die gegewe inligting kriteria die voorkeur model is die een met die minimum inligting kriteria waarde. Inleiding In iterasie B, (Tabel B7), iterasie C (Tabel C7) en iterasie D (Table D7 en Table D12) die Trend-siklus komponent is 'n uittreksel uit 'n skatting van die seisoensaangepaste reeks met behulp van die Henderson bewegende gemiddeldes. Die lengte van die Henderson filter word outomaties gekies deur X-12-ARIMA in 'n twee-stap procedure. Spreadsheet implementering van seisoenale aanpassing en eksponensiële gladstryking Dit is maklik om seisoenale aanpassing voer en pas eksponensiële gladstryking modelle met behulp van Excel. Die skerm beelde en kaarte hieronder is geneem uit 'n sigblad wat is opgestel om multiplikatiewe seisoenale aanpassing en lineêre eksponensiële gladstryking op die volgende kwartaallikse verkope data van Buitenboord Marine illustreer: Om 'n afskrif van die sigbladlêer self te bekom, kliek hier. Die weergawe van lineêre eksponensiële gladstryking wat hier gebruik sal word vir doeleindes van demonstrasie is Brown8217s weergawe, bloot omdat dit geïmplementeer kan word met 'n enkele kolom van formules en daar is net een glad konstante te optimaliseer. Gewoonlik is dit beter om Holt8217s weergawe dat afsonderlike glad konstantes vir vlak en tendens het gebruik. Die vooruitskatting proses verloop soos volg: (i) die eerste keer die data is seisoenaal-aangepaste (ii) dan voorspellings gegenereer vir die seisoenaal-aangepaste data via lineêre eksponensiële gladstryking en (iii) Ten slotte het die seisoensaangesuiwerde voorspellings is quotreseasonalizedquot om voorspellings vir die oorspronklike reeks te verkry . Die aanpassingsproses seisoenale word in kolomme gedoen D deur G. Die eerste stap in seisoenale aanpassing is om te bereken 'n gesentreerde bewegende gemiddelde (hier opgevoer in kolom D). Dit kan gedoen word deur die gemiddelde van twee een-jaar-wye gemiddeldes wat geneutraliseer deur 'n tydperk relatief tot mekaar. ( 'N kombinasie van twee geneutraliseer gemiddeldes eerder as 'n enkele gemiddelde nodig vir sentrering doeleindes wanneer die aantal seisoene is selfs.) Die volgende stap is om die verhouding te bereken om bewegende gemiddelde --i. e. die oorspronklike data gedeel deur die bewegende gemiddelde in elke tydperk - wat hier uitgevoer word in kolom E. (Dit is ook die quottrend-cyclequot komponent van die patroon genoem, sover tendens en besigheid-siklus effekte kan oorweeg word om almal wat bly nadat gemiddeld meer as 'n geheel jaar se data. natuurlik, maand-tot-maand veranderinge wat nie as gevolg van seisoenale kan bepaal word deur baie ander faktore, maar die 12-maande-gemiddelde glad oor hulle 'n groot mate.) die na raming seisoenale indeks vir elke seisoen word bereken deur die eerste gemiddeld al die verhoudings vir daardie spesifieke seisoen, wat gedoen word in selle G3-G6 behulp van 'n AVERAGEIF formule. Die gemiddelde verhoudings word dan verklein sodat hulle som presies 100 keer die aantal periodes in 'n seisoen, of 400 in hierdie geval, wat gedoen word in selle H3-H6. Onder in kolom F, word VLOOKUP formules wat gebruik word om die toepaslike seisoenale indeks waarde in elke ry van die datatabel voeg, volgens die kwartaal van die jaar wat dit verteenwoordig. Die gesentreerde bewegende gemiddelde en die seisoensaangepaste data beland lyk soos hierdie: Let daarop dat die bewegende gemiddelde lyk tipies soos 'n gladder weergawe van die seisoensaangepaste reeks, en dit is korter aan beide kante. Nog 'n werkblad in dieselfde Excel lêer toon die toepassing van die lineêre eksponensiële gladstryking model om die seisoensaangepaste data, begin in kolom G. 'n Waarde vir die glad konstante (alfa) bo die voorspelling kolom ingeskryf (hier, in sel H9) en vir gerief dit die omvang naam quotAlpha. quot (die naam is opgedra deur die opdrag quotInsert / naam / Createquot.) die LES model is geïnisialiseer deur die oprigting van die eerste twee voorspellings gelyk aan die eerste werklike waarde van die seisoensaangepaste reeks toegeken. Die formule wat hier gebruik word vir die LES voorspelling is die enkel-vergelyking rekursiewe vorm van Brown8217s model: Hierdie formule is in die sel wat ooreenstem met die derde tydperk (hier, sel H15) aangegaan en kopieer af van daar af. Let daarop dat die LES voorspelling vir die huidige tydperk verwys na die twee voorafgaande waarnemings en die twee voorafgaande voorspelling foute, sowel as om die waarde van alfa. So, die voorspelling formule in ry 15 slegs verwys na data wat beskikbaar is in ry 14 en vroeër was. (Natuurlik, as ons wou eenvoudig in plaas van lineêre eksponensiële gladstryking te gebruik, kan ons die SES formule hier vervang in plaas. Ons kan ook gebruik Holt8217s eerder as Brown8217s LES model, wat nog twee kolomme van formules sou vereis dat die vlak en tendens bereken wat gebruik word in die vooruitsig.) die foute word bereken in die volgende kolom (hier, kolom J) deur die aftrekking van die voorspellings van die werklike waardes. Die wortel beteken kwadraat fout is bereken as die vierkantswortel van die variansie van die foute plus die vierkant van die gemiddelde. (Dit volg uit die wiskundige identiteit. MSE afwyking (foute) (gemiddeld (foute)) 2) By die berekening van die gemiddelde en variansie van die foute in hierdie formule, is die eerste twee periodes uitgesluit omdat die model vooruitskatting nie eintlik nie begin totdat die derde tydperk (ry 15 op die sigblad). Die optimale waarde van alfa kan óf gevind word deur die hand verander alfa tot die minimum RMSE is gevind, of anders kan jy die quotSolverquot gebruik om 'n presiese minimering. Die waarde van alfa dat die Solver gevind word hier (alpha0.471) getoon. Dit is gewoonlik 'n goeie idee om die foute van die model (in omskep eenhede) te plot en ook om te bereken en stip hul outokorrelasies by lags van tot een seisoen. Hier is 'n tydreeks plot van die (seisoenaangepaste) foute: Die fout outokorrelasies word bereken deur gebruik te maak van die funksie CORREL () om die korrelasies van die foute te bereken met hulself uitgestel word deur een of meer periodes - besonderhede word in die sigblad model . Hier is 'n plot van die outokorrelasies van die foute by die eerste vyf lags: Die outokorrelasies by lags 1 tot 3 is baie naby aan nul, maar die pen op lag 4 (wie se waarde is 0.35) is 'n bietjie lastig - dit dui daarop dat die seisoenale aanpassing proses het nie heeltemal suksesvol. Maar dit is eintlik net effens betekenisvol. 95 betekenis bands om te toets of outokorrelasies is aansienlik verskil van nul is min of meer plus-of-minus 2 / SQRT (N-k), waar n die steekproefgrootte en k is die lag. Hier N 38 en k wissel van 1 tot 5, so die vierkant-wortel-van-n-minus-k is ongeveer 6 vir almal, en vandaar die perke vir die toets van die statistiese betekenisvolheid van afwykings van nul is min of meer plus - of-minus 2/6, of 0.33. As jy die waarde van alfa wissel met die hand in hierdie Excel model, kan jy die effek op die tydreeks en outokorrelasie erwe van die foute in ag te neem, sowel as op die wortel-gemiddelde-kwadraat fout, wat onder sal wees geïllustreer. Aan die onderkant van die sigblad, is die voorspelling formule quotbootstrappedquot in die toekoms deur bloot vervang voorspellings vir werklike waardes by die punt waar die werklike data loop uit - d. w.z. waar quotthe futurequot begin. (Met ander woorde, in elke sel waar 'n toekomstige datawaarde sou plaasvind, 'n selverwysing is ingevoeg wat daarop dui dat die voorspelling gemaak vir daardie tydperk.) Al die ander formules is eenvoudig van bo af gekopieer: Let daarop dat die foute vir voorspellings van die toekoms is al bereken as nul. Dit beteken nie dat die werklike foute sal nul wees nie, maar eerder dit weerspieël bloot die feit dat vir doeleindes van voorspelling is ons veronderstelling dat die toekoms data die voorspellings sal gelyk gemiddeld. Die gevolglike LES voorspellings vir die seisoenaal-aangepaste data soos volg lyk: Met hierdie besondere waarde van Alpha, wat is optimaal vir een-periode-vooruit voorspellings, die geprojekteerde tendens is effens opwaarts, wat die plaaslike tendens wat oor die afgelope 2 jaar is waargeneem of so. Vir ander waardes van Alpha dalk 'n heel ander tendens projeksie verkry. Dit is gewoonlik 'n goeie idee om te sien wat gebeur met die langtermyn-tendens projeksie wanneer Alpha is uiteenlopend, omdat die waarde wat die beste vir 'n kort termyn vooruitskatting sal nie noodwendig die beste waarde vir die voorspelling van die meer verre toekoms wees. Byvoorbeeld, hier is die resultaat wat verkry word indien die waarde van alfa hand is ingestel op 0,25: Die geprojekteerde langtermyn-tendens is nou negatiewe eerder as positiewe Met 'n kleiner waarde van Alpha model plaas meer gewig op ouer data in sy skatting van die huidige vlak en tendens, en sy voorspellings langtermyn weerspieël die afwaartse neiging waargeneem oor die afgelope 5 jaar, eerder as die meer onlangse opwaartse neiging. Hierdie grafiek ook duidelik illustreer hoe die model met 'n kleiner waarde van Alpha is stadiger te reageer op quotturning pointsquot in die data en dus geneig is om 'n fout van die dieselfde teken maak vir baie tye in 'n ry. Die 1-stap-ahead voorspelling foute is groter gemiddeld as dié verkry voordat (RMSE van 34,4 eerder as 27.4) en sterk positief autocorrelated. Die lag-1 outokorrelasie van 0,56 oorskry grootliks die waarde van 0.33 hierbo bereken vir 'n statisties beduidende afwyking van nul. As 'n alternatief vir slingerspoed die waarde van alfa ten einde meer konserwatisme te voer in 'n lang termyn voorspellings, is 'n quottrend dampeningquot faktor soms by die model ten einde te maak die geprojekteerde tendens plat uit na 'n paar periodes. Die finale stap in die bou van die voorspelling model is om die LES voorspellings quotreasonalizequot deur hulle deur die toepaslike seisoenale indekse te vermenigvuldig. So, die reseasonalized voorspellings in kolom Ek is net die produk van die seisoenale indekse in kolom F en die seisoensaangepaste LES voorspellings in kolom H. Dit is relatief maklik om vertrouensintervalle bereken vir een-stap-ahead voorspellings gemaak deur hierdie model: eerste bereken die RMSE (wortel-gemiddelde-kwadraat fout, wat net die vierkantswortel van die MSE) en dan bereken 'n vertrouensinterval vir die seisoensaangepaste voorspel deur optelling en aftrekking twee keer die RMSE. (Oor die algemeen 'n 95 vertrouensinterval vir 'n een-tydperk lig voorspelling is min of meer gelyk aan die punt voorspelling plus-of-minus twee keer die geskatte standaardafwyking van die voorspelling foute, die aanvaarding van die fout verspreiding is ongeveer normale en die steekproefgrootte groot genoeg is, sê, 20 of meer. Hier is die RMSE eerder as die monster standaardafwyking van die foute is die beste raming van die standaard afwyking van toekomstige vooruitsig foute, want dit neem vooroordeel sowel toevallige variasies in ag.) die vertroue perke vir die seisoensaangepaste voorspelling is dan reseasonalized. saam met die voorspelling, deur hulle met die toepaslike seisoenale indekse te vermenigvuldig. In hierdie geval is die RMSE is gelyk aan 27.4 en die seisoensaangepaste voorspelling vir die eerste toekoms tydperk (Desember-93) is 273,2. sodat die seisoensaangepaste 95 vertrouensinterval is 273,2-227,4 218,4 te 273.2227.4 328,0. Vermenigvuldig hierdie perke deur Decembers seisoenale indeks van 68,61. Ons kry onderste en boonste vertroue grense van 149,8 en 225,0 rondom die Desember-93 punt voorspelling van 187,4. Vertroue perke vir voorspellings meer as een tydperk wat voorlê, sal oor die algemeen uit te brei as die voorspelling horison toeneem, as gevolg van onsekerheid oor die vlak en tendens asook die seisoenale faktore, maar dit is moeilik om hulle te bereken in die algemeen deur analitiese metodes. (Die geskikte manier om vertroue perke vir die LES voorspelling bereken is deur die gebruik van ARIMA teorie, maar die onsekerheid in die seisoenale indekse is 'n ander saak.) As jy 'n realistiese vertroue interval vir 'n voorspelling wil meer as een tydperk wat voorlê, met al die bronne van fout in ag, jou beste bet is om empiriese metodes gebruik: byvoorbeeld, 'n vertrouensinterval vir 'n 2-stap vorentoe voorspel verkry, jy kan 'n ander kolom skep op die sigblad om 'n 2-stap-ahead voorspelling bereken vir elke tydperk ( deur Opstarten die een-stap-ahead voorspelling). bereken dan die RMSE van die 2-stap-ahead voorspelling foute en gebruik dit as die basis vir 'n 2-stap-ahead vertroue interval. Moving gemiddelde en eksponensiële gladstryking modelle As 'n eerste stap in die beweging van buite gemiddelde modelle, ewekansige loop modelle, en lineêre tendens modelle, kan nonseasonal patrone en tendense word geëkstrapoleer deur 'n bewegende-gemiddelde of glad model. Die basiese aanname agter gemiddelde en glad modelle is dat die tyd reeks is plaaslik stilstaande met 'n stadig wisselende gemiddelde. Vandaar, neem ons 'n bewegende (plaaslike) gemiddelde om die huidige waarde van die gemiddelde skat en dan gebruik dit as die voorspelling vir die nabye toekoms. Dit kan beskou word as 'n kompromie tussen die gemiddelde model en die ewekansige-stap-sonder-drif-model. Dieselfde strategie gebruik kan word om te skat en ekstrapoleer 'n plaaslike tendens. 'N bewegende gemiddelde is dikwels 'n quotsmoothedquot weergawe van die oorspronklike reeks, want kort termyn gemiddelde het die effek van gladstryking uit die knoppe in die oorspronklike reeks. Deur die aanpassing van die mate van gladstryking (die breedte van die bewegende gemiddelde), kan ons hoop om 'n soort van 'n optimale balans tussen die prestasie van die gemiddelde en die stogastiese wandeling modelle slaan. Die eenvoudigste soort gemiddelde model is die. Eenvoudige (ewe-geweeg) Moving Average: Die voorspelling vir die waarde van Y op tyd T1 wat gemaak word op tydstip t is gelyk aan die eenvoudige gemiddelde van die mees onlangse m waarnemings: (hier en elders sal ek die simbool 8220Y-hat8221 gebruik om op te staan vir 'n voorspelling van die tyd reeks Y gemaak op die vroegste moontlike voor datum deur 'n gegewe model.) Hierdie gemiddelde is gesentreer op tydperk t (M1) / 2, wat impliseer dat die skatting van die plaaslike gemiddelde sal neig om agter die werklike waarde van die plaaslike gemiddelde met sowat (M1) / 2 periodes. So, sê ons die gemiddelde ouderdom van die data in die eenvoudige bewegende gemiddelde is (M1) / 2 met betrekking tot die tydperk waarvoor die voorspelling is bereken: dit is die hoeveelheid tyd waarop voorspellings sal neig om agter draaipunte in die data. Byvoorbeeld, as jy gemiddeld die afgelope 5 waardes, sal die voorspellings wees oor 3 periodes laat in reaksie op draaipunte. Let daarop dat indien M1, die eenvoudige bewegende gemiddelde (SMA) model is soortgelyk aan die ewekansige loop model (sonder groei). As m is baie groot (vergelykbaar met die lengte van die skatting tydperk), die SMA model is gelykstaande aan die gemiddelde model. Soos met enige parameter van 'n voorspelling model, is dit gebruiklik om die waarde van k te pas ten einde die beste quotfitquot om die data, dit wil sê die kleinste voorspelling foute gemiddeld behaal. Hier is 'n voorbeeld van 'n reeks wat blykbaar ewekansige skommelinge toon om 'n stadig-wisselende gemiddelde. In die eerste plek kan probeer om dit aan te pas met 'n ewekansige loop model, wat gelykstaande is aan 'n eenvoudige bewegende gemiddelde van 1 kwartaal: Die ewekansige loop model reageer baie vinnig om veranderinge in die reeks, maar sodoende dit tel baie van die quotnoisequot in die data (die ewekansige skommelinge) asook die quotsignalquot (die plaaslike gemiddelde). As ons eerder probeer 'n eenvoudige bewegende gemiddelde van 5 terme, kry ons 'n gladder lyk stel voorspellings: Die 5 termyn eenvoudige bewegende gemiddelde opbrengste aansienlik kleiner foute as die ewekansige loop model in hierdie geval. Die gemiddelde ouderdom van die data in hierdie voorspelling is 3 ((51) / 2), sodat dit is geneig om agter draaipunte met sowat drie periodes. (Byvoorbeeld, blyk 'n afswaai het plaasgevind by tydperk 21, maar die voorspellings nie omdraai tot verskeie tydperke later.) Let daarop dat die langtermyn-voorspellings van die SMA model is 'n horisontale reguit lyn, net soos in die ewekansige loop model. So, die SMA model veronderstel dat daar geen neiging in die data. Maar, terwyl die voorspellings van die ewekansige loop model is eenvoudig gelyk aan die laaste waargenome waarde, die voorspellings van die SMA model is gelykstaande aan 'n geweegde gemiddelde van die afgelope waardes. Die vertroue perke bereken deur Stat Graphics vir die langtermyn-voorspellings van die eenvoudige bewegende gemiddelde nie groter as die vooruitskatting horison styg kry. Dit is natuurlik nie korrek Ongelukkig is daar geen onderliggende statistiese teorie wat ons vertel hoe die vertrouensintervalle behoort te brei vir hierdie model. Dit is egter nie te moeilik om empiriese ramings van die vertroue perke vir die langer-horison voorspellings te bereken. Byvoorbeeld, kan jy die opstel van 'n sigblad waarop die SMA model sal gebruik word om 2 stappe vooruit, 3 stappe vooruit, ens binne die historiese data monster voorspel. Jy kan dan bereken die monster standaardafwykings van die foute op elke voorspelling horison, en dan bou vertrouensintervalle vir langer termyn voorspellings deur optelling en aftrekking veelvoude van die toepaslike standaard afwyking. As ons probeer om 'n 9-termyn eenvoudige bewegende gemiddelde, kry ons selfs gladder voorspellings en meer van 'n sloerende uitwerking: Die gemiddelde ouderdom is nou 5 periodes ((91) / 2). As ons 'n 19-termyn bewegende gemiddelde te neem, die gemiddelde ouderdom toeneem tot 10: Let daarop dat, inderdaad, is die voorspellings nou agter draaipunte met sowat 10 periodes. Watter bedrag van smoothing is die beste vir hierdie reeks Hier is 'n tabel wat hulle dwaling statistieke vergelyk, ook met 'n 3-gemiddelde: Model C, die 5-termyn bewegende gemiddelde, lewer die laagste waarde van RMSE deur 'n klein marge oor die 3 - term en 9 termyn gemiddeldes, en hul ander statistieke is byna identies. So, onder modelle met 'n baie soortgelyke fout statistieke, kan ons kies of ons 'n bietjie meer responsiewe ingesteldheid of 'n bietjie meer gladheid in die voorspellings sou verkies. (Terug na bo.) Browns Eenvoudige Eksponensiële Smoothing (eksponensieel geweeg bewegende gemiddelde) Die eenvoudige bewegende gemiddelde model hierbo beskryf het die ongewenste eienskap dat dit behandel die laaste k Waarnemings ewe en heeltemal ignoreer al voorafgaande waarnemings. Intuïtief, moet afgelope data verdiskonteer in 'n meer geleidelike mode - byvoorbeeld, die mees onlangse waarneming moet 'n bietjie meer gewig kry as 2 mees onlangse, en die 2de mees onlangse moet 'n bietjie meer gewig as die 3 mees onlangse kry, en so aan. Die eenvoudige eksponensiële gladstryking (SES) model accomplishes hierdie. Laat 945 dui n quotsmoothing constantquot ( 'n getal tussen 0 en 1). Een manier om die model te skryf is om 'n reeks L dat die huidige vlak (dit wil sê die plaaslike gemiddelde waarde) van die reeks verteenwoordig as geraamde van data tot op hede te definieer. Die waarde van L op tydstip t is rekursief bereken uit sy eie vorige waarde soos volg: Dus, die huidige stryk waarde is 'n interpolasie tussen die vorige stryk waarde en die huidige waarneming, waar 945 kontroles die nabyheid van die geïnterpoleerde waarde tot die mees onlangse waarneming. Die voorspelling vir die volgende tydperk is eenvoudig die huidige stryk waarde: anders gestel ons kan die volgende voorspelling direk in terme van vorige voorspellings en vorige waarnemings uit te druk, in enige van die volgende ekwivalent weergawes. In die eerste weergawe, die voorspelling is 'n interpolasie tussen vorige skatting en vorige waarneming: In die tweede weergawe, is die volgende voorspelling verkry deur die aanpassing van die vorige skatting in die rigting van die vorige fout deur 'n breukdeel bedrag 945. is die fout gemaak by tyd t. In die derde weergawe, die voorspelling is 'n eksponensieel geweeg (dit wil sê afslag) bewegende gemiddelde met afslag faktor 1- 945: Die interpolasie weergawe van die voorspelling formule is die eenvoudigste om te gebruik as jy die uitvoering van die model op 'n spreadsheet: dit pas in 'n enkele sel en bevat selverwysings verwys na die vorige skatting, die vorige waarneming, en die sel waar die waarde van 945 gestoor. Let daarop dat indien 945 1, die SES model is gelykstaande aan 'n ewekansige loop model (sonder groei). As 945 0, die SES model is gelykstaande aan die gemiddelde model, met die veronderstelling dat die eerste stryk waarde gelyk aan die gemiddelde is ingestel. (Terug na bo.) Die gemiddelde ouderdom van die data in die eenvoudige eksponensiële-glad voorspelling is 1/945 relatief tot die tydperk waarvoor die voorspelling is bereken. (Dit is nie veronderstel duidelik te wees, maar dit kan maklik aangetoon deur die evaluering van 'n oneindige reeks.) Dus, die eenvoudige bewegende gemiddelde voorspelling is geneig om agter draaipunte met sowat 1/945 periodes. Byvoorbeeld, wanneer 945 0.5 die lag is 2 periodes wanneer 945 0.2 die lag is 5 periodes wanneer 945 0.1 die lag is 10 periodes, en so aan. Vir 'n gegewe gemiddelde ouderdom (bv bedrag van lag), die eenvoudige eksponensiële gladstryking (SES) voorspelling is 'n bietjie beter as die eenvoudige bewegende gemiddelde (SMA) voorspel, want dit plaas relatief meer gewig op die mees onlangse waarneming --i. e. dit is 'n bietjie meer quotresponsivequot om veranderinge voorkom in die onlangse verlede. Byvoorbeeld, 'n SMA model met 9 terme en 'n SES model met 945 0.2 beide het 'n gemiddelde ouderdom van 5 vir die data in hul voorspellings, maar die SES model plaas meer gewig op die laaste 3 waardes as wel die SMA model en by die Terselfdertyd is dit doesn8217t heeltemal 8220forget8221 oor waardes meer as 9 tydperke oud was, soos getoon in hierdie grafiek: nog 'n belangrike voordeel van die SES model die SMA model is dat die SES model maak gebruik van 'smoothing parameter wat voortdurend veranderlike, so dit kan maklik new deur die gebruik van 'n quotsolverquot algoritme om die gemiddelde minimum te beperk kwadraat fout. Die optimale waarde van 945 in die SES model vir hierdie reeks blyk te wees 0,2961, soos hier gewys word: die gemiddelde ouderdom van die data in hierdie voorspelling is 1 / 0,2961 3.4 tydperke, wat soortgelyk is aan dié van 'n 6-termyn eenvoudige bewegende gemiddelde. Die langtermyn-voorspellings van die SES model is 'n horisontale reguit lyn. soos in die SMA model en die ewekansige loop model sonder groei. Let egter daarop dat die vertrouensintervalle bereken deur Stat Graphics nou divergeer in 'n redelike aantreklike mode, en dat hulle aansienlik nouer as die vertrouensintervalle vir die ewekansige loop model. Die SES model veronderstel dat die reeks is 'n bietjie quotmore predictablequot as wel die ewekansige loop model. 'N SES model is eintlik 'n spesiale geval van 'n ARIMA model. sodat die statistiese teorie van ARIMA modelle bied 'n goeie basis vir die berekening van vertrouensintervalle vir die SES model. In die besonder, 'n SES model is 'n ARIMA model met een nonseasonal verskil, 'n MA (1) termyn, en geen konstante term. andersins bekend as 'n quotARIMA (0,1,1) model sonder constantquot. Die MA (1) koëffisiënt in die ARIMA model stem ooreen met die hoeveelheid 1- 945 in die SES model. Byvoorbeeld, as jy 'n ARIMA (0,1,1) model inpas sonder konstante om die reeks te ontleed hier, die beraamde MA (1) koëffisiënt blyk te wees 0,7029, wat byna presies 'n minus 0,2961. Dit is moontlik om die aanname van 'n nie-nul konstante lineêre tendens voeg by 'n SES model. Om dit te doen, net 'n ARIMA model met een nonseasonal verskil en 'n MA (1) termyn met 'n konstante, dit wil sê 'n ARIMA (0,1,1) model met 'n konstante spesifiseer. Die langtermyn-voorspellings sal dan 'n tendens wat gelyk is aan die gemiddelde tendens waargeneem oor die hele skatting tydperk is. Jy kan dit nie doen in samewerking met seisoenale aanpassing, omdat die aanpassing opsies seisoenale is afgeskakel wanneer die model tipe is ingestel op ARIMA. Jy kan egter 'n konstante langtermyn eksponensiële tendens om 'n eenvoudige eksponensiële gladstryking model voeg (met of sonder seisoenale aanpassing) deur gebruik te maak van die opsie inflasie-aanpassing in die vooruitskatting prosedure. Die toepaslike quotinflationquot (persentasie groei) koers per periode kan geskat word as die helling koëffisiënt in 'n lineêre tendens model toegerus om die data in samewerking met 'n natuurlike logaritme transformasie, of dit kan op grond van ander, onafhanklike inligting oor die langtermyn groeivooruitsigte . (Terug na bo.) Browns Lineêre (dws dubbel) Eksponensiële glad die SMA modelle en SES modelle aanvaar dat daar geen tendens van enige aard in die data (wat gewoonlik OK of ten minste nie-te-sleg vir 1- stap-ahead voorspellings wanneer die data is relatief raserig), en hulle kan verander word om 'n konstante lineêre tendens inkorporeer soos hierbo getoon. Wat van kort termyn tendense As 'n reeks vertoon 'n wisselende koers van groei of 'n sikliese patroon wat uitstaan duidelik teen die geraas, en as daar 'n behoefte aan meer as 1 tydperk wat voorlê voorspel, dan skatting van 'n plaaslike tendens kan ook wees n probleem. Die eenvoudige eksponensiële gladstryking model veralgemeen kan word na 'n lineêre eksponensiële gladstryking (LES) model wat plaaslike begrotings van beide vlak en tendens bere te kry. Die eenvoudigste-time wisselende tendens model is Browns lineêr eksponensiële gladstryking model, wat twee verskillende reëlmatige reeks wat op verskillende punte gesentreer in die tyd gebruik. Die vooruitskatting formule is gebaseer op 'n ekstrapolasie van 'n streep deur die twee sentrums. ( 'N meer gesofistikeerde weergawe van hierdie model, Holt8217s, word hieronder bespreek.) Die algebraïese vorm van Brown8217s lineêr eksponensiële gladstryking model, soos dié van die eenvoudige eksponensiële gladstryking model, uitgedruk kan word in 'n aantal verskillende maar ekwivalente vorms. Die quotstandardquot vorm van hierdie model word gewoonlik uitgedruk as volg: Laat S dui die enkel-stryk reeks verkry deur die toepassing van eenvoudige eksponensiële gladstryking om reeks Y. Dit is, is die waarde van S op tydperk t gegee word deur: (Onthou dat, onder eenvoudige eksponensiële gladstryking, dit sou die voorspelling vir Y by tydperk T1 wees) Dan Squot dui die dubbel-stryk reeks verkry deur die toepassing van eenvoudige eksponensiële gladstryking (met behulp van dieselfde 945) tot reeks S:. ten slotte, die voorspelling vir Y tk. vir enige kgt1, word gegee deur: Dit lewer e 1 0 (dit wil sê kul n bietjie, en laat die eerste skatting gelyk wees aan die werklike eerste waarneming), en e 2 Y 2 8211 Y 1. waarna voorspellings gegenereer met behulp van die vergelyking hierbo. Dit gee dieselfde toegerus waardes as die formule gebaseer op S en S indien laasgenoemde is begin met behulp van S 1 S 1 Y 1. Hierdie weergawe van die model gebruik word op die volgende bladsy wat 'n kombinasie van eksponensiële gladstryking met seisoenale aanpassing illustreer. Holt8217s Lineêre Eksponensiële Smoothing Brown8217s LES model bere plaaslike begrotings van vlak en tendens deur glad die onlangse data, maar die feit dat dit nie so met 'n enkele glad parameter plaas 'n beperking op die data patrone wat dit in staat is om aan te pas: die vlak en tendens word nie toegelaat om wissel op onafhanklike tariewe. Holt8217s LES model spreek hierdie kwessie deur die insluiting van twee glad konstantes, een vir die vlak en een vir die tendens. Te eniger tyd t, soos in Brown8217s model, die daar is 'n skatting L t van die plaaslike vlak en 'n skatting T t van die plaaslike tendens. Hier is hulle rekursief bereken vanaf die waarde van Y op tydstip t en die vorige raming van die vlak en tendens waargeneem deur twee vergelykings wat eksponensiële gladstryking afsonderlik van toepassing op hulle. As die geskatte vlak en tendens op tydstip t-1 is L t82091 en T t-1. onderskeidelik, dan is die voorspelling vir Y tshy wat op tydstip t-1 sal gemaak is gelyk aan L t-1 T T-1. Wanneer die werklike waarde is waargeneem, is die opgedateer skatting van die vlak rekursief bereken deur interpol tussen Y tshy en sy voorspelling, L t-1 T T-1, die gebruik van gewigte van 945 en 1- 945. Die verandering in die geskatte vlak, naamlik L t 8209 L t82091. geïnterpreteer kan word as 'n lawaaierige meting van die tendens op tydstip t. Die opgedateer skatting van die tendens is dan rekursief bereken deur interpol tussen L t 8209 L t82091 en die vorige skatting van die tendens, T t-1. die gebruik van gewigte van 946 en 1-946: Die interpretasie van die tendens-glad konstante 946 is soortgelyk aan dié van die vlak glad konstante 945. Models met klein waardes van 946 aanvaar dat die tendens verander net baie stadig met verloop van tyd, terwyl modelle met groter 946 aanvaar dat dit vinniger is om te verander. 'N Model met 'n groot 946 is van mening dat die verre toekoms is baie onseker, omdat foute in die tendens-skatting word baie belangrik wanneer voorspel meer as een tydperk wat voorlê. (Terug na bo.) Die smoothing konstantes 945 en 946 kan in die gewone manier word beraam deur die vermindering van die gemiddelde kwadraat fout van die 1-stap-ahead voorspellings. Wanneer dit in Stat Graphics gedoen, die skattings uitdraai om te wees 945 0.3048 en 946 0,008. Die baie klein waarde van 946 beteken dat die model veronderstel baie min verandering in die tendens van een tydperk na die volgende, so basies hierdie model is besig om 'n langtermyn-tendens skat. Volgens analogie met die idee van die gemiddelde ouderdom van die data wat gebruik word in die skatte van die plaaslike vlak van die reeks, die gemiddelde ouderdom van die data wat gebruik word in die skatte van die plaaslike tendens is eweredig aan 1/946, hoewel nie presies gelyk aan Dit. In hierdie geval is dit blyk 1 / 0,006 125. Dit isn8217t n baie presiese aantal sover die akkuraatheid van die skatting van 946 isn8217t regtig 3 desimale plekke te wees, maar dit is van dieselfde algemene orde van grootte as die steekproefgrootte van 100 , so hierdie model is gemiddeld oor 'n hele klomp van die geskiedenis in die skatte van die tendens. Die voorspelling plot hieronder toon dat die LES model skat 'n effens groter plaaslike tendens aan die einde van die reeks as die konstante tendens geskat in die SEStrend model. Ook waarvan die beraamde waarde van 945 is byna identies aan die een wat deur die pas van die SES model met of sonder tendens, so dit is amper dieselfde model. Nou, doen hierdie lyk redelike voorspellings vir 'n model wat veronderstel is om te beraming 'n plaaslike tendens As jy hierdie plot 8220eyeball8221, dit lyk asof die plaaslike tendens afwaarts gedraai aan die einde van die reeks: Wat het die parameters van hierdie model gebeur is beraam deur die vermindering van die kwadraat fout van 1-stap-ahead voorspellings, nie langer termyn voorspellings, in welke geval die tendens 'n groot verskil doesn8217t maak. As alles wat jy is op soek na is 1-stap-ahead foute, is jy nie sien die groter prentjie van tendense oor (sê) 10 of 20 periodes. Ten einde hierdie model meer in harmonie te kry met ons oogbal ekstrapolasie van die data, kan ons met die hand die tendens-glad konstante pas sodat dit 'n korter basislyn vir tendens skatting. Byvoorbeeld, as ons kies om te stel 946 0.1, dan is die gemiddelde ouderdom van die gebruik in die skatte van die plaaslike tendens data is 10 periodes, wat beteken dat ons die gemiddeld van die tendens oor daardie laaste 20 periodes of so. Here8217s wat die voorspelling plot lyk asof ons '946 0.1 terwyl 945 0.3. Dit lyk intuïtief redelike vir hierdie reeks, maar dit is waarskynlik gevaarlik om hierdie tendens te ekstrapoleer nie meer as 10 periodes in die toekoms. Wat van die fout statistieke Hier is 'n model vergelyking vir die twee modelle hierbo asook drie SES modelle getoon. Die optimale waarde van 945.Vir die SES model is ongeveer 0,3, maar soortgelyke resultate (met 'n bietjie meer of minder 'n responsiewe ingesteldheid, onderskeidelik) verkry met 0,5 en 0,2. (A) Holts lineêre exp. glad met alfa 0,3048 en beta 0,008 (B) Holts lineêre exp. glad met alfa 0,3 en beta 0,1 (C) Eenvoudige eksponensiële gladstryking met alfa 0,5 (D) Eenvoudige eksponensiële gladstryking met alfa 0,3 (E) Eenvoudige eksponensiële gladstryking met alfa 0,2 hul statistieke is byna identies, so ons can8217t regtig die keuse te maak op die basis van 1-stap-ahead voorspelling foute binne die data monster. Ons het om terug te val op ander oorwegings. As ons glo dat dit sinvol om die huidige tendens skatting van wat die afgelope 20 periodes of so gebeur baseer, kan ons 'n saak vir die LES model met 945 0.3 en 946 0.1 maak. As ons wil hê agnostikus te wees oor die vraag of daar 'n plaaslike tendens, dan een van die SES modelle makliker om te verduidelik kan wees en sou ook vir meer middel-of-the-road voorspellings vir die volgende 5 of 10 periodes. (Terug na bo.) Watter tipe tendens-ekstrapolasie die beste: horisontale of lineêre empiriese bewyse dui daarop dat, indien die data is reeds aangepas (indien nodig) vir inflasie, dan is dit dalk onverstandig om kort termyn lineêre ekstrapoleer wees tendense baie ver in die toekoms. Tendense duidelik vandag mag verslap in die toekoms as gevolg van uiteenlopende oorsake soos produk veroudering, toenemende mededinging en sikliese afswaai of opwaartse fases in 'n bedryf. Om hierdie rede, eenvoudige eksponensiële gladstryking voer dikwels beter out-of-monster as wat dit andersins word verwag, ten spyte van sy quotnaivequot horisontale tendens ekstrapolasie. Gedempte tendens veranderinge van die lineêre eksponensiële gladstryking model word ook dikwels gebruik in die praktyk om 'n aantekening van konserwatisme in te voer in die tendens projeksies. Die gedempte-tendens LES model geïmplementeer kan word as 'n spesiale geval van 'n ARIMA model, in die besonder, 'n ARIMA (1,1,2) model. Dit is moontlik om vertrouensintervalle rondom langtermyn voorspellings wat deur eksponensiële gladstryking modelle bereken deur die oorweging van hulle as spesiale gevalle van ARIMA modelle. (Pasop: nie alle sagteware bereken vertrouensintervalle vir hierdie modelle korrek.) Die breedte van die vertrouensintervalle hang af van (i) die RMS fout van die model, (ii) die tipe glad (eenvoudige of lineêr) (iii) die waarde (s) van die smoothing konstante (s) en (iv) die aantal periodes voor jy voorspel. In die algemeen, die tussenposes versprei vinniger as 945 kry groter in die SES model en hulle uitgebrei, sodat baie vinniger as lineêre, eerder as eenvoudige smoothing gebruik. Hierdie onderwerp word verder in die ARIMA modelle deel van die notas bespreek. (Terug na bo.)
No comments:
Post a Comment