Tuesday 4 April 2017

Autoregressive Moving Average Arma Modell

Autoregressive Integrated Moving Average - ARIMA. DEFINITION von Autoregressiv Integrated Moving Average - ARIMA. A statistische Analyse-Modell, das Zeitreihen-Daten verwendet, um zukünftige Trends vorherzusagen Es ist eine Form der Regressionsanalyse, die künftige Bewegungen entlang der scheinbar zufälligen Spaziergang durch Aktien vorhersagen will Und der Finanzmarkt durch die Prüfung der Unterschiede zwischen den Werten in der Serie statt der Verwendung der tatsächlichen Datenwerte Lags der differenzierten Serien werden als autoregressiv bezeichnet und Verzögerungen innerhalb der prognostizierten Daten werden als gleitender Durchschnitt bezeichnet. BREAKING DOWN Autoregressive Integrated Moving Average - ARIMA. Dieser Modelltyp wird im Allgemeinen als ARIMA p, d, q bezeichnet, wobei die ganzen Zahlen auf die autoregressiven integrierten und gleitenden mittleren Teile des Datensatzes verweisen, bzw. ARIMA-Modellierung kann Trends, Saisonalzenzyklen, Fehler und nicht-stationär berücksichtigen Aspekte eines Datensatzes bei der Erstellung von Prognosen. Einleitung zu ARIMA Nichtseasonale Modelle. ARIMA p, d, q Vorhersage Gleichung ARIMA Modelle sind in der Theorie die allgemeinste Klasse von Modellen für die Vorhersage einer Zeitreihe, die durch Differenzierung stationär gemacht werden kann Wenn nötig, vielleicht in Verbindung mit nichtlinearen Transformationen wie zB Protokollierung oder Abblendung ggf. Eine zufällige Variable, die eine Zeitreihe ist, ist stationär, wenn ihre statistischen Eigenschaften im Laufe der Zeit konstant sind. Eine stationäre Serie hat keinen Trend, ihre Variationen um ihren Mittelwert haben eine Konstante Amplitude, und es wackelt in einer konsequenten Art und Weise, dh seine kurzfristigen zufälligen Zeitmuster immer gleich aussehen in einem statistischen Sinne Die letztere Bedingung bedeutet, dass seine Autokorrelationen Korrelationen mit ihren eigenen vorherigen Abweichungen vom Mittel konstant über die Zeit oder gleichermaßen, dass Sein Leistungsspektrum bleibt über die Zeit konstant Eine zufällige Variable dieser Form kann wie üblich als eine Kombination von Signal und Rauschen betrachtet werden, und das Signal, wenn man offensichtlich ist, könnte ein Muster der schnellen oder langsamen mittleren Reversion oder sinusförmigen Oszillation oder schnell sein Abwechslung im Zeichen, und es könnte auch eine saisonale Komponente haben Ein ARIMA-Modell kann als ein Filter betrachtet werden, der versucht, das Signal vom Rauschen zu trennen, und das Signal wird dann in die Zukunft extrapoliert, um Prognosen zu erhalten. Die ARIMA-Prognosegleichung für ein Stationäre Zeitreihe ist eine lineare, dh regressionsgleiche Gleichung, bei der die Prädiktoren aus Verzögerungen der abhängigen Variablen und / oder Verzögerungen der Prognosefehler bestehen. Das ist. Begrenzter Wert von Y eine Konstante und / oder eine gewichtete Summe von einem oder mehreren neueren Werten von Y und oder eine gewichtete Summe aus einem oder mehreren neueren Werten der Fehler. Wenn die Prädiktoren nur aus verzögerten Werten von Y bestehen, ist es ein reines autoregressives, selbstregressives Modell, das nur ein Spezialfall eines Regressionsmodells ist und das sein könnte Mit Standard-Regressionssoftware ausgestattet Zum Beispiel ist ein autoregressives AR 1-Modell erster Ordnung für Y ein einfaches Regressionsmodell, bei dem die unabhängige Variable nur Y um eine Periode LAG Y, 1 in Statgraphics oder YLAG1 in RegressIt liegt. Wenn einige der Prädiktoren sind Sind Verzögerungen der Fehler, ein ARIMA-Modell ist es kein lineares Regressionsmodell, denn es gibt keine Möglichkeit, den letzten Periodenfehler als eigenständige Variable anzugeben, die Fehler müssen bei der Periode auf Periodenbasis berechnet werden, wenn das Modell eingebaut ist Zu den Daten Aus technischer Sicht ist das Problem bei der Verwendung von verzögerten Fehlern als Prädiktoren, dass die Vorhersagen des Modells keine linearen Funktionen der Koeffizienten sind, obwohl sie lineare Funktionen der vergangenen Daten sind. Daher müssen Koeffizienten in ARIMA-Modellen, die verzögerte Fehler enthalten, Durch nichtlineare Optimierungsmethoden geschätzt werden, anstatt durch einfaches Lösen eines Gleichungssystems. Das Akronym ARIMA steht für Auto-Regressive Integrated Moving Average Lags der stationären Serie in der Prognose-Gleichung heißen autoregressive Begriffe, Verzögerungen der Prognosefehler sind Genannt gleitende durchschnittliche Ausdrücke, und eine Zeitreihe, die differenziert werden muss, um stationär zu sein, soll eine integrierte Version einer stationären Serie sein. Random-Walk - und Random-Trend-Modelle, autoregressive Modelle und exponentielle Glättungsmodelle sind alle Sonderfälle von ARIMA-Modelle. Ein nicht-seasonal ARIMA-Modell ist als ARIMA p, d, q-Modell klassifiziert, wobei. p die Anzahl der autoregressiven Begriffe ist. d ist die Anzahl der Nicht-Sektionsunterschiede, die für die Stationarität benötigt werden, und. q ist die Anzahl der verzögerten Prognosefehler In der Vorhersage Gleichung. Die Prognose Gleichung ist wie folgt aufgebaut Erstens, y bezeichnen die d th Differenz von Y, was bedeutet. Hinweis, dass die zweite Differenz von Y der d 2 Fall ist nicht der Unterschied von 2 Perioden vor Vielmehr ist es die First-different-of-the-first-Differenz, die das diskrete Analog einer zweiten Ableitung ist, dh die lokale Beschleunigung der Serie und nicht deren lokaler Trend. In Bezug auf y ist die allgemeine Prognosegleichung. Hier sind die gleitenden Durchschnittsparameter s So dass ihre Zeichen in der Gleichung negativ sind, nach der Konvention, die von Box und Jenkins eingeführt wird. Einige Autoren und Software einschließlich der Programmiersprache R definieren sie so, dass sie Pluszeichen haben. Wenn die tatsächlichen Zahlen in die Gleichung gesteckt werden, gibt es keine Unklarheit , Aber es ist wichtig zu wissen, welche Konvention Ihre Software verwendet, wenn Sie die Ausgabe lesen Oft werden die Parameter dort mit AR 1, AR 2, und MA 1, MA 2 usw. bezeichnet. Um das passende ARIMA-Modell für Y zu identifizieren Beginnen mit der Bestimmung der Reihenfolge der Differenzierung d Notwendigkeit, die Serie zu stationieren und entfernen Sie die groben Merkmale der Saisonalität, vielleicht in Verbindung mit einer Varianz-stabilisierende Transformation wie Protokollierung oder Abblendung Wenn Sie an diesem Punkt zu stoppen und vorherzusagen, dass die differenzierte Serie konstant ist, Sie haben nur einen zufälligen Spaziergang oder ein zufälliges Trendmodell platziert. Allerdings können die stationärisierten Serien noch autokorrelierte Fehler haben, was darauf hindeutet, dass in der Prognosegleichung auch eine Anzahl von AR-Terme p 1 und oder einige Anzahl MA-Terme q 1 benötigt werden Die Bestimmung der Werte von p, d und q, die am besten für eine gegebene Zeitreihe sind, werden in späteren Abschnitten der Noten, deren Links oben auf dieser Seite sind, aber eine Vorschau auf einige der Arten von nicht-seasonalen ARIMA-Modellen, die Sind häufig angetroffen wird unten gegeben. ARIMA 1,0,0 Autoregressives Modell erster Ordnung, wenn die Serie stationär und autokorreliert ist, vielleicht kann es als ein Vielfaches ihres eigenen vorherigen Wertes vorausgesagt werden, plus eine Konstante Die Prognosegleichung ist in diesem Fall Das ist Y, das auf sich selbst zurückgeht, ist von einer Periode zurückgegangen. Dies ist ein konstantes ARIMA 1,0,0-Modell Wenn der Mittelwert von Y Null ist, dann wäre der konstante Term nicht enthalten. Wenn der Steigungskoeffizient 1 positiv und kleiner als 1 ist In der Größenordnung muss es kleiner als 1 in der Größe sein, wenn Y stationär ist, beschreibt das Modell das Mittelwert-Rückverfolgungsverhalten, bei dem der nächste Perioden-s-Wert vorausgesagt werden sollte, um 1 mal so weit weg von dem Mittelwert zu sein, wie dieser Periodenwert If 1 negativ ist , Es prognostiziert Mittel-Rückkehr-Verhalten mit Wechsel von Zeichen, dh es prognostiziert auch, dass Y wird unterhalb der mittleren nächsten Periode, wenn es über dem Mittelwert dieser Periode ist. In einem zweiten Ordnung autoregressive Modell ARIMA 2,0,0 würde es Auch ein Y-t-2-Term auf der rechten Seite und so weiter Abhängig von den Zeichen und Größen der Koeffizienten könnte ein ARIMA 2.0,0 Modell ein System beschreiben, dessen mittlere Reversion in einer sinusförmig oszillierenden Weise stattfindet Die Bewegung einer Masse auf einer Feder, die zufälligen Schocks ausgesetzt ist. ARIMA 0,1,0 zufälliger Spaziergang Wenn die Serie Y nicht stationär ist, ist das einfachste Modell für sie ein zufälliges Wandermodell, das als Begrenzung betrachtet werden kann Fall eines AR 1 - Modells, bei dem der autoregressive Koeffizient gleich 1 ist, dh eine Reihe mit unendlich langsamer mittlerer Reversion Die Vorhersagegleichung für dieses Modell kann geschrieben werden, wo der konstante Term die durchschnittliche Periodenänderung ist, dh die lange - die Drift in Y Dieses Modell könnte als ein Nicht-Intercept-Regressionsmodell eingebaut werden, bei dem die erste Differenz von Y die abhängige Variable ist. Da es nur eine nicht-seasonale Differenz und einen konstanten Term enthält, wird sie als ARIMA 0,1, 0-Modell mit Konstante Das random-walk-ohne - Drift-Modell wäre ein ARIMA 0,1,0 Modell ohne constant. ARIMA 1,1,0 differenzierte Autoregressive Modell erster Ordnung Wenn die Fehler eines zufälligen Walk-Modells autokorreliert sind, vielleicht Kann das Problem durch Hinzufügen einer Verzögerung der abhängigen Variablen zu der Vorhersagegleichung behoben werden - dh durch Umschalten der ersten Differenz von Y auf sich selbst verzögert um eine Periode Dies würde die folgende Vorhersagegleichung ergeben, die umgeordnet werden kann. Dies ist ein Erstklassiges autoregressives Modell mit einer Reihenfolge der Nichtseason-Differenzierung und einem konstanten Term - dh ein ARIMA 1,1,0 Modell. ARIMA 0,1,1 ohne konstante, einfache exponentielle Glättung Eine weitere Strategie zur Korrektur autokorrelierter Fehler in einem zufälligen Walk-Modell ist Vorgeschlagen durch das einfache exponentielle Glättungsmodell Erinnern Sie sich, dass für einige nichtstationäre Zeitreihen, z. B. solche, die geräuschvolle Schwankungen um ein langsam variierendes Mittel aufweisen, das zufällige Spaziergangmodell nicht so gut wie ein gleitender Durchschnitt der vergangenen Werte ausführt. Mit anderen Worten, anstatt zu nehmen Die jüngste Beobachtung als Prognose der nächsten Beobachtung, ist es besser, einen Durchschnitt der letzten Beobachtungen zu verwenden, um das Rauschen herauszufiltern und den lokalen Mittel genauer zu schätzen. Das einfache exponentielle Glättungsmodell verwendet einen exponentiell gewichteten gleitenden Durchschnitt von Vergangene Werte, um diesen Effekt zu erzielen Die Vorhersagegleichung für das einfache exponentielle Glättungsmodell kann in einer Anzahl von mathematisch äquivalenten Formen geschrieben werden, von denen eine die sogenannte Fehlerkorrekturform ist, in der die vorherige Prognose in Richtung des Fehlers eingestellt wird Es ist gemacht. Wenn e t-1 Y t-1 - t-1 per Definition, kann dies umgeschrieben werden, wie ist eine ARIMA 0,1,1 - without-konstante Prognose Gleichung mit 1 1 - Dies bedeutet, dass Sie passen können Eine einfache exponentielle Glättung, indem man sie als ARIMA-0,1,1-Modell ohne Konstante spezifiziert und der geschätzte MA 1 - Koeffizient entspricht 1-minus-alpha in der SES-Formel. Erinnern Sie sich, dass im SES-Modell das Durchschnittsalter der Daten in Die 1-Perioden-Prognosen sind 1 bedeutet, dass sie dazu neigen, hinter Trends oder Wendepunkten um etwa 1 Perioden zu verzichten. Daraus folgt, dass das Durchschnittsalter der Daten in den 1-Periodenprognosen einer ARIMA 0,1,1 - without-konstantes Modell ist 1 1 - 1 Also, wenn 1 0 8, das Durchschnittsalter ist 5 As 1 nähert sich 1, wird das ARIMA 0,1,1 - without-konstantes Modell eine sehr langfristige Bewegung Durchschnitt, und als 1 nähert sich 0 wird es zu einem zufälligen Walk-ohne-Drift-Modell. Was ist der beste Weg, um Autokorrelation zu korrigieren Hinzufügen von AR-Terme oder Hinzufügen von MA-Terme In den beiden vorangegangenen Modellen, die oben diskutiert wurden, ist das Problem der autokorrelierten Fehler in einem Das zufällige Spaziergangmodell wurde auf zwei verschiedene Arten fixiert, indem ein verzögerter Wert der differenzierten Reihe der Gleichung hinzugefügt wurde oder ein verzögerter Wert des Prognosefehlers hinzugefügt wurde. Welcher Ansatz ist am besten eine Faustregel für diese Situation, die in mehr diskutiert wird Detail später ist, dass die positive Autokorrelation in der Regel am besten durch Hinzufügen eines AR-Begriffs an das Modell behandelt wird und negative Autokorrelation ist in der Regel am besten durch Hinzufügen eines MA-Begriffs In der Wirtschaft und wirtschaftliche Zeitreihen, negative Autokorrelation oft als ein Artefakt der Differenzierung Im Allgemeinen , Differenziert die positive Autokorrelation und kann sogar einen Wechsel von positiver zu negativer Autokorrelation verursachen. So wird das ARIMA-0,1,1-Modell, bei dem die Differenzierung mit einem MA-Term begleitet wird, häufiger als ein ARIMA 1,1,0-Modell verwendet. ARIMA 0,1,1 mit konstanter einfacher exponentieller Glättung mit Wachstum Durch die Implementierung des SES-Modells als ARIMA-Modell erhalten Sie tatsächlich eine gewisse Flexibilität. Zunächst einmal ist der geschätzte MA 1 - Koeffizient negativ, dies entspricht einem Glättungsfaktor größer Als 1 in einem SES-Modell, das in der Regel nicht von der SES-Modell-Anpassungs-Prozedur erlaubt ist Zweitens haben Sie die Möglichkeit, einen konstanten Begriff in das ARIMA-Modell einzubeziehen, wenn Sie es wünschen, um einen durchschnittlichen Nicht-Null-Trend zu schätzen Die ARIMA 0,1,1 Modell mit Konstante hat die Vorhersage Gleichung. Die Ein-Periode-voraus Prognosen aus diesem Modell sind qualitativ ähnlich denen der SES-Modell, mit der Ausnahme, dass die Trajektorie der langfristigen Prognosen ist in der Regel eine abfallende Linie, deren Steigung Ist gleich mu anstatt einer horizontalen Linie. ARIMA 0,2,1 oder 0,2,2 ohne konstante lineare exponentielle Glättung Lineare exponentielle Glättungsmodelle sind ARIMA-Modelle, die zwei Nichtseasonale Unterschiede in Verbindung mit MA-Terme verwenden Der zweite Unterschied einer Serie Y ist nicht einfach die Differenz zwischen Y und selbst, die von zwei Perioden verzögert ist, sondern vielmehr die erste Differenz der ersten Differenz - die Änderung der Veränderung von Y in der Periode t. Also die zweite Differenz von Y an Die Periode t ist gleich Y t - Y t-1 - Y t-1 - Y t-2 Y t - 2Y t-1 Y t-2 Eine zweite Differenz einer diskreten Funktion ist analog zu einer zweiten Ableitung einer stetigen Funktion Es misst die Beschleunigung oder Krümmung in der Funktion zu einem gegebenen Zeitpunkt. Das ARIMA 0,2,2 Modell ohne Konstante prognostiziert, dass die zweite Differenz der Serie gleich einer linearen Funktion der letzten beiden Prognosefehler ist, die als neu arrangiert werden können Wo 1 und 2 die MA 1 - und MA 2 - Koeffizienten sind Dies ist ein allgemeines lineares exponentielles Glättungsmodell, das im Wesentlichen das gleiche wie das Holt-Modell ist, und das Brown-Modell ist ein Spezialfall. Es verwendet exponentiell gewichtete Bewegungsdurchschnitte, um sowohl eine lokale Ebene als auch zu schätzen Ein lokaler Trend in der Serie Die Langzeitprognosen aus diesem Modell konvergieren zu einer Geraden, deren Steigung von der durchschnittlichen Tendenz abhängt, die gegen Ende der Serie beobachtet wird. ARIMA 1,1,2 ohne konstante gedämpfte Trendlineare exponentielle Glättung Modell wird in den begleitenden Folien auf ARIMA-Modellen illustriert Es extrapoliert den lokalen Trend am Ende der Serie, sondern flacht es bei längeren Prognosehorizonten, um eine Notiz des Konservatismus einzuführen, eine Praxis, die empirische Unterstützung hat. Sehen Sie den Artikel auf Warum der gedämpfte Trend Werke von Gardner und McKenzie und der Golden Rule Artikel von Armstrong et al für Details. Es ist in der Regel ratsam, an Modellen, in denen mindestens eines von p und q ist nicht größer als 1, dh nicht versuchen, ein Modell wie zu passen ARIMA 2,1,2, da dies wahrscheinlich zu überfälligen und gängigen Faktor-Problemen führen wird, die in den Anmerkungen zur mathematischen Struktur von ARIMA-Modellen näher erörtert werden. Die Vorlagen-Implementierung ARIMA-Modelle wie die oben beschriebenen sind einfach zu implementieren Auf einer Tabellenkalkulation Die Vorhersagegleichung ist einfach eine lineare Gleichung, die sich auf vergangene Werte der ursprünglichen Zeitreihen und vergangene Werte der Fehler bezieht. So können Sie eine ARIMA-Prognosekalkulationstabelle einrichten, indem sie die Daten in Spalte A, die Prognosemethode in Spalte B, speichert Und die Fehlerdaten minus Prognosen in Spalte C Die Prognoseformel in einer typischen Zelle in Spalte B wäre einfach ein linearer Ausdruck, der sich auf Werte in vorhergehenden Zeilen der Spalten A und C bezieht, multipliziert mit den entsprechenden AR - oder MA-Koeffizienten, die in anderen Zellen gespeichert sind Auf der Kalkulationstabelle. Autoregressive Moving Average ARMA p, q Modelle für Zeitreihenanalyse - Teil 3.Dies ist der dritte und letzte Beitrag in der Mini-Serie auf Autoregressive Moving Average ARMA Modelle für die Zeitreihenanalyse Wir haben Autoregressive Modelle und Moving Average eingeführt Modelle in den beiden vorherigen Artikeln Jetzt ist es an der Zeit, sie zu kombinieren, um ein anspruchsvolleres Modell zu produzieren. Das wird uns schließlich zu den ARIMA - und GARCH-Modellen führen, die es uns ermöglichen, die Vermögenswerte und die Prognose der Volatilität vorherzusagen. Diese Modelle bilden die Basis für den Handel Signale und Risikomanagement-Techniken. Wenn Sie Teil 1 und Teil 2 gelesen haben, werden Sie gesehen haben, dass wir dazu neigen, ein Muster für unsere Analyse eines Zeitreihenmodells zu folgen. Ich werde es hier kurz wiederholen. Begründung - Warum interessieren wir uns für diese besondere Model. Definition - Eine mathematische Definition, um die Mehrdeutigkeit zu reduzieren. Korrelogramm - Plotten eines Beispiel-Korrelogramms, um ein Modell-Verhalten zu visualisieren. Simulation und Anpassung - Anpassung des Modells an Simulationen, um sicherzustellen, dass wir das Modell richtig verstanden haben. Real Financial Data - Bewerben Sie die Modell zu echten historischen Vermögenspreise. Predred - Prognose nachfolgende Werte, um Trading-Signale oder Filter zu bauen. Um diesen Artikel zu folgen, ist es ratsam, einen Blick auf die vorherigen Artikel auf Zeitreihenanalyse Sie können alle hier gefunden werden. Bayesian Information Criterion. In Teil 1 dieser Artikelserie schauten wir auf die Akaike Information Criterion AIC als Mittel, um uns zu helfen, zwischen getrennten besten Zeitreihenmodellen zu wählen. Ein eng verwandtes Werkzeug ist das Bayesian Information Criterion BIC Im Wesentlichen hat es ein ähnliches Verhalten gegenüber der AIC darin Es beeinträchtigt Modelle für zu viele Parameter Dies kann zu Überfüllung führen Der Unterschied zwischen dem BIC und AIC ist, dass die BIC ist strenger mit der Bestrafung der zusätzlichen Parameter. Bayesian Information Criterion. Wenn wir die Wahrscheinlichkeit Funktion für ein statistisches Modell, die Hat k-Parameter und L maximiert die Wahrscheinlichkeit, dann ist die Bayesian Information Criterion gegeben. Wo n ist die Anzahl der Datenpunkte in der Zeitreihe. Wir werden die AIC und BIC unten bei der Auswahl geeigneter ARMA p, q models. Ljung - Box Test. In Teil 1 dieser Artikel-Serie Rajan erwähnt in der Disqus Bemerkungen, dass die Ljung-Box-Test war besser geeignet als mit dem Akaike Information Criterion der Bayesian Information Criterion bei der Entscheidung, ob ein ARMA-Modell war eine gute Passform zu einer Zeit Serie. Der Ljung-Box-Test ist ein klassischer Hypothesentest, der entworfen ist, um zu testen, ob ein Satz von Autokorrelationen eines angepassten Zeitreihenmodells sich signifikant von Null unterscheidet. Der Test testet nicht jede einzelne Verzögerung für Zufälligkeit, sondern prüft die Zufälligkeit über ein Gruppe von Lags. Ljung-Box Test. Wir definieren die Null-Hypothese als Die Zeitreihen-Daten bei jeder Verzögerung sind iid das heißt, die Korrelationen zwischen den Populations-Serien-Werte sind Null. Wir definieren die alternative Hypothese als Die Zeitreihen-Daten sind nicht iid Und besitzen serielle Korrelation. Wir berechnen die folgende Teststatistik Q. Wenn n ist die Länge der Zeitreihe Probe, Hut k ist die Probe Autokorrelation bei Verzögerung k und h ist die Anzahl der Verzögerungen unter dem Test. Die Entscheidung Regel, ob Um die Nullhypothese abzulehnen, ist zu prüfen, ob Q chi 2, für eine chi-quadratische Verteilung mit h Freiheitsgraden am 100-1-alpha-ten Perzentil. Während die Details des Tests etwas komplex erscheinen können, können wir in der Tat R verwenden Um den Test für uns zu berechnen, vereinfacht die Prozedur etwas. Autogressive Moving Average ARMA Modelle der Ordnung p, q. Jetzt haben wir den BIC und den Ljung-Box Test besprochen, wir sind bereit, unser erstes gemischtes Modell zu besprechen, nämlich das Autoregressive Verschieben Durchschnitt der Ordnung p, q oder ARMA p, q. Zu Datum haben wir autoregressive Prozesse und gleitende durchschnittliche Prozesse betrachtet. Das frühere Modell betrachtet sein eigenes vergangenes Verhalten als Inputs für das Modell und als solche Versuche, Marktteilnehmereffekte zu erfassen Wie Impuls und Mittelwert-Reversion im Aktienhandel. Das letztere Modell wird verwendet, um Schock-Informationen zu einer Serie zu charakterisieren, wie eine Überraschung Ergebnis Ankündigung oder unerwartete Veranstaltung wie die BP Deepwater Horizon Ölpest. Hena ein ARMA-Modell versucht, beide zu erfassen Von diesen Aspekten bei der Modellierung von finanziellen Zeitreihen. Hinweis, dass ein ARMA-Modell nicht berücksichtigt Volatilität Clustering, eine wichtige empirische Phänomene von vielen finanziellen Zeitreihen Es ist kein bedingt heteroscedastisches Modell Für das müssen wir auf die ARCH und GARCH warten Modelle. Das ARMA p, q Modell ist eine lineare Kombination von zwei linearen Modellen und ist somit selbst noch linear. Autoregressive Moving Average Modell der Ordnung p, qA Zeitreihenmodell, ist ein autoregressives gleitendes durchschnittliches Modell der Ordnung p, q ARMA p , Q, wenn. Beginnen xt alpha1 x alpha2 x ldots wt beta1 w beta2 w ldots betaq w end. Wo ist weißes Rauschen mit E wt 0 und Varianz Sigma 2.Wenn wir den Rückwärtsschaltoperator sehen, sehen wir einen vorherigen Artikel dann können wir das oben als Funktion umschreiben Theta und phi von. Wir können einfach sehen, dass durch die Einstellung p neq 0 und q 0 wir wieder das AR p Modell Ähnlich, wenn wir p 0 und q neq 0 setzen wir wieder das MA q Modell. Eines der wichtigsten Features des ARMA-Modells Ist, dass es sparsam und redundant in seinen Parametern ist. Das heißt, ein ARMA-Modell benötigt oft weniger Parameter als ein AR - oder MA q-Modell alleine. Wenn wir die Gleichung in Bezug auf das BSO umschreiben, dann können die Theta - und Phi-Polynome Manchmal teilen sich ein gemeinsamer Faktor, was zu einem einfacheren Modell führt. Simulationen und Correlograms. Mit den autoregressiven und gleitenden Durchschnittsmodellen werden wir nun verschiedene ARMA-Serien simulieren und dann versuchen, ARMA-Modelle an diese Realisierungen anzupassen. Wir führen das aus, weil wir wollen Stellen Sie sicher, dass wir das Anpassungsverfahren verstehen, einschließlich der Berechnung von Konfidenzintervallen für die Modelle, sowie sicherstellen, dass das Verfahren tatsächlich angemessene Schätzungen für die ursprünglichen ARMA-Parameter wiederherstellt. In Teil 1 und Teil 2 haben wir die AR - und MA-Serie manuell konstruiert Indem man N Samples aus einer Normalverteilung zeichnet und dann das spezifische Zeitreihenmodell unter Verwendung von Verzögerungen dieser Samples erstellt. Jedoch gibt es einen einfacheren Weg, um AR, MA, ARMA und sogar ARIMA Daten zu simulieren, einfach durch Verwendung der Methode in R. Lassen Sie es mit dem einfachsten nicht-trivialen ARMA-Modell beginnen, nämlich dem ARMA 1,1-Modell Das ist ein autoregressives Modell der Ordnung, kombiniert mit einem gleitenden Durchschnittsmodell der Ordnung Ein solches Modell hat nur zwei Koeffizienten, Alpha und Beta, Die die ersten Verzögerungen der Zeitreihe selbst und die Schock-Weiß-Rausch-Terme darstellen. Ein solches Modell wird gegeben durch. Wir müssen die Koeffizienten vor der Simulation angeben. Setzen wir alpha 0 5 und beta -0 5. Die Ausgabe ist wie folgt. Realisierung eines ARMA 1,1 Modells mit alpha 0 5 und beta 0 5.Let s auch das Korrelogram. Korrelogramm eines ARMA 1,1 Modells mit alpha 0 5 und beta 0 5.We sehen, dass es keine gibt Signifikante Autokorrelation, die von einem ARMA 1,1-Modell zu erwarten ist. Schließlich lassen Sie versuchen, die Koeffizienten und ihre Standardfehler mit der arima-Funktion zu bestimmen. Wir können die Konfidenzintervalle für jeden Parameter mit den Standardfehlern berechnen. Das Vertrauen Intervalle enthalten die wahren Parameterwerte für beide Fälle, aber wir sollten beachten, dass die 95 Konfidenzintervalle eine sehr große Konsequenz der vernünftig großen Standardfehler sind. Lass jetzt ein ARMA 2,2 Modell versuchen Das ist ein AR 2 Modell kombiniert Mit einem MA 2 - Modell Wir müssen vier Parameter für dieses Modell alpha1, alpha2, beta1 und beta2 angeben. Nehmen wir alpha1 0 5, alpha2 -0 25 beta1 0 5 und beta2 -0 3.Die Ausgabe unseres ARMA 2,2-Modells Ist wie folgt. Realisierung eines ARMA 2,2-Modells mit alpha1 0 5, alpha2 -0 25, beta1 0 5 und beta2 -0 3.Und die entsprechende autocorelation. Correlogramm eines ARMA 2,2 Modells mit alpha1 0 5 , Alpha2 -0 25, beta1 0 5 und beta2 -0 3. Wir können nun versuchen, ein ARMA 2,2-Modell an die Daten anzupassen. Wir können auch die Konfidenzintervalle für jeden Parameter berechnen. Nichts, dass die Konfidenzintervalle für die Koeffizienten für Die gleitende Mittelkomponente beta1 und beta2 enthalten eigentlich nicht den ursprünglichen Parameterwert. Hierbei handelt es sich um die Gefahr, dass man versucht, Modelle auf Daten zu bringen, auch wenn wir die wahren Parameterwerte kennen. Für alle Zwecke müssen wir nur eine prädiktive Kraft haben Übertrifft Chance und produziert genügend Gewinn über Transaktionskosten, um auf lange Sicht rentabel zu sein. Nun, dass wir einige Beispiele für simulierte ARMA-Modelle gesehen haben, brauchen wir Mechanismus für die Auswahl der Werte von p und q bei der Anpassung an die Modelle zu echten finanziellen Data. Choosing the Best ARMA p, q Modell. Um zu bestimmen, welche Reihenfolge p, q des ARMA-Modells für eine Serie geeignet ist, müssen wir die AIC oder BIC über eine Teilmenge von Werten für p, q und dann verwenden Wenden Sie den Ljung-Box-Test an, um festzustellen, ob eine gute Passung erreicht ist, für bestimmte Werte von p, q. Um diese Methode zu zeigen, werden wir zunächst einen bestimmten ARMA p, q Prozess simulieren. Wir werden dann alle paarweisen Werte von P in und q in und berechnen die AIC Wir wählen das Modell mit dem niedrigsten AIC und führen dann einen Ljung-Box-Test auf die Residuen, um festzustellen, ob wir eine gute fit. Let s beginnen, indem Sie eine ARMA 3,2 Serie simulieren. Wir erstellen nun ein Objekt endgültig, um die beste Modell-Fit und den niedrigsten AIC-Wert zu speichern. Wir schlagen über die verschiedenen p, q-Kombinationen und verwenden das aktuelle Objekt, um die Anpassung eines ARMA i, j-Modells für die Looping-Variablen i und zu speichern J. Wenn die aktuelle AIC kleiner als jede zuvor berechnete AIC ist, setzen wir die endgültige AIC auf diesen aktuellen Wert und wählen diese Reihenfolge aus. Nach Beendigung der Schleife haben wir die Reihenfolge des ARMA-Modells und das ARIMA p, d, q passen Selbst mit der integrierten d-Komponente auf 0 gespeichert als. Lose s Ausgabe der AIC, Ordnung und ARIMA Koeffizienten. Wir können sehen, dass die ursprüngliche Reihenfolge des simulierten ARMA-Modells wiederhergestellt wurde, nämlich mit p 3 und q 2 Wir können das Corelogramm zeichnen Von den Resten des Modells zu sehen, ob sie aussehen wie eine Realisierung von diskreten weißen Rauschen DWN. Correlogram der Reste der besten passenden ARMA p, q Modell, p 3 und q 2.Das Corelogramm sieht in der Tat wie eine Realisierung von DWN Schließlich führen wir den Ljung-Box-Test für 20 Verzögerungen durch, um dies zu bestätigen. Nichts, dass der p-Wert größer als 0 05 ist, was besagt, dass die Residuen auf der 95-Ebene unabhängig sind und somit ein ARMA-3,2-Modell gut ist Modell fit. Clearly das sollte der Fall sein, da wir die Daten selbst simuliert haben. Allerdings ist dies genau das Verfahren, das wir verwenden werden, wenn wir kommen, um ARMA p, q Modelle auf den S P500 Index in den folgenden Abschnitt passen. Finanzdaten. Now Dass wir das Verfahren für die Auswahl des optimalen Zeitreihenmodells für eine simulierte Serie skizziert haben, es ist ziemlich einfach, es auf Finanzdaten anzuwenden. Für dieses Beispiel werden wir noch einmal den S P500 US Equity Index wählen Schließt die Preise mit quantmod und schafft dann die log returns stream. Let s führt die gleiche Anpassungsprozedur wie für die simulierte ARMA 3,2 Serie oben auf der Log-Returns-Serie des S P500 mit dem AIC. Das beste passende Modell hat Bestellung ARMA 3 , 3.Let s Plot die Residuen des angepassten Modells auf die S P500 log täglich Rückkehr Stream. Correlogram der Reste der besten passenden ARMA p, q Modell, p 3 und q 3, um die S P500 täglichen Log Rückgabestrom. Beachten Sie, dass es einige signifikante Gipfel gibt, vor allem bei höheren Verzögerungen Dies ist ein Hinweis auf eine schlechte Passung Lassen Sie uns einen Ljung-Box-Test durchführen, um zu sehen, ob wir statistische Beweise dafür haben. Als wir vermuteten, ist der p-Wert weniger als 0 05 Und als solche können wir nicht sagen, dass die Residuen eine Realisierung von diskreten weißen Rauschen sind. Daher gibt es eine zusätzliche Autokorrelation in den Residuen, die nicht durch das passende ARMA 3,3 Modell erklärt wird. Wie wir in dieser Artikelreihe, die wir gesehen haben, Nachweis der bedingten Heterosedastions-Volatilitäts-Clustering in der S P500-Serie, vor allem in den Perioden um 2007-2008 Wenn wir ein GARCH-Modell später in der Artikelserie verwenden, werden wir sehen, wie man diese Autokorrelationen beseitigt. In der Praxis sind ARMA-Modelle niemals im Allgemeinen gut passt Für Log-Aktien Rückkehr Wir müssen die bedingte Heterosedastizität berücksichtigen und eine Kombination aus ARIMA und GARCH verwenden Der nächste Artikel wird ARIMA betrachten und zeigen, wie sich die integrierte Komponente von dem ARMA-Modell unterscheidet, das wir in diesem Artikel berücksichtigt haben Quantitativen Handel.


No comments:

Post a Comment