Referenzen [Finance Machine Learning](https://www.amazon.co.jp/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%8A%E3%83%B3 % E3% 82% B9% E6% A9% 9F% E6% A2% B0% E5% AD% A6% E7% BF% 92% E2% 80% 95% E9% 87% 91% E8% 9E% 8D% E5 % B8% 82% E5% A0% B4% E5% 88% 86% E6% 9E% 90% E3% 82% 92% E5% A4% 89% E3% 81% 88% E3% 82% 8B% E6% A9 % 9F% E6% A2% B0% E5% AD% A6% E7% BF% 92% E3% 82% A2% E3% 83% AB% E3% 82% B4% E3% 83% AA% E3% 82% BA % E3% 83% A0% E3% 81% AE% E7% 90% 86% E8% AB% 96% E3% 81% A8% E5% AE% 9F% E8% B7% B5-% E3% 83% 9E% E3% 83% AB% E3% 82% B3% E3% 82% B9% E3% 83% BB% E3% 83% AD% E3% 83% 9A% E3% 82% B9% E3% 83% BB% E3% 83% 87% E3% 83% BB% E3% 83% 97% E3% 83% A9% E3% 83% 89-ebook / dp / B0834XJQTY)
Bei der Prognose von Finanzdaten müssen Sie definieren, was Sie prognostizieren möchten. Je nachdem, was Sie vorhersagen möchten, ist der Ansatz völlig unterschiedlich. Vielleicht wissen Sie am besten, ob der Aktienkurs $ T + 1 $ mit der Kursänderungsrate oder dem Code der Preisänderungsrate steigt oder fällt? In einigen Fällen kann es jedoch schwierig sein, Vorhersagen zu treffen, und selbst wenn die richtige Antwortrate hoch ist, können die durchschnittliche Gewinnrate und die scharfe Quote schrecklich sein. Ein solches Problem ist kein Problem, das allein durch Kennzeichnung gelöst werden kann, aber obwohl die Kennzeichnung häufig vernachlässigt wird, hat sie tatsächlich eine tiefe Bedeutung.
Angenommen, Sie haben Tägliche OHLC-Daten des durchschnittlichen Nikkei-Aktienkurses.
Wenn Sie den Schlusskurs des durchschnittlichen Nikkei-Aktienkurses am nächsten Geschäftstag mit jedem Schlusskurs als $ X_1, X_2, ..., X_T $ vorhersagen möchten, setzen Sie das Vorhersageetikett auf
Gibt es aus dem obigen Beispiel ein Beispiel, bei dem es ausreicht, auf dem Vorhersageetikett eine korrekte Antwortrate von 50% oder mehr anzugeben? Was ist zum Beispiel mit diesen Strategien? Gehen Sie stark davon aus, dass Sie mit dem Preis des Vermögenswerts handeln können und die Liquidität ausgezeichnet ist (springt nicht). Wenn Sie einen neuen Vermögenswert bei $ T = 0 $ halten und die Abstimmung um + 1 Basispunkte oder -1 Basispunkte steigt, müssen Sie abrechnen. Dies ist das einfachste im Finanzbereich eingeführte binäre Modell. In diesem Fall haben 50% oder mehr der vorhergesagten Etiketten einen positiven Erwartungswert.
Wie beschriftet man es?
Die Daten sind Tick-Daten der Board-Informationen (Mitte).
Ich möchte mit Python-Code erklären.
label.py
labels = df["mid"].diff().shift(-1).replace(0, np.nan).bfill()
labels = labels / abs(labels)
――Da es sich um eine Änderung von 1 Bit / s handelt, betrachten Sie es mit einem Unterschied. --Nächste, ich möchte den Unterschied zwischen $ X_ {T} $ und $ X_ {T + 1} $ sehen, also verschieben Sie den Index einen Schritt nach links. --Wenn die Differenz 0 ist, wird keine Transaktion durchgeführt, setzen Sie also 0 auf Null.
In diesem Buch wurden auch die Triple-Barrier-Methode, die Trend-Scanning-Methode usw. vorgestellt. Warum also nicht einen Blick darauf werfen?
Recommended Posts