In diesem Artikel werden wir das Handelsvolumen von TSE-Aktien mit dem Verarbeitungs- / Analysetool "jpxlab" von TSE-Aktien-Hochfrequenzdaten (FLEX Historical) visualisieren. Ich werde versuchen. Beispielnotizbücher finden Sie unter hier.
FLEX Historical enthält auch Informationen zur Identifizierung der Aktie. In diesem Beispiel wird jedoch eine von der Tokyo Stock Exchange veröffentlichte Datei verwendet, die detailliertere Metadaten enthält.
Diese Datei enthält verschiedene Informationen zur Marke und den Markencode Es ist nützlich, um Firmennamen zuzuordnen und Bestände nach Sektor, TOPIX usw. in Kategorien zu klassifizieren.
Um die historischen Daten in Kombination mit den in dieser Datei bereitgestellten Metadaten zu verwenden, probieren Sie jpxlab demo -sector volume.ipynb. % 20-% 20sector% 20volume.ipynb) wäre ein guter Ausgangspunkt.
Dieses Notizbuch nutzt Brancheninformationen, um zu zeigen, wie Aktien gruppiert sind. Die folgende Abbildung zeigt das integrierte Transaktionsvolumen für jeden Sektor im September 2019.
Obwohl es sich um eine einfache Visualisierung handelt, kann auf einen Blick bestätigt werden, dass die Anzahl der Handelsunternehmen und Großhändler in 17 Branchenkategorien am 5. September 2019 und die Anzahl der Banken in 17 Branchenkategorien am 10. September 2019 gestiegen ist. Ich werde. Es ist auch möglich, nur die 100 größten Handelsvolumina im September mit geringfügigen Änderungen zu filtern, wie im Notizbuch dargestellt.
Eines der interessantesten Themen in der Marktdatenanalyse ist wahrscheinlich die "Vorhersage". Verschiedene Ansätze wie statistische Analyse und maschinelles Lernen können in Betracht gezogen werden, aber es ist ein wenig schwierig, ein kompliziertes Modell der Aktienkurse mit nur einem Monat Daten zu erstellen. Daher werde ich dieses Mal nur die Methodik vorstellen und mit einer einfachen Datenanalyse beginnen.
Lassen Sie uns zunächst die Autokorrelation des täglichen Handelsvolumens von Toyota (7203) darstellen. Der hellblaue Bereich ist das Konfidenzintervall, und es kann gesagt werden, dass es eine signifikante Autokorrelation gibt, wenn der Wert, der ihn durchdringt, erscheint. Autokorrelation ist eine Korrelation mit ihrer eigenen verzögerten Kopie. Wenn hier also ein hoher Korrelationskoeffizient beobachtet wird, kann davon ausgegangen werden, dass er periodisch ist. Leider wurde im obigen Beispiel keine signifikante Korrelation beobachtet.
Als nächstes wählen wir eine Aktie mit einer hohen Autokorrelation aus und sehen, wie der Plot aussieht. Im Beispiel wurde Subaru (7270) aus den Top 100 Aktien ausgewählt.
Wie in der Darstellung gezeigt, zeigt leg1 eine relativ hohe positive Korrelation. Der tatsächliche Nutzen wird vernachlässigt, da es sich bei diesem Beispiel um eine sehr begrenzte Stichprobe handelt. In Fällen, in denen mehr Stichproben verfügbar sind, werden diese Daten jedoch von einem Selbstrückgabemodell wie dem ARIMA-Modell etwas vorhergesagt. Ist in vielen Fällen möglich. Nur für den Fall, dass der Übergang des ursprünglichen Transaktionsvolumens wie folgt dargestellt wird.
Lassen Sie uns eine weitere eingehende Analyse durchführen. Indem wir nach dem Muster der Änderungen des Handelsvolumens gruppieren, werden wir uns der Herausforderung stellen, verknüpfte Aktien und Änderungen ihrer Trends zu beobachten. Da die Stichproben, die zum Lernen verwendet werden können, jedes Mal sehr begrenzt sind, hoffe ich, dass Sie sie durch Einführung der Methodik für zukünftige Experimente verwenden können. Das Notizbuch ist jpxlab demo -cluster analysis.ipynb.
Das Ziel für das Clustering ist ein Vektor. Dieses Mal möchten wir die Ähnlichkeit des Transaktionsvolumenübergangsmusters für jedes Problem analysieren, daher ist es notwendig, die Zeitreihendaten des Transaktionsvolumenübergangs auf irgendeine Weise zu vektorisieren.
Dieser Prozess ist jedoch der Schlüssel, und je mehr Dimensionen der Vektor hat, desto schwieriger ist es, in den Fluch der Dimension zu gelangen und die wesentlichen Merkmale zu extrahieren. Daher habe ich mich für die Technik der Dimensionskomprimierung entschieden, um sie auf die niedrigstmögliche Dimension zu reduzieren. Werden.
Die bekanntesten dimensionalen Komprimierungsmethoden sind PCA und MDS. Hier verwenden wir jedoch einen Algorithmus, der auch für Objekte mit einer nichtlinearen Beziehung namens T-SNE wirksam ist. Die Eingabe ist eine Momentaufnahme der Rohumsatztrends für jedes im Schiebefenster extrahierte Problem. Dies wird zur Visualisierung auf zwei Dimensionen komprimiert.
Weitere Informationen finden Sie unter Notizbuch, aber es scheint in diesem Zeitraum von Bedeutung zu sein. Obwohl es schwierig ist, solche Cluster visuell zu erfassen, können Sie sehen, dass es sich um ein sehr leistungsfähiges Tool handelt, das alles vom Clustering bis zur Visualisierung der Zeitreihenänderungen mit Animation mit einfachem Code ausführen kann. Ich denke nicht.
Auf diese Weise hoffen wir, dass Sie einen Einblick in die Möglichkeit erhalten, dass jpxlab als Eingang für verschiedene Anwendungen wie das Design und die Überprüfung von Vorhersagemodellen verwendet werden kann.
Recommended Posts