[PYTHON] So berechnen Sie die Summe oder den Durchschnitt von Zeitreihen-CSV-Daten in einem Augenblick

TL;DR

Was du machen willst

input.csv


#Datum(Bis zu Minuten),USD Kurs,JPY-Rate,EUR-Kurs
#Alle 10 Minuten gibt es 144 Datenzeilen pro Tag
# 2020/2/24 18:00 ~ 2020/6/11 23:10
yyyy/mm/dd HH:MM,NN.N(data),NN.N,NN.N
yyyy/mm/dd HH:MM,NN.N(data),NN.N,NN.N
yyyy/mm/dd HH:MM,NN.N(data),NN.N,NN.N

Der Versuch, das Rad neu zu erfinden

Schreiben Sie zuerst den Code und fragen Sie (versuchen Sie zu fragen)

  1. Öffnen Sie die Datei
  2. Betrachten Sie die erste Spalte als Datum und Uhrzeit und konvertieren Sie sie in den Datumstyp
  3. Sammeln Sie Werte, bis die Grenze zwischen demselben Monat und Tag überschritten ist
  4. Teilen Sie die akkumulierten Daten durch die Anzahl der akkumulierten Daten, um den Durchschnitt zu berechnen
  5. Dateiausgabe

Elemente, die problematisch zu sein scheinen

Finde das erfundene Rad

csvcalc.py


import pandas as pd
df = pd.read_csv("input.csv",index_col=0,parse_dates=True)
df.resample('D').mean().to_csv("output.csv")

out.csv


2020/2/25,13.99777778,4.343472222,13.19909722
2020/2/26,13.55291667,3.572986111,7.519791667
2020/2/27,12.31902778,4.954513889,9.513611111
・ ・ ・

Die Räder geben sogar die Grafik aus

Fazit

Recommended Posts

So berechnen Sie die Summe oder den Durchschnitt von Zeitreihen-CSV-Daten in einem Augenblick
Lesen von Zeitreihendaten in PyTorch
So erhalten Sie einen Überblick über Ihre Daten in Pandas
So extrahieren Sie Funktionen von Zeitreihendaten mit PySpark Basics
Wie Sie die interne Struktur eines Objekts in Python kennen
<Pandas> Umgang mit Zeitreihendaten in der Pivot-Tabelle
Umgang mit Zeitreihendaten (Implementierung)
So ändern Sie mehrere Spalten von csv in Pandas (Unixtime-> Japan Time)
Zeichnen Sie die CSV von Zeitreihendaten mit einem Unixtime-Wert in Python (matplotlib).
So berechnen Sie die Volatilität einer Marke
Ich möchte die Ergebnisse von% time, %% time usw. in einem Objekt (Variable) speichern.
Teil 1 Ich habe ein Beispiel für die Antwort auf das Referenzproblem geschrieben, wie man in Python in Echtzeit offline schreibt
So ermitteln Sie die Anzahl der Stellen in Python
So messen Sie die Verarbeitungszeit mit Python oder Java
So finden Sie die optimale Anzahl von Clustern für k-means
Verschiedene Methoden zur Berechnung der Ähnlichkeit zwischen Daten mit Python
Ich habe in Python ein Programm erstellt, das die 1-Minuten-Daten von FX auf eine beliebige Zeit (1 Stunde usw.) ändert.
So manipulieren Sie das DOM im Iframe mit Selen
Berechnen des aus ABC134-D gelernten Rechenaufwands
[Frage] So erhalten Sie die Daten von Textbereichsdaten in Echtzeit mithilfe der Python-Webframework-Flasche
Beispiel für das Aggregieren einer großen Menge von Zeitreihendaten mit Python in einer kleinen Speicherumgebung mit einer angemessenen Geschwindigkeit
Was Sie bei der Zeitreihendatenanalyse (einschließlich Reflexion) nicht tun sollten
Darstellung der Verteilung der Bakterienzusammensetzung aus Qiime2-Analysedaten in einem Box-Whisker-Diagramm
So entfernen Sie die "Tags müssen ein Array von Hashes sein." Fehler in Qiita API
Schlafverarbeitung für einen bestimmten Zeitraum (Sekunden) oder länger in Python
Teil 1 Ich habe die Antwort auf das Referenzproblem geschrieben, wie man in Python in Echtzeit offline schreibt
So geben Sie beim Testen absichtlich einen Fehler in der Shell aus
So bestimmen Sie die Existenz eines Selenelements in Python
Ich habe die Berechnungszeit des in Python geschriebenen gleitenden Durchschnitts verglichen
So implementieren Sie Java-Code im Hintergrund von Red Hat (Linux ONE)
So machen Sie einen String in Python zu einem Array oder ein Array zu einem String
So überprüfen Sie die Speichergröße einer Variablen in Python
[TensorFlow 2] So überprüfen Sie den Inhalt von Tensor im Diagrammmodus
So ermitteln Sie die Scheitelpunktkoordinaten eines Features in ArcPy
Wie erstelle ich eine große Menge an Testdaten in MySQL? ??
So berechnen Sie "xx time" in einem Schuss mit Python timedelta
Wie berechnet man den Autokorrelationskoeffizienten?
Differenzierung von Zeitreihendaten (diskret)
Zeitreihenanalyse 3 Vorverarbeitung von Zeitreihendaten
Lesen von Standardeingabe- oder Variablendateien gleichzeitig wie der Befehl Einfügen in Python
Leistungsfähigkeit von Vorhersagemethoden in der Zeitreihendatenanalyse Halboptimierung (SARIMA) [Memo]
Veranschaulichen Sie sofort die vorherrschende Periode in Zeitreihendaten mithilfe der Spektralanalyse
So ermitteln Sie mit Python den Unterschied zwischen Datum und Uhrzeit in Sekunden
So vergleichen Sie, ob der Inhalt der Objekte in scipy.sparse.csr_matrix identisch ist
Klicken Sie auf die Rakuten-Ranking-API, um das Ranking einer beliebigen Kategorie in CSV zu speichern
Speichern von CSV-Daten in Amazon Kinesis Streams mit Standardeingabe
So setzen Sie eine Zeilennummer am Anfang einer CSV-Datei
Ich möchte einen beliebigen Befehl im Befehlsverlauf von Shell belassen
So formatieren Sie eine Liste von Wörterbüchern (oder Instanzen) in Python
Ein Beispiel für die Antwort auf die Referenzfrage der Studiensitzung. Mit Python.
[Python] So öffnen Sie zwei oder mehr Dateien gleichzeitig
Die Geschichte eines Fehlers in PyOCR
So vergleichen Sie Zeitreihendaten-Derivative DTW, DTW-
So überprüfen Sie die Version von Django
So stellen Sie die Serverzeit auf japanische Zeit ein
Berechnen Verwenden Sie% des Befehls df
[Python] Beschleunigt das Laden von Zeitreihen-CSV
So speichern Sie die Feature-Point-Informationen des Bildes in einer Datei und verwenden sie zum Abgleichen