Sie finden häufig Beispiele dafür, wie Sie mit Pandas die Durchschnitts-, Minimal- und Maximalwerte von Zahlen ermitteln können. Ich habe oft Gruppen erstellt und verarbeitet, also habe ich stattdessen mein Memorandum zusammengefasst. ~~ Ich habe das Gefühl, dass ich in der Anzahl der Abkochungen stecken bleiben werde ... ~~
Ich verwende Jupyter Notebook, um den Betrieb zu überprüfen.
Die verwendeten Daten sind die Daten unerwünschter Ereignisse von JADER.
import pandas as pd
import numpy as np
reacs=pd.read_csv('reac.csv',dtype='str',encoding='shift-jisx0213')
Gruppieren Sie zunächst nach ** Identifikationsnummer **, damit jeder Fall eindeutig ist
groupCaseNo=reacs.groupby('Identifikationsnummer')
Da es nach Identifikationsnummer gruppiert ist, können Sie die gruppierten Schlüssel mithilfe von "Gruppen" erhalten, wie unten gezeigt.
groupCaseNo.groups.keys()
Die Verarbeitung kann für jeden Schlüssel wie folgt durchgeführt werden.
Der Inhalt von get_group
kann mit dem Gruppierungsschlüssel abgerufen werden.
for case in groupCaseNo.groups.keys():
print(groupCaseNo.get_group(case))
Es ist möglich, Zeichenfolgen mithilfe einer Funktion zu kombinieren, indem Sie "apply" wie unten gezeigt verwenden. Anonyme Funktionen sind mit Lambda möglich, aber ich denke, Sie müssen eine separate Funktion erstellen, wenn Sie komplizierte Dinge tun.
def getRecordAe(data):
return data.Seriennummer des schädlichen Ereignisses+':'+data.Unerwünschtes Ereignis
groupCaseNo.apply(getRecordAe)
Recommended Posts