[PYTHON] Ich habe versucht, den in Pandas häufig verwendeten Code zusammenzufassen

Als ich anfing zu kaggen und mehr Möglichkeiten hatte, mit Data Science in Kontakt zu kommen, verwendete ich unweigerlich Pandas, um Daten zu verarbeiten, weil ich Python verwendete. Dieses Mal habe ich die Codes zusammengefasst, die ich oft persönlich benutze. Es ist fast ein Memo für mich, aber ich dachte, es könnte für jemanden nützlich sein, also habe ich beschlossen, alles zusammen auf Qiita zu posten. Wenn Sie Ratschläge oder Eindrücke haben, wie zum Beispiel andere bessere Notationen, würde ich mich freuen, wenn Sie mich in den Kommentaren darüber informieren könnten. Wenn es einen Allzweckcode gibt, möchte ich ihn von Zeit zu Zeit aktualisieren.

DataFrame So erstellen Sie Daten. Es ist nichts besonders Gutes daran, aber die gleichen Daten werden auf zwei Arten erstellt. Bitte verwenden Sie die für Sie je nach Situation einfache. Die Ausgabe ist die gleiche. method 1

index = ['a','b','c']
columns = ['A','B','C']
inputs = [[1,2,1],[3,4,3],[5,6,5]]
df = pd.DataFrame(columns = columns,index = index)
for i,columns in enumerate(columns):
    df[columns] = inputs[i]
df
A B C
a 1 3 5
b 2 4 6
c 1 3 5

method 2

index = ['a','b','c']
df = pd.DataFrame({
    'A':[1,2,1],
    'B':[3,4,3],
    'C':[5,6,5]},
    index=index)
df
A B C
a 1 3 5
b 2 4 6
c 1 3 5

Dieses Mal geben wir ein geeignetes Alphabet (a, b, c) als Index ein. Wenn Sie jedoch keinen Index angeben, wird eine Zahl von 0 zugewiesen.

Feature Encoding Einige Zusammenfassungen zur Umrechnung der Funktionsmenge. One-Hot Encoding Ich denke, dass es viele Situationen gibt, in denen Sie in einen heißen Vektor konvertieren möchten, wenn Sie mit den Daten herumspielen. Sie können die One-Hot-Codierung von sklearn verwenden. Wenn Sie Ihre Daten jedoch mit Pandas verwalten, ist get_dummes effizienter.

pd.get_dummies(df['A'])
1 2
a 1 0
b 0 1
c 1 0

Frequency Encoding Dies ist ein vollständig persönlicher Code. Ich dachte, ich könnte es wieder benutzen, also notiere es dir. Der Prozess besteht darin, den Wert für die Anzahl der Vorkommen in eine Bezeichnung umzuwandeln und zurückzugeben.

df.groupby('B')[['B']].transform('count')
B
a 2
b 1
c 2

Dies bedeutet, dass 3 zweimal und 4 einmal in B-Spalten erscheint.

Ich habe noch nicht alles zusammengestellt, aber vorerst. Ich werde wieder Code hinzufügen.

Recommended Posts

Ich habe versucht, den in Pandas häufig verwendeten Code zusammenzufassen
Ich habe versucht, die im Geschäftsleben häufig verwendeten Befehle zusammenzufassen
Ich habe versucht zusammenzufassen, wie man Pandas von Python benutzt
Ich habe versucht, die Methoden zusammenzufassen, die häufig bei der grundlegenden Algo-Implementierung in Quantx Factory verwendet werden
Ich habe versucht, den Befehl umask zusammenzufassen
Ich habe versucht, die grafische Modellierung zusammenzufassen.
Ich habe versucht, die Befehle zusammenzufassen, die Anfängeringenieure heute verwenden
Ich habe versucht, die häufig verwendete Implementierungsmethode von pytest-mock zusammenzufassen
LeetCode Ich habe versucht, die einfachen zusammenzufassen
[Python] Ich habe versucht, den kollektiven Typ (Satz) auf leicht verständliche Weise zusammenzufassen.
Ich habe versucht, die Linux-Befehle zusammenzufassen, die heute von Anfängeringenieuren verwendet werden - Teil 1-
Ich habe versucht, SparseMatrix zusammenzufassen
Ich habe versucht, die in Python installierten Pakete grafisch darzustellen
Ich habe versucht, die Grundform von GPLVM zusammenzufassen
Ich habe versucht, die String-Operationen von Python zusammenzufassen
Ich habe versucht, die beim maschinellen Lernen verwendeten Bewertungsindizes zu organisieren (Regressionsmodell).
Ich habe versucht, die Operationen zusammenzufassen, die wahrscheinlich mit numpy-stl verwendet werden
Ich habe versucht, alle Python-Diagramme zusammenzufassen, die von aktiven Doktoranden in der Forschung verwendet wurden [Basic]
Ich habe versucht, den für TensorFlow geschriebenen Code nach Theano zu portieren
[Erste COTOHA-API] Ich habe versucht, die alte Geschichte zusammenzufassen
Zusammenfassung der häufig verwendeten Grammatik bei Pandas
Ich habe versucht, die Zeit und die Zeit der C-Sprache zu veranschaulichen
Ich habe versucht, die neuen mit dem Corona-Virus infizierten Menschen in Ichikawa City, Präfektur Chiba, zusammenzufassen
Ich habe versucht, die Mail-Sendefunktion in Python zu implementieren
[Maschinelles Lernen] Ich habe versucht, die Theorie von Adaboost zusammenzufassen
Ich habe versucht, alle Python-Visualisierungstools zusammenzufassen, die von aktiven Doktoranden in der Forschung verwendet wurden [Anwendung]
Ich habe versucht, den Ball zu bewegen
Ich habe versucht, den Abschnitt zu schätzen.
Ich habe versucht zusammenzufassen, wie das EPEL-Repository erneut verwendet wird
[Kein Code] Ich habe in meiner Abschlussarbeit über elliptische Kurven und Blockchain geschrieben und versucht, die Studienmethode zusammenzufassen
Ich habe versucht zusammenzufassen, was der Python-starke Mann in der professionellen Nachbarschaft des Wettbewerbs tut
Ich habe versucht, den Datenverkehr mit WebSocket in Echtzeit zu beschreiben
[Linux] Ich habe versucht, die Ressourcenbestätigungsbefehle zusammenzufassen
Ich habe versucht, das Bild mit OpenCV im "Skizzenstil" zu verarbeiten
Ich habe den Code geschrieben, um den Brainf * ck-Code in Python zu schreiben
Ich habe versucht, das Bild mit OpenCV im "Bleistift-Zeichenstil" zu verarbeiten
Ich möchte die zweite Zeile zum Spaltennamen in Pandas machen
Ich habe versucht, die Behandlung von Python-Ausnahmen zusammenzufassen
Ich habe versucht, PLSA in Python zu implementieren
Ich habe versucht, Permutation in Python zu implementieren
Ich versuchte das Weckwort zu erkennen
Python3-Standardeingabe habe ich versucht zusammenzufassen
Ich habe versucht, ADALINE in Python zu implementieren
Ich habe versucht, das Umfangsverhältnis π probabilistisch abzuschätzen
Ich habe versucht, die COTOHA-API zu berühren
Ich habe versucht, PPO in Python zu implementieren
Verarbeiten von Memos, die häufig bei Pandas (Anfängern) verwendet werden
Ich habe versucht, Ansibles Module-Linux-Edition zusammenzufassen
Ich habe versucht, den Inhalt jedes von Python pip gespeicherten Pakets in einer Zeile zusammenzufassen
Ich versuchte zusammenzufassen, bis ich die Bank verließ und Ingenieur wurde
Ich habe versucht, den allgemeinen Ablauf bis zur Erstellung von Diensten selbst zusammenzufassen.
Ich habe versucht, den Authentifizierungscode der Qiita-API mit Python abzurufen.
Ich habe versucht, Cpaw Level1 & Level2 Write Up auf leicht verständliche Weise zusammenzufassen
Ich habe versucht, verschiedene Sätze mit der automatischen Zusammenfassungs-API "summpy" zusammenzufassen.
Ich habe versucht, die logische Denkweise über Objektorientierung zusammenzufassen.
Ich habe versucht, den Höhenwert von DTM in einem Diagramm anzuzeigen
Ich habe das VGG16-Modell mit Keras implementiert und versucht, CIFAR10 zu identifizieren
Ich habe versucht, das RWA-Modell (Recurrent Weighted Average) in Keras zu trainieren
Ich habe versucht, PyCharm in Ubuntu 16.04 LTS zu integrieren (PPA kann nicht verwendet werden)
Ich habe Web Scraping versucht, um die Texte zu analysieren.