Ich habe eine Bibliothek für Python und verschiedene Datenwissenschaften.
――Ich möchte planen! ――Ich möchte den Zertifizierungsprozess durchführen! ――Ich möchte den Datenrahmen verarbeiten!
Ich werde vorstellen, welche Art von Bibliothek für grundlegende Dinge wie verfügbar ist.
** Anfrage: Bitte erhöhen Sie die Anzahl der Elemente in der Bearbeitungsanfrage oder teilen Sie uns Ihre Empfehlungen mit. ** ** **
pandas
Halten Sie Daten in einem "Datenrahmen" in Form eines relationalen Modells (bekannt für SQL). Hierfür stehen Funktionen wie Filtern, Zuordnen und Gruppieren zur Verfügung. Es hat auch eine Fülle von Schnittstellen zum Lesen und Schreiben von Daten.
Das Folgende ist ein Beispiel, das csv liest und nur diejenigen belässt, deren "Verkauf" -Element "1000" oder mehr ist.
import pandas as pd
data = pd.read_csv("data.csv")
over_1000 = data[ data['Der Umsatz'] > 1000 ]
numpy
import numpy as np
#Matrixgenerierung aus Liste
mat = np.matrix([[1, 2], [3, 4]])
#Vektorerzeugung aus Liste
vec = np.array([5, 6])
#Nimm das Matrixprodukt
mat.dot(vec)
numpy
numpy bietet eine breite Palette grundlegender Verarbeitungsmöglichkeiten, einschließlich der Verarbeitung linearer Algebra. Dazu gehört auch die zufällige Generierung nach der Verteilung.
Beispielsweise kann eine Folge von Zufallszahlen, die einer Normalverteilung folgt, wie folgt erzeugt werden:
import numpy as np
mu, sigma = 2, 0.5
v = np.random.normal(mu,sigma,10000)
Eine Bibliothek, mit der Diagramme gezeichnet werden können
matplotlib
Es bietet die Möglichkeit, verschiedene Diagramme zu zeichnen. Da es sich um eine Bibliothek mit relativ geringen Schichten handelt, wird sie in Kombination mit Seegeborenen usw. verwendet.
import numpy as np
import matplotlib.pyplot as plt
x = np.arange(-3, 3, 0.1)
y = np.sin(x)
plt.plot(x, y)
seaborn
Searborn ist eine Bibliothek, die Matplotlib umschließt und eine einfachere Möglichkeit bietet, saubere Grafiken zu zeichnen. Es bietet die Möglichkeit, beispielsweise Wärmekarten zu zeichnen.
import numpy as np
import matplotlib
#Wenn Sie Seaborn importieren, wird das Diagramm von Matplotlib zu einem wunderschönen Diagramm im Seaborn-Stil.
import seaborn as sns
x = np.random.normal(size=100)
sns.distplot(x);
scipy
scipy ist eine Bibliothek, die die für wissenschaftliche und technologische Berechnungen erforderliche Verarbeitung bereitstellt. Diese Bibliothek bietet tatsächlich eine ziemlich breite Palette an Funktionen, sodass Sie hier möglicherweise das meiste finden, was Sie tun möchten.
Der t-Test kann wie folgt durchgeführt werden.
import numpy as np
from scipy import stats
a = np.random.normal(0, 1, size=100)
b = np.random.normal(1, 1, size=10)
stats.ttest_ind(a, b)
sympy
Eine Bibliothek, die automatisch algebraische Berechnungen durchführt. Mit anderen Worten, es ist eine Bibliothek, die alle Arten von Formeltransformationen auslösen kann. (Übrigens, wenn jemand weiß: Ist das ein System zum Umschreiben von Begriffen?)
Hier werden wir die symbolische Differenzierung als Anwendung erwähnen.
import sympy as sym
#Variablen vorbereiten
x = sym.symbols("x")
#Machen Sie eine polymorphe ...
f = x**3 + 2*x**2 - x + 5
#Unterscheiden
df_dx = sym.diff(f, x)
statsmodels
Eine praktische Bibliothek zum Erstellen statistischer Modelle.
Das Folgende ist ein Beispiel für das Generieren eines verallgemeinerten linearen Modells und das Anzeigen seiner grundlegenden statistischen Informationen (AIC usw. werden angezeigt).
import numpy as np
import pandas as pd
import statsmodels.api as sm
import statsmodels.formula.api as smf
df = pd.read_csv("data.csv")
formula = 'Sales ~ AccessCount + MailSendedCount'
mod = smf.ols(formula=formula, data=df)
res = mod.fit()
res.summary()
scikit-learn
(Der Inhalt wird nacheinander erhöht.)
Recommended Posts