Lesen Sie auf der Website von Kaggle Quellcode einer bestimmten Person und lesen Sie, wie Sie ihn lesen. Ich werde es hier aufnehmen, weil ich es verstehen will.
Die Umgebung verwendet Python 3, Matplotlib und Pandas.
Dieses Mal werde ich versuchen, log (log) auf meine eigene Weise zu verstehen. Ich habe log (log) in 10 Jahren noch nie als Mitglied der Gesellschaft benutzt. Ich habe nur eine schwache Erinnerung an das Studium, als ich Student war.
Also habe ich versucht herauszufinden, warum ein Protokoll benötigt wird. Unterschied zwischen seismischer Intensität und Größe? Einfach und klar! ](Http://kenyu.red/archives/2719.html) wurde gelesen.
Wenn die Anzahl zu groß und schwer zu handhaben ist, wird das Protokoll verwendet, um die Handhabung zu vereinfachen.
Wenn Sie kein Protokoll verwenden, sieht es so aus. Der größte Teil des Histogramms wird nicht angezeigt und ich bin mir nicht sicher, was es ist.
python
import matplotlib.pyplot as plt
import pandas as pd
df = pd.read_csv("./creditcard.csv")
f, (ax1, ax2 ) = plt.subplots(2, 1, sharex=True, figsize=(12,4))
bins = 30
ax1.hist(df.Amount[df.Class == 1], bins = bins)
ax1.set_title('Fraud')
ax2.hist(df.Amount[df.Class == 0], bins = bins)
ax2.set_title('Normal')
plt.xlabel('Amount ($)')
plt.ylabel('Number of Transactions')
plt.show()
Folgendes wird dem Quellcode hinzugefügt, wenn das Protokoll nicht verwendet wird.
plt.yscale('log')
python
import matplotlib.pyplot as plt
import pandas as pd
df = pd.read_csv("./creditcard.csv")
f, (ax1, ax2 ) = plt.subplots(2, 1, sharex=True, figsize=(12,4))
bins = 30
ax1.hist(df.Amount[df.Class == 1], bins = bins)
ax1.set_title('Fraud')
ax2.hist(df.Amount[df.Class == 0], bins = bins)
ax2.set_title('Normal')
plt.xlabel('Amount ($)')
plt.ylabel('Number of Transactions')
plt.yscale('log')
plt.show()
Es stellt sich heraus, dass der Gesamttrend bei Verwendung von Protokoll etwas sichtbarer ist als bei Nichtverwendung von Protokoll.
Recommended Posts