Normalerweise mache ich ** Datenanalyse und Modellbildung ** hauptsächlich auf Jupyter. Notieren Sie sich, wie oft Sie nachschlagen müssen. (Von Zeit zu Zeit aktualisiert)
Bereits importierte Module werden zwischengespeichert oder nicht aktualisiert, auch wenn sie wieder normal importiert werden. ** Sie können Folgendes neu laden (erneut importieren). ** ** **
import importlib
importlib.reload(hoge)
#hoge ist ein importiertes Modul
Ich wusste das bis vor kurzem nicht und habe es jedes Mal neu gestartet, also ist es wirklich ein Augenöffner. Eine weitere Option ist Automatisches Aktualisieren von Modulen mit% autoreload.
Wenn mehrere Server ausgeführt werden, wissen Sie häufig nicht, auf welcher Registerkarte sich das Notizbuch auf welchem Server befindet. Sie können den Registerkartennamen wie folgt ändern.
Führen Sie in Jupyter Folgendes aus
%%javascript
document.title='Jupyter-GPU'
Alternativ kann es zur Erstellungszeit angegeben werden.
jupyter lab build --name='Jupyter-GPU'
Referenz: https://github.com/jupyterlab/jupyterlab/issues/4422#issuecomment-395962448
Wenn Sie sich nicht besonders für Schriftarten interessieren, ist ** japanize-matplotlib der schnellste Weg. ** ** **
pip install japanize-matplotlib
import matplotlib.pyplot as plt
import japanize_matplotlib
plt.plot([1, 2, 3, 4])
plt.xlabel('Die Freude, Japanisch leicht zu benutzen')
plt.show()
Es gibt zwei Zeitpunkte, um den Debugger zu starten.
** Geben Sie einen Haltepunkt an und starten Sie den Debugger ** Geben Sie den folgenden Code ein
from IPython.core.debugger import Pdb; Pdb().set_trace()
** Starten Sie den Debugger, wenn ein Fehler auftritt ** Gilt nur für bestimmte Zellen
#Setzen Sie es an den Anfang der Zelle, die Sie debuggen möchten
%%debug
Gilt für das gesamte Notebook
#Legen Sie es irgendwo in das Notizbuch
%pdb on
#In diesem Fall möchten Sie den Fehlererkennungsmodus deaktivieren
%pdb off
[Jupyter Notebook / Lab] Drei Möglichkeiten zum Debuggen auf Jupyter [Pdb]
Ich frage mich, ob ich das einmal machen kann
from tqdm.auto import tqdm
import numpy as np
#In tqdm einschließen
for i in tqdm(np.arange(1, 100000, 1)):
#Hier verarbeiten
pass
import pandas as pd
import numpy as np
from tqdm.auto import tqdm
# set description
tqdm.pandas(desc="Mach das")
# apply
df = pd.DataFrame({'hoge': np.arange(1, 100000, 1)})
df['hoge'] = df['hoge'].progress_apply(lambda x: x + 1)
Erhöhen Sie die Anzahl der Elemente, die angezeigt werden können, und die maximale Anzahl der Zeichen, die in einer Zelle angezeigt werden können.
import pandas as pd
pd.set_option("display.max_colwidth", 500) #500 Zeichen in 1 Zelle
pd.set_option("display.max_rows", 100) #Kann 100 Zeilen anzeigen
** * Wenn set_option in JupyterLab nicht funktioniert, funktioniert es gut, wenn Sie die Datensätze unter max_rows
wie df [: 100]
anzeigen (aus meiner persönlichen Erfahrung) **
Wenn Sie verhindern möchten, dass nur eine bestimmte Zelle weggelassen wird, gehen Sie wie folgt vor (@chik_taks hat es mir gesagt!)
with pd.option_context('display.max_colwidth', 200):
display(df)
Sie können den DataFrame als Markdown ausgeben und kopieren. Ich benutze es nüchtern
pip install pytablewriter
import pytablewriter
writer = pytablewriter.MarkdownTableWriter()
writer.from_dataframe(df)
writer.write_table()
# | col1 | col2 |
# |------|--------|
# |hoge1 |line1 |
# |hoge2 |line2 |
Recommended Posts