#python
--sql
[]( "Bestellung zur Anzeige auf dieser Seite" python pandas numpy matplotlib Andere sql R )
[]( Wie schreibe ich diese Seite?
‘‘‘ python Code Kommentar ・ Schreiben Sie alle Kommentare hier, nicht in den Text )
python
#python
df_used_method1_used_method2\
= df.copy()\
.used_method1()\
.used_method2()\
1.Beschreibung der Funktion selbst
"""Schreiben Sie hier eine Beschreibung"""
2.Bibliotheksimport
import pandas as pd
3.Variablen angeben
START_DATE = 20200527
4.main()Definition der in
def func1(parameter1:str) -> pd.DataFrame:
5.main()Definition von
def main()
6.
if __name__ == "main":
main()
def func1(parameter_path:str, parameter_date:int, parameter_df:pd.DataFrame) -> pd.DataFrame:
"""
Schreiben Sie eine Dokumentzeichenfolge
"""
#main()Es scheint notwendig, wenn man ein Argument aufnimmt
SQL
--sql
select
datamart1.column1
, datamart1.column2
, datamart2.column3
from
datamart1
left join
datamart2
on = column2
where
datamart1.column1 > 10
;
select
column1
, column2
, sum(column3)
, avg(column4)
from
datamart1
group by
column1
, column2
;
SQL-Regeln
#python
--sql
#python
--sql
#python
#Im Serienformat extrahiert
df.loc[:,'column']
df['column']
df.column
#Im Datenrahmenformat extrahiert
df.loc[:,['column1','column2']]
df[['column1','column2']]
--sql
select
column1
from
datamart
;
select
*
from
datamart
;
#python
df.head(10)
--sql
select top(10)
column1
from
datamart
;
select
column1
from
datamart
limit
10
;
#python
df.drop_duplicates()
--sql
select unique
*
from
datamart
;
#python
df_assign\
= df.copy()\
.assign(column = 10)
df['column'] = 10
--sql
select
10 as column1
from
dataframe
;
#python
df_query_loc\
= df.copy()\
.query('column1 == 10')\
.loc[:,['column1','column2']]
df[df.column1 == 10, ['column1','column2']]
--sql
select
column1
from
datamart1
where
column1 == 10
;
select
column1
, count(column1)
from
datamart1
group by
column1
having
count(column1) == 10
;
#python
df.rename(columns = {'column1':'new_column1','column2':'new_column2'})
pd.DataFrame(df.values, columns = ['new_column1','new_column2'])
df.columns = ['new_column1','new_column2']
df.columns = 'new_' + df.columns
--sql
select
column1 as new_column1
from
datamart1
;
#python
pd.merge(
df1,
df2,
on = ['column1','column2'],
how = 'left')
pd.merge(
df1,
df2,
left_on = ['column1','column2'],
right_on = ['column3','column4'],
how = 'left')
df1.merge(
df2,
on = 'column1',
how = 'left')
--sql
select
datamart1.column1
, datamart1.column2
, datamart2.column3
from
datamart1
left join
datamart2
on = column2
#python_pandas
#Vertikal
pd.concat([df1,df2],axis=0)
df1.append(df2)
#Seite
pd.concat([df1,df2],axis=1)
#python_numpy
#Vertikal
np.concatenate([nparray1,nparray2], axis=0)
#Seite
np.concatenate([nparray1,nparray2], axis=1)
--sql
select
column1
from
datamart1
union -- union all / intersect / except
select
column2
from
datamart2
#python
len(df)
--sql
select
count(*)
from
datamart1
;
#python
#Formprüfung
np.array().shape
#python
df.sort_values()
--sql
select
*
from
datamart1
order by
column1
#python
--sql
#python
#Generieren Sie nparray mit denselben Werten
#Beispiel 3D
np.tile(Zahlen, (n, n, n))
[i for i in range(100)]
#Bei Verwendung der if-Anweisung
[i for i in range(100) if i > 50]
#python
df\
.groupby(['column1','column2'])\
.agg({'column3':'sum',
'column4':'mean'})\
.reset_index()
-- sql
select
column1
, column2
, sum(column3)
, avg(column4)
from
datamart1
group by
column1
, column2
;
df_tmp\
.groupby('column1')\
.agg({'column2':'nunique'})
df_tmp\
.groupby('column1')\
.agg({'column2':['sum', 'min', 'max']})
#python
#durchschnittlich
np.average(nparray, axis = n)
#Bei Daten mit zwei oder mehr Dimensionen hängt das Ergebnis von der durchschnittlichen Dimension ab.
np.array().mean()
#Teilung
np.array(nparray1, nparray2)
#Holen Sie sich im Listenformat
str_data.split('Bestimmte Zeichenfolge')
str_data[-n]
str_data[:-n]
str_data.find('Zu suchende Zeichenkette')
#Wenn die Zeichenfolge enthalten ist"1"Wenn nicht enthalten"-1"
#python
import cv2
cv2.imread('filename.png')
#python
import PIL
PIL.image.open('filename.png')
#python
cv2.imshow("image_name", cv2.imread('filename.png'))
#"image_name"Ist optional eingestellt
#python
PIL.image.open('filename.png').show()
#python
#Bilddaten np Konvertierung
image = PIL.image.open('filename.png')
np.array(image)
#python
np.array(image)[Oberes Pixel:Unteres Pixel,Linkes Pixel:Rechtes Pixel]
#python
#Fügen Sie ein Quadrat hinzu
plt.figure()
plt.grid(false)
cv2.rectangle(np.array(image), (Rechtes Pixel,Oberes Pixel), (Linkes Pixel,Unteres Pixel), (255, 255, 255), 4)
plt.imshow(np.array(image),cmap='gray',vmin=0,vmax=65555)
signal.convolve2D
#Ändern Sie die Anzahl der zu extrahierenden Bilder mit der letzten Nummer
Image.open('~.tif').seek(0)
#python
plt.figure(figsize = (6,4))
#python
plt.x_lim([richtig,links])
plt.y_lim([Oben,unter])
#python
aspect = (ax.get_x_lim()[1] - ax.get_xlim()[1]) / (ax.get_y_lim()[1] - ax.get_y_lim()[0])
ax.set_aspect(aspect)
#python
fig.patch.set_alpha(0)
#Es wird nur fig unterstützt
#python
#Rasterlinien nicht anzeigen
#python
#Verwenden Sie 1, Nebenhandlung
plt.subplot(Vertikal,Seite,1)
plt.plot(~)
plt.subplot(Vertikal,Seite,2)
plt.plot(~)
↓
plt.subplot(Vertikal,Seite,Vertikal×Seite)
plt.show(~)
#2、add_Nebenhandlung verwenden,
ax1 = plt.figure().add_subplot(Vertikal,Seite,1)
ax1 = plot(~)
↓
plt.show()
#Verwenden Sie 3 Nebenhandlungen
fig, axes = plt.subplots(~, figsize=(6,4)) #Abb. wird nicht verwendet
axes[1].plot
#python
#Prozess mit der Bibliothek
#python
import time
#Beginn der Verarbeitung
time_start = time.time()
#Ende der Verarbeitung
time_end = time.time()
print(time_end-time_start)
import datetime
from dateutil.relativedelta import relativedelta
date_datetime = datetime.datetime.strptime('2020-05-24', '%Y-%m-%d')
import datetime
from dateutil.relativedelta import relativedelta
datetime.datetime.strftime(date_datetime, '%Y-%m-%d')
date_datetime + datetime.timedelta(days=7)
date_datetime + relativedelta(weeks = 1)
datetime.weekday(date_datetime)
#python
#Verzeichnis"src"Lesen Sie die Funktion aus der folgenden Datei
import sys
sys.path.append('src/')
from filename.py import func_name
#python
import pathlib
filepath = r'Pfad_Dateiname.csv'
read_file = pathlib.WindowPath()
import glob
glob.glob('path/*')
import os
if os.path.exists(path_name) == False
os.makedirs(path_name)
#python_pandas
#Lesen Sie df
pd.DataFrame(data,columns=[column1,column2])
pd.read_csv('filename')
#python_numpy
#Laden von npz
np.load(filename)
#python_pandas
#Lesen Sie df
pd.DataFrame().to_csv('filename', index=False)
#python_numpy
#Speichern Sie npz
np.savez(pathname, filename1 = np.array('1'), filename2 = np.array('2'))
#python_matplotlib
#Bild speichern
plt.savefig('filename')
#python_sklearn
#Modell speichern
import sklearn
import pickle
reg = sklearn.LinearRegression().fit(x,y)
with open('filename.pickle', mode = 'wb', as f
pickle.dump(reg, f)
#zip
for i_column1, i_column2 in zip(df_tmp.column1, df_tmp.column2):
#itertools
for i,j in
permutations(i,j):Permutation
combinations(i,j):Kombination
products(i,j):Direktes Produkt
for i in enumerate(df_tmp.column):
#def, verwenden
def_func_name(parameter1, parameter2):
wird bearbeitet
return Rückgabewert
#Verwenden Sie Lambda,
lambda parameter:Formel zurückgeben(parameter)
#Verwenden Sie Lambda,_In einer Zeile ausgedrückt
(lambda parameter:Formel zurückgeben(parameter))(parameter_instance)