data = pd.read_csv("sample.csv", encoding="UTF-8")
data
Nicht notwendig,Nicht notwendig,Nicht notwendig,Nicht notwendig,Nicht notwendig,Nicht notwendig
Nicht notwendig,Titel A.,Titel B.,Titel C.,Titel D.,Nicht notwendig
Nicht notwendig,10,20,30,40,Nicht notwendig
Nicht notwendig,100,200,300,400,Nicht notwendig
Nicht notwendig,Nicht notwendig,Nicht notwendig,Nicht notwendig,Nicht notwendig,Nicht notwendig
Ich speichere die Daten in der Google-Tabelle als CSV und stelle mir die Daten bei der Analyse vor. Ich denke, es gibt einige Blätter, in denen Memos und Bemerkungen geschrieben werden, ohne strukturiert zu sein. Ich denke, dass Sie den Bereich beim Speichern auswählen können, aber dieses Mal werde ich versuchen, ihn nach dem Üben mit Pandas zu organisieren.
data.columns = data.iloc[0]
data
data = data.iloc[1:3,1:5]
data
 Es ist genau das, was ich will.
data.describe()
 Ich dachte, dass der Durchschnitt usw. herauskommen würde, aber das tut es nicht.
 Dies liegt daran, dass der Werttyp nicht numerisch ist.
data = data.astype('int')
data
data.describe()
data.corr()
#### Bemerkungen
 Ich weiß nicht, was die 0 oben links ist
data.sum() #gesamt
data.skew() #Schiefe
data.kurt() #Kurtosis
data.var() #Verteilt
data.cov() #Kovarianzmatrix
%matplotlib inline #Erforderlich, um auf Seite angezeigt zu werden
data.plot(kind='box')
#### Bemerkungen
 Das japanische Etikett wird nicht angezeigt, das japanische jedoch
```
matplotlib.rcParams['font.family'] = 'M+ 1c' #Festlegbare Schriftart
```
 Es kann durch Angabe von als angezeigt werden.
 Folgende Schriftarten können angegeben werden
```
import matplotlib.font_manager as fm
fm.findSystemFonts()
```
 Sie können unter herausfinden.
http://qiita.com/hagino3000/items/1b54acc01483ccd0ac72
 Ich bezog mich auf.
pd.concat([data,data])
pd.concat([data,data], axis=1)
data.pipe(lambda df: df / 2)
data['Titel A.'].sort_values(ascending = True)
        Recommended Posts