__ Peu importe si vous attachez py à quoi que ce soit __
Je dois faire face à beaucoup de tsv bizarres, alors les pandas semblent être utiles? Cela ressemblait à, donc je l'utilise comme un essai. Ceci est un mémo sur la construction de l'environnement de python et comment l'utiliser.
Faites Introduction à python3 de l'installation de points, Jetez un coup d'œil à pythonizm et utilisez-le comme référence. L'installation de points est facile et agréable. Vous pouvez procéder à un bon tempo en 3 minutes par vidéo.
Introduction à Python pour les calculs scientifiques et technologiques: bases de développement, bibliothèques essentielles, accélération J'ai lu ceci. C'était bien que celui-ci soit également écrit systématiquement.
Il existe une page de support du livre, et l'auteur l'écrit généralement ici. Je l'ai fait sur Mac, donc j'ai mis pyenv dans homebrew et J'ai installé anaconda via celui-ci.
brew install pyenv
pyenv install anaconda3-4.2.0
Fondamentalement, il est courant de lire un fichier, de le formater et d'en faire un fichier de format différent.
--Confirmation et formatage des données sur le notebook jupyter --Si OK, un seul script (export)
Je le fais dans le flux. jupyter notebook, pratique car vous pouvez vérifier les données immédiatement.
jupyter notebook
import pandas as pd
pd.read_csv('FILENAME', delimiter=',', low_memory=False)
#low_la mémoire est utilisée lors de la lecture de fichiers lourds
dataframe.ix[:, ['A','B','C']]
JOIN
#joindre,comment partir,Vous pouvez bien faire, etc.
pd.merge(dataframe1, dataframe, how='left')
#0 en utilisant numpy~Ajouter une ligne de 3000 nombres au bloc de données
import numpy as np
length = len(dataframe)
dataflame['dummy']=np.random.randint(0,3001,length)
#Déposez une ligne avec Nan
dataframe.dropna()
#Convertir NaN en un caractère spécifique
#Exemple Convertir NaN en 0(La spécification de colonne est également possible)
dataframe.fillna(0)
#Vérifiez l'épaule actuelle
dataframe.dtypes
#à int(La spécification de colonne est également possible)
dataframe.astype('int')
#Afficher les lignes
dataframe.index
#Afficher les colonnes
dataframe.columns
#Renommer la colonne(X,Y,Changer en Z)
dataframe.columns=['X','Y', 'Z']
#Faites quelque chose pour toutes les colonnes
dataframe.apply(function, axis=1)
#Suppression en double sélectionnez distinct dans mysql(column)
dataframe['column'].drop_duplicates()
#groupby Agréger par clé spécifique(sum,Il y a diverses choses telles que la moyenne)
dataframe.groupby('column').sum()
Je bat avec brio l'ansible existant, c'est donc la solution Comment spécifier python à utiliser dans ansible
Il semble que l'int qui colle à la marge dataflame soit changé de force en type float64. Soyez prudent lors de la sortie.
Est-ce quelque chose comme ça pour le moment? Ensuite, je veux dessiner un graphique.
Recommended Posts