[python] Techniques souvent utilisées dans l'apprentissage automatique

Trame de données remplie avec tous les 0

import pandas as pd
import numpy as np

rows = 4
cols = 4 
df = pd.DataFrame(np.zeros((rows, cols)))

numpy.float Obtient le nombre de chiffres dans la partie fractionnaire d'un élément de tableau de type 64

Je l'ai utilisé lorsque je voulais «diviser» l'élément extrait du tableau numpy et vérifier le nombre de chiffres dans la partie minoritaire. Puisque split est une méthode de type str, convertissez-la en str et récupérez-la.

import numpy as np

narr = np.array([1.3334, 5.3343, 7.3322])

n_to_str = np.array2string(x[0])

print(len(n_to_str.split('.')[-1]))
# 4

Concaténer les trames de données

Lorsque vous voulez vous connecter à l'extrême droite


a = [1,2,3]
b = [1,2,3]

bf = pd.DataFrame()
bf['a'] = a
bf['b'] = b
	a	b
0	1	1
1	2	2
2	3	3
a = [1,2,3]
b = [1,2,3]

bf = pd.DataFrame(a, columns=['a'])
bf.insert(1, "b", b)
	a	b
0	1	1
1	2	2
2	3	3

Connectés ensemble



a = [1,2,3]
b = [1,2,3]
c = [1,2,3]

cols = {
    "a":a,
    "b":b,
    "c":c
}

da = pd.DataFrame(cols)

#Connecté horizontalement
print(pd.concat([da,da], axis=1, ignore_index=True))
print()
#Connecté verticalement
# ignore_Si l'index n'est pas spécifié comme True, ce sera 012012.
print(pd.concat([da,da], axis=0, ignore_index=True))

   0  1  2  3  4  5
0  1  1  1  1  1  1
1  2  2  2  2  2  2
2  3  3  3  3  3  3

   a  b  c
0  1  1  1
1  2  2  2
2  3  3  3
3  1  1  1
4  2  2  2
5  3  3  3

Convertir les chaînes de caractères aux formats datetime et horodatage

Il s'agit d'une technique de conversion vers un format qui peut être géré par python lors du calcul des données de date et d'heure.

La conversion en horodatage facilite la gestion du déplacement des secondes, des minutes et des heures.

Un exemple d'essayer de calculer sans rien faire


#Exemple) 1:59:50 + 0:00::20 = 2:00:10
#Lorsque vous ne convertissez pas en horodatage

hour = 1
minute = 59
sec = 50

add_hour = 0
add_minute = 0
add_sec = 20

if sec + add_sec > 60 or minute + add_minute > 60 or hour + add_hour > 24:
    #Processus de transport
else:
    #Traitement lorsqu'il ne monte pas

Chaîne datetime,Convertir en horodatage


from datetime import datetime

s = "2020.07.10 22:59:59"

date = datetime.strptime(s, "%Y.%m.%d %H:%M:%S")
print(date)
# 2020-07-10 22:59:59
 
timestamp = datetime.timestamp(date)
print(timestamp)
# 1594389599.0

Renvoie la valeur de l'horodatage placée dans une liste, etc. à une chaîne de caractères

Après avoir mis l'horodatage dans une liste, etc., renvoyez-le à une chaîne de caractères


from datetime import datetime

t_list = [1594177973.0,1594177974.0,1594177975.0]
 
print(type(t_list[0]))
# float

#Convertir en type datetime puis en chaîne
datetime.fromtimestamp(t_list[0]).strftime("%H:%M:%S")
# '12:12:53'

Addition et soustraction de temps

Vous pouvez ajouter ou soustraire à un objet datetime.datetime en utilisant datetime.timedelta

Prend en charge les calculs pendant des semaines, des jours, des heures, des minutes, des secondes

import datetime

#Heure actuelle
now = datetime.datetime.now()
print(now)
# 2020-07-11 18:19:47.149523

#Ajouter 10 secondes à l'heure actuelle
now_add_10sec = now + datetime.timedelta(seconds=10)
print(now_add_10sec)
# 2020-07-11 18:19:57.149523

moyenne mobile

Utilisez numpy convolve. C'est plus rapide que «pandas rollin», et le code est court et facile à comprendre.

period = 3 #Période moyenne
data = np.arange(1,10)
print(data)
print(len(data))

# mode = { same, valid, full }Vous pouvez choisir
# same:Le nombre d'éléments dans le résultat du calcul est de la même taille(non recommandé)
# valid:Il y a de nombreuses considérations, mais la taille est(period-1)Être gratté(Recommandation)
# full:Taille accrue (non recommandée))

average = np.convolve(data, np.ones(period)/period, mode='valid')
print(average)
print(len(average))
print([np.nan]*(period-1) + average.tolist()) #Mettez Nan dans la partie grattée
[1 2 3 4 5 6 7 8 9]
9
[2. 3. 4. 5. 6. 7. 8.]
7
[nan, nan, 2.0, 3.0, 3.9999999999999996, 5.0, 6.0, 7.0, 8.0]

Recommended Posts

[python] Techniques souvent utilisées dans l'apprentissage automatique
Utilisé en EDA pour l'apprentissage automatique
Python: prétraitement dans l'apprentissage automatique: présentation
Python: prétraitement en machine learning: acquisition de données
[Python] Enregistrement des résultats d'apprentissage (modèles) dans l'apprentissage automatique
Python: prétraitement dans l'apprentissage automatique: conversion de données
[Apprentissage automatique] Liste des packages fréquemment utilisés
Techniques souvent utilisées dans le codage court en python (Bloc-notes)
Divulgation complète des méthodes utilisées dans l'apprentissage automatique
Résumé des fonctions d'évaluation utilisées dans l'apprentissage automatique
Touchons une partie de l'apprentissage automatique avec Python
Apprentissage automatique dans Delemas (s'entraîner)
Créez un environnement interactif pour l'apprentissage automatique avec Python
Techniques liées à l'apprentissage automatique / à la classification
Outil MALSS (application) qui prend en charge l'apprentissage automatique en Python
Défis d'apprentissage automatique de Coursera en Python: ex2 (retour logistique)
Outil MALSS (basique) qui prend en charge l'apprentissage automatique en Python
Apprentissage automatique avec Python! Préparation
Liste des principales distributions de probabilité utilisées en apprentissage automatique et statistiques et code en python
Techniques de tri en Python
Programmation Python Machine Learning> Mots-clés
Coursera Machine Learning Challenge en Python: ex1 (régression linéaire)
Extraits de code Python fréquemment utilisés
Tentative d'inclusion du modèle d'apprentissage automatique dans le package python
Commandes fréquemment utilisées dans virtualenv
Commencer avec l'apprentissage automatique Python
MALSS (introduction), un outil qui prend en charge l'apprentissage automatique en Python
Le résultat de l'apprentissage automatique des ingénieurs Java avec Python www
Défis d'apprentissage automatique de Coursera en Python: ex7-2 (analyse principale)
Mettre en œuvre l'apprentissage de l'empilement en Python [Kaggle]
Apprentissage automatique par python (1) Classification générale
Résumé de l'apprentissage automatique par les débutants de Python
Automatisez les tâches de routine dans l'apprentissage automatique
[Python] Connaissances de base utilisées dans AtCoder
Règles d'apprentissage Widrow-Hoff implémentées en Python
Classification et régression dans l'apprentissage automatique
<Pour les débutants> bibliothèque python <Pour l'apprentissage automatique>
Apprentissage automatique dans Delemas (acquisition de données)
Implémentation des règles d'apprentissage Perceptron en Python
Prétraitement dans l'apprentissage automatique 2 Acquisition de données
Recherche de semences aléatoires dans l'apprentissage automatique
Mémo d'apprentissage "Scraping & Machine Learning avec Python"
Prétraitement dans l'apprentissage automatique 4 Conversion de données
[Python] Mémo des phrases fréquemment utilisées dans les scripts Python
Que diriez-vous d'Anaconda pour créer un environnement d'apprentissage automatique avec Python?
Défis de Coursera Machine Learning en Python: ex5 (ajustement des paramètres de régularisation)
Apprentissage automatique
apprentissage de python
Une classe qui résume les méthodes fréquemment utilisées dans l'api twitter (python)
Mémo d'étude Python & Machine Learning: Préparation de l'environnement
Remarques sur la grammaire Python de l'apprentissage automatique PyQ
Résumé des commandes fréquemment utilisées dans matplotlib
Python + Selenium Résumé des méthodes d'opération fréquemment utilisées
Utiliser le groupe d'API d'apprentissage automatique A3RT de Python
Apprentissage automatique avec python (2) Analyse de régression simple
J'ai installé Python 3.5.1 pour étudier l'apprentissage automatique
Pourquoi Python est choisi pour l'apprentissage automatique
Note récapitulative sur la programmation d'apprentissage automatique Python (Jupyter)
[Shakyo] Rencontre avec Python pour l'apprentissage automatique
[Python] Première analyse de données / apprentissage automatique (Kaggle)