Lisez et analysez l'ensemble de données au format arff avec python scipy.io

introduction

J'avais besoin d'analyser l'ensemble de données weka au format arff, et j'ai eu un peu de mal à le lire et à l'utiliser par python, donc je vais le résumer.

Lis

Il peut être chargé en utilisant loadaiff () dans scipy.io. (Voir référence scipy.io) https://docs.scipy.org/doc/scipy-0.18.1/reference/tutorial/io.html

readarff.py


from scipy.io import arff
import numpy as np
dataset, meta = arff.loadarff("DARPA99Week3-46.arff")

Conversion de tableau

Pour analyser avec scipy ou scikit-learn, je veux en faire un tableau numpy normal, alors convertissez-le avec le script suivant. (Voir «Préparer le résultat de loadarff scipy.io pour scikit-learn» dans Stack Overflow)

arff1.py


ds=np.asarray(dataset.tolist(), dtype=np.float32)
target=np.asarray(ds[:,22].tolist(), dtype=np.int8)
train=ds[:, :21]

Ou

arff2.py


train_data = dataset[meta.names()[:-1]]
train_array = train_data.view(np.float).reshape(data.shape + (-1,))

affichage graphique

Une fois que vous avez un tableau numpy, vous pouvez utiliser matplotlib etc. pour afficher des graphiques et effectuer une analyse.

hist.py


%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np

duration=ds[:,16]
plt.hist(duration, bins=50)
plt.show()

référence

référence scipy.io https://docs.scipy.org/doc/scipy-0.18.1/reference/tutorial/io.html

Prepare scipy.io loadarff result for scikit-learn (Stack Overflow) http://stackoverflow.com/questions/22873434/prepare-scipy-io-loadarff-result-for-scikit-learn

Recommended Posts

Lisez et analysez l'ensemble de données au format arff avec python scipy.io
Lire le fichier json avec Python, le formater et générer le json
Lisez CSV et analysez avec Pandas et Seaborn
Lire et formater des fichiers csv mélangés avec des tabulations de virgule avec des pandas Python
Lire JSON avec Python et générer un CSV
[Python3] Lecture et écriture avec isoformat datetime avec json
Lire et écrire des fichiers avec Slackbot ~ Développement de bot avec Python ~
Programmation avec Python et Tkinter
Lire csv avec des pandas python
Python et matériel - Utilisation de RS232C avec Python -
Indentation Python et format de chaîne
python avec pyenv et venv
Formater json avec Vim (avec python)
Format de chaîne avec l'opérateur Python%
Fonctionne avec Python et R
Lire des données json avec python
[Python] Lisez le fichier csv et affichez la figure avec matplotlib
Analysez les actions avec python et recherchez des phases de trading favorables
Communiquez avec FX-5204PS avec Python et PyUSB
Briller la vie avec Python et OpenCV
Extraire le jeu de données bigquery et la liste des tables avec python et la sortie en CSV
Robot fonctionnant avec Arduino et python
Installez Python 2.7.9 et Python 3.4.x avec pip.
Réseau neuronal avec OpenCV 3 et Python 3
Scraping avec Node, Ruby et Python
Grattage avec Python, Selenium et Chromedriver
Grattage avec Python et belle soupe
Lire et utiliser des fichiers Python à partir de Python
Encodage et décodage JSON avec python
Introduction à Hadoop et MapReduce avec Python
[GUI en Python] PyQt5-Glisser-déposer-
Lire et écrire NetCDF avec Python
Extraire le texte du pdf [python] et lire les caractères à haute voix avec Open-Jtalk
J'ai joué avec PyQt5 et Python3
Lire des fichiers en parallèle avec Python
Lire et écrire du CSV avec Python
Intégration multiple avec Python et Sympy
Charger fbx depuis python avec cinema4d
Coexistence de Python2 et 3 avec CircleCI (1.0)
Analysons la voix avec Python # 1 FFT
Jeu Sugoroku et jeu d'addition avec Python
Modulation et démodulation FM avec Python
Créer et lire des paquets de messages en Python
[Python] Formater quand to_csv avec des pandas
Mettez Cabocha 0.68 dans Windows et essayez d'analyser la dépendance avec Python
Lisez le fichier avec python et supprimez les sauts de ligne [Notes sur la lecture du fichier]
Lisez le fichier CSV avec Python et convertissez-le en DataFrame tel quel
Communiquez entre Elixir et Python avec gRPC
Construction de pipeline de données avec Python et Luigi
Calculer et afficher le poids standard avec python
Surveiller les pannes de Mojo avec Python et Skype
Modulation et démodulation FM avec Python Partie 3
Lire le fichier CSV avec python (Télécharger et analyser le fichier CSV)
Installation de Python et gestion des packages avec pip
Utilisation de Python et MeCab avec Azure Databricks
POSTER diversement avec Python et recevoir avec Flask
Capturer des images avec Pupil, python et OpenCV
Fractal pour faire et jouer avec Python
Un mémo contenant Python2.7 et Python3 dans CentOS