[PYTHON] BigGorilla Umwelt Bau Memo

Was ich getan habe

Aufbau einer Big Gorilla-Umgebung Probieren Sie das FlexMatcher-Beispiel aus

Was ich fand

――Es ist ein neuer Standard, Pyenv nur zu verwenden, um Anakonda zu setzen und die Umwelt mit Conda zu verwalten. ―― ~~ (Stand: 12. Juli 2017) Der Bau der Umwelt läuft nicht gut ~~

Was macht man als nächstes

Lesen Sie den Flexmatcher-Code

Umgebung

Mac OS X 10.11 El Capitan Homebrew ist bereits installiert Installieren Sie Anaconda mit Pyenv

Aufbau einer BigGorilla-Umgebung (Die folgenden Informationen sind alt. Sie werden als Arbeitsprotokoll aufbewahrt.)

Pyenv war alt, also Update Aktualisieren Sie die von pyenv --Qiita verwaltete Python-Version

Installieren Sie Anaconda

$ pyenv install anaconda3-4.2.0
$ pyenv global anaconda3-4.2.0

Eine Umgebung für Big Gorilla schaffen. .. ~~ Ich kann nicht. ~~ 21.07.2017 Nachtrag: Es wurde möglich. Unter dem alten Rekord

$ conda env create biggorilla/py3gorilla
Collecting urllib==1.21.1
Downloading urllib-1.21.1.tar.gz (226kB)
100% |████████████████████████████████| 235kB 640kB/s
Complete output from command python setup.py egg_info:
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "/private/var/folders/bx/k4yrl_bd3nb0v8pz7fm60t8r0000gp/T/pip-build-58rsg5li/urllib/setup.py", line 191
s.connect((base64.b64decode(rip), 017620))
                                  ^
SyntaxError: invalid token
 ----------------------------------------
Command "python setup.py egg_info" failed with error code 1 in /private/var/folders/bx/k4yrl_bd3nb0v8pz7fm60t8r0000gp/T/pip-build-58rsg5li/urllib/
CondaValueError: Value error: pip returned an error.

Es ist nicht vollständig enthalten, aber ich versuche es zu aktivieren. Wenn die Quelle Py3 Gorilla aktiviert, fällt die Muschel. Wenn Sie pyenv verwenden, müssen Sie den Befehl conda enable mit dem vollständigen Pfad angeben. Hinweise zur Verwendung von Conda-Qiita Aufbau einer Python-Umgebung für diejenigen, die Datenwissenschaftler werden möchten 2016 - Qiita

$ conda info -e
# conda environments:
#
Py3Gorilla               /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/Py3Gorilla
root                  *  /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0

$ source /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/Py3Gorilla/activate Py3Gorilla

Ich habe versucht, das Jupyter NoteBook zu überprüfen, aber es heißt, dass der Py3 Gorilla-Kernel nicht gefunden werden kann.

$ anaconda download biggorilla/hi_gorilla
$ jupyter notebook hi_gorilla.ipynb
---------------------------------------------------------------------------
ImportError                               Traceback (most recent call last)
<ipython-input-1-770f0b5370fe> in <module>()
----> 1 import py_stringmatching as sm
      2
      3 # This notebook imports a package that most users do not have installed
      4 # before using BigGorilla. Running the notebook successfully implies the
      5 # successful installation of BigGorilla.

ImportError: No module named 'py_stringmatching'

Sobald conda env create erstellt wurde, wird das Präfix registriert. Verwenden Sie zum Entfernen conda env remove -n.

$ conda env create biggorilla/py3gorilla
Using Anaconda API: https://api.anaconda.org
CondaValueError: Value error: prefix already exists: /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/Py3Gorilla

$ conda env remove -n Py3Gorilla

Package plan for package removal in environment /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/Py3Gorilla:

The following packages will be REMOVED:

openssl:    1.0.2l-0
pip:        9.0.1-py36_1
python:     3.6.1-2
readline:   6.2-2
setuptools: 27.2.0-py36_0
sqlite:     3.13.0-0
tk:         8.5.18-0
wheel:      0.29.0-py36_0
xz:         5.2.2-1
zlib:       1.2.8-3

Proceed ([y]/n)? y

Unlinking packages ...
[      COMPLETE      ]|###############################################################################| 100%

~~ Als ich es am 12. Juli 2017 ausprobiert habe, habe ich bei dieser Methode den folgenden Fehler erhalten und nicht eingegeben. (Vielleicht ist der im Juni aktualisierte Dateiname falsch, ich habe das Gefühl, dass das ältere yml angewendet wird. Wahrscheinlich wird es von nun an durch das Update behoben) ~~

Nachtrag: Die Datei wurde aktualisiert und enthält nun die offizielle Dokumentation.

$ conda env create biggorilla/py3gorilla
Collecting urllib==1.21.1
Downloading urllib-1.21.1.tar.gz (226kB)
100% |████████████████████████████████| 235kB 640kB/s
Complete output from command python setup.py egg_info:
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "/private/var/folders/bx/k4yrl_bd3nb0v8pz7fm60t8r0000gp/T/pip-build-58rsg5li/urllib/setup.py", line 191
s.connect((base64.b64decode(rip), 017620))
                                  ^
SyntaxError: invalid token
 ----------------------------------------
Command "python setup.py egg_info" failed with error code 1 in /private/var/folders/bx/k4yrl_bd3nb0v8pz7fm60t8r0000gp/T/pip-build-58rsg5li/urllib/
CondaValueError: Value error: pip returned an error.

Sie können es installieren, indem Sie yml von Files :: Anaconda Cloud herunterladen und die Zeile löschen, in der urllib angegeben ist. Das neuere yml kann enthalten sein, aber die Flexmatcher-Version ist alt (entfettet?)

#Löschen Sie die Umgebung, die sich einmal auf halber Strecke befand
$ conda env remove -n Py3Gorilla

#Erstellen Sie die Umgebung neu, indem Sie die lokal geänderte yml-Datei angeben
$ vim ~/Downloads/Py3Gorilla.yml //Löschen Sie die urllib-Zeile
$ conda env create --name test --file ~/Downloads/Py3Gorilla.yml

#Wenn Sie pyenv verwenden, müssen Sie den Befehl conda enable mit dem vollständigen Pfad angeben. Wenn die Quelle Py3 Gorilla aktiviert, fällt die Muschel.
$ source /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/test/bin/activate test

#Legen Sie das Notebook zur Funktionsprüfung ab und starten Sie es
$ anaconda download biggorilla/hi_gorilla
$ jupyter notebook hi_gorilla.ipynb

Probieren Sie das FlexMatcher-Beispiel aus

Als nächstes habe ich das Flexmatcher-Beispiel ausprobiert.

Beispielcode ist beigefügt. Kopieren Sie also die Quelle und fügen Sie sie in das Jupyter-Notizbuch ein.

Als Ergebnis des Versuchs stellte ich fest, dass es aufgrund eines Fehlers nicht funktionierte.

Ausführungsergebnis

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-5-34cd037abc3a> in <module>()
     27 mapping_list = [data1_mapping, data2_mapping]
     28 fm.create_training_data(schema_list, mapping_list)
---> 29 fm.train()
     30 
     31 # Creating a test schmea

/Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/test/lib/python3.5/site-packages/flexmatcher/flexmatcher.py in train(self)
     27     The class considers panda dataframes as databases and their column names as
     28     the schema. FlexMatcher learn to do schema matching by training on
---> 29     instances of dataframes and how their columns are matched against the
     30     mediated schema.
     31 

/Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/test/lib/python3.5/site-packages/flexmatcher/flexmatcher.py in <listcomp>(.0)
     27     The class considers panda dataframes as databases and their column names as
     28     the schema. FlexMatcher learn to do schema matching by training on
---> 29     instances of dataframes and how their columns are matched against the
     30     mediated schema.
     31 

/Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/test/lib/python3.5/site-packages/flexmatcher/classify.py in predict_training(self, folds)

TypeError: 'float' object cannot be interpreted as an integer

Recommended Posts

BigGorilla Umwelt Bau Memo
ConoHa Umweltbau Memo
Anaconda Umwelt Bau Memo
Django Entwicklungsumgebung Bau Memo
[Memo] Bau einer Cygwin-Umgebung
Anaconda3 × Pycharm-Umgebungskonstruktionsnotiz
[MEMO] [Entwicklung der Entwicklungsumgebung] Python
[MEMO] [Entwicklungsumgebung Bau] Wein
Python-Umgebungskonstruktionsnotiz unter Windows 10
Bauarbeiten für StarCluster-Umgebungsnotizen
[MEMO] [Aufbau der Entwicklungsumgebung] Jupyter Notebook
Konstruktionsnotiz für die Emacs Python-Entwicklungsumgebung
Konstruktionsnotiz für die Ubuntu Desktop 20.04-Entwicklungsumgebung
DeepIE3D-Umgebungskonstruktion
Emacs-basierte Umgebungskonstruktion
Aufbau einer Linux-Umgebung
Umgebungskonstruktion (Python)
Django Umweltbau
CodeIgniter-Umgebungskonstruktion
Python-Umgebungskonstruktion
Python - Umgebungskonstruktion
Aufbau einer Python-Umgebung
Golang Umweltbau
Umgebungskonstruktion von word2vec
Konstruktionsnotiz für die Mac OS X-Entwicklungsumgebung
Ein Memo mit RADEX-Umgebungskonstruktion
Umgebungskonstruktion: GCP + Docker
Bau der Django-Projektumgebung
PyData-bezogene Umgebungskonstruktion
Aufbau einer Python-Entwicklungsumgebung
python2.7 Konstruktion der Entwicklungsumgebung
Griffumgebungskonstruktion onCentOS6.5
Golang Umweltbau [goenv]
Pyxel-Umgebungskonstruktion (Mac)
[Memo] Django-Entwicklungsumgebung
Python-Umgebungskonstruktion @ Win7
[Ubuntu 18.04] Aufbau einer Tensorflow 2.0.0-GPU-Umgebung
Python + Anaconda + Pycharm-Umgebungskonstruktion
Informationen zum Aufbau einer Linux-Umgebung (CentOS)
Aufbau einer PyTorch C ++ (LibTorch) -Umgebung
Anaconda-Umgebungskonstruktion auf CentOS7
Erste LAMP-Umgebungskonstruktion (Linux)
Aufbau einer Python-Umgebung (Windows 10 + Emacs)
CI-Umgebungskonstruktion ~ Python Edition ~
Aufbau einer Python-Umgebung für Mac
Konstruktionsverfahren für die Anaconda3-Python-Umgebung
Docker + Django + Umgebungskonstruktion reagieren
Python-Umgebungskonstruktion und TensorFlow
Umgebungskonstruktion von NumPy und Matplotlib
Erstellen einer Python-Umgebung unter Windows 7
Ubuntu18.04 Memo zur Erstellung der Entwicklungsumgebung
Aufbau der Ubuntu14.04 + GPU + TensorFlow-Umgebung