Aufbau einer Big Gorilla-Umgebung Probieren Sie das FlexMatcher-Beispiel aus
――Es ist ein neuer Standard, Pyenv nur zu verwenden, um Anakonda zu setzen und die Umwelt mit Conda zu verwalten. ―― ~~ (Stand: 12. Juli 2017) Der Bau der Umwelt läuft nicht gut ~~
Lesen Sie den Flexmatcher-Code
Mac OS X 10.11 El Capitan Homebrew ist bereits installiert Installieren Sie Anaconda mit Pyenv
Pyenv war alt, also Update Aktualisieren Sie die von pyenv --Qiita verwaltete Python-Version
Installieren Sie Anaconda
$ pyenv install anaconda3-4.2.0
$ pyenv global anaconda3-4.2.0
Eine Umgebung für Big Gorilla schaffen. .. ~~ Ich kann nicht. ~~ 21.07.2017 Nachtrag: Es wurde möglich. Unter dem alten Rekord
$ conda env create biggorilla/py3gorilla
Collecting urllib==1.21.1
Downloading urllib-1.21.1.tar.gz (226kB)
100% |████████████████████████████████| 235kB 640kB/s
Complete output from command python setup.py egg_info:
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "/private/var/folders/bx/k4yrl_bd3nb0v8pz7fm60t8r0000gp/T/pip-build-58rsg5li/urllib/setup.py", line 191
s.connect((base64.b64decode(rip), 017620))
^
SyntaxError: invalid token
----------------------------------------
Command "python setup.py egg_info" failed with error code 1 in /private/var/folders/bx/k4yrl_bd3nb0v8pz7fm60t8r0000gp/T/pip-build-58rsg5li/urllib/
CondaValueError: Value error: pip returned an error.
Es ist nicht vollständig enthalten, aber ich versuche es zu aktivieren. Wenn die Quelle Py3 Gorilla aktiviert, fällt die Muschel. Wenn Sie pyenv verwenden, müssen Sie den Befehl conda enable mit dem vollständigen Pfad angeben. Hinweise zur Verwendung von Conda-Qiita Aufbau einer Python-Umgebung für diejenigen, die Datenwissenschaftler werden möchten 2016 - Qiita
$ conda info -e
# conda environments:
#
Py3Gorilla /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/Py3Gorilla
root * /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0
$ source /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/Py3Gorilla/activate Py3Gorilla
Ich habe versucht, das Jupyter NoteBook zu überprüfen, aber es heißt, dass der Py3 Gorilla-Kernel nicht gefunden werden kann.
$ anaconda download biggorilla/hi_gorilla
$ jupyter notebook hi_gorilla.ipynb
---------------------------------------------------------------------------
ImportError Traceback (most recent call last)
<ipython-input-1-770f0b5370fe> in <module>()
----> 1 import py_stringmatching as sm
2
3 # This notebook imports a package that most users do not have installed
4 # before using BigGorilla. Running the notebook successfully implies the
5 # successful installation of BigGorilla.
ImportError: No module named 'py_stringmatching'
Sobald conda env create erstellt wurde, wird das Präfix registriert. Verwenden Sie zum Entfernen conda env remove -n.
$ conda env create biggorilla/py3gorilla
Using Anaconda API: https://api.anaconda.org
CondaValueError: Value error: prefix already exists: /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/Py3Gorilla
$ conda env remove -n Py3Gorilla
Package plan for package removal in environment /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/Py3Gorilla:
The following packages will be REMOVED:
openssl: 1.0.2l-0
pip: 9.0.1-py36_1
python: 3.6.1-2
readline: 6.2-2
setuptools: 27.2.0-py36_0
sqlite: 3.13.0-0
tk: 8.5.18-0
wheel: 0.29.0-py36_0
xz: 5.2.2-1
zlib: 1.2.8-3
Proceed ([y]/n)? y
Unlinking packages ...
[ COMPLETE ]|###############################################################################| 100%
~~ Als ich es am 12. Juli 2017 ausprobiert habe, habe ich bei dieser Methode den folgenden Fehler erhalten und nicht eingegeben. (Vielleicht ist der im Juni aktualisierte Dateiname falsch, ich habe das Gefühl, dass das ältere yml angewendet wird. Wahrscheinlich wird es von nun an durch das Update behoben) ~~
Nachtrag: Die Datei wurde aktualisiert und enthält nun die offizielle Dokumentation.
$ conda env create biggorilla/py3gorilla
Collecting urllib==1.21.1
Downloading urllib-1.21.1.tar.gz (226kB)
100% |████████████████████████████████| 235kB 640kB/s
Complete output from command python setup.py egg_info:
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "/private/var/folders/bx/k4yrl_bd3nb0v8pz7fm60t8r0000gp/T/pip-build-58rsg5li/urllib/setup.py", line 191
s.connect((base64.b64decode(rip), 017620))
^
SyntaxError: invalid token
----------------------------------------
Command "python setup.py egg_info" failed with error code 1 in /private/var/folders/bx/k4yrl_bd3nb0v8pz7fm60t8r0000gp/T/pip-build-58rsg5li/urllib/
CondaValueError: Value error: pip returned an error.
Sie können es installieren, indem Sie yml von Files :: Anaconda Cloud herunterladen und die Zeile löschen, in der urllib angegeben ist. Das neuere yml kann enthalten sein, aber die Flexmatcher-Version ist alt (entfettet?)
#Löschen Sie die Umgebung, die sich einmal auf halber Strecke befand
$ conda env remove -n Py3Gorilla
#Erstellen Sie die Umgebung neu, indem Sie die lokal geänderte yml-Datei angeben
$ vim ~/Downloads/Py3Gorilla.yml //Löschen Sie die urllib-Zeile
$ conda env create --name test --file ~/Downloads/Py3Gorilla.yml
#Wenn Sie pyenv verwenden, müssen Sie den Befehl conda enable mit dem vollständigen Pfad angeben. Wenn die Quelle Py3 Gorilla aktiviert, fällt die Muschel.
$ source /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/test/bin/activate test
#Legen Sie das Notebook zur Funktionsprüfung ab und starten Sie es
$ anaconda download biggorilla/hi_gorilla
$ jupyter notebook hi_gorilla.ipynb
Als nächstes habe ich das Flexmatcher-Beispiel ausprobiert.
Beispielcode ist beigefügt. Kopieren Sie also die Quelle und fügen Sie sie in das Jupyter-Notizbuch ein.
Als Ergebnis des Versuchs stellte ich fest, dass es aufgrund eines Fehlers nicht funktionierte.
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-5-34cd037abc3a> in <module>()
27 mapping_list = [data1_mapping, data2_mapping]
28 fm.create_training_data(schema_list, mapping_list)
---> 29 fm.train()
30
31 # Creating a test schmea
/Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/test/lib/python3.5/site-packages/flexmatcher/flexmatcher.py in train(self)
27 The class considers panda dataframes as databases and their column names as
28 the schema. FlexMatcher learn to do schema matching by training on
---> 29 instances of dataframes and how their columns are matched against the
30 mediated schema.
31
/Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/test/lib/python3.5/site-packages/flexmatcher/flexmatcher.py in <listcomp>(.0)
27 The class considers panda dataframes as databases and their column names as
28 the schema. FlexMatcher learn to do schema matching by training on
---> 29 instances of dataframes and how their columns are matched against the
30 mediated schema.
31
/Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/test/lib/python3.5/site-packages/flexmatcher/classify.py in predict_training(self, folds)
TypeError: 'float' object cannot be interpreted as an integer
Recommended Posts