Was ich getan habe

Aufbau einer Big Gorilla-Umgebung Probieren Sie das FlexMatcher-Beispiel aus

Was ich fand

――Es ist ein neuer Standard, Pyenv nur zu verwenden, um Anakonda zu setzen und die Umwelt mit Conda zu verwalten. ―― ~~ (Stand: 12. Juli 2017) Der Bau der Umwelt läuft nicht gut ~~

~~ Die Abhängigkeit der ursprünglich veröffentlichten Conda-Umgebung ist unterbrochen ~~
Sie können yml lokal von ~~ Anaconda Cloud herunterladen, die Zeile mit der Angabe von urllib löschen und durch Angabe der Datei installieren. .. ~~ --Zusatz: Die Datei wurde aktualisiert, damit sie gemäß dem offiziellen Dokument eingegeben werden kann.
Das FlexMatcher-Beispiel hat auch nicht funktioniert ――Es scheint schwierig zu sein, sich zu bewegen, ohne den Code zu lesen

Was macht man als nächstes

Lesen Sie den Flexmatcher-Code

Umgebung

Mac OS X 10.11 El Capitan Homebrew ist bereits installiert Installieren Sie Anaconda mit Pyenv

Aufbau einer BigGorilla-Umgebung (Die folgenden Informationen sind alt. Sie werden als Arbeitsprotokoll aufbewahrt.)

Pyenv war alt, also Update Aktualisieren Sie die von pyenv --Qiita verwaltete Python-Version

Installieren Sie Anaconda

$ pyenv　install　anaconda3-4.2.0
$ pyenv　global　anaconda3-4.2.0

Eine Umgebung für Big Gorilla schaffen. .. ~~ Ich kann nicht. ~~ 21.07.2017 Nachtrag: Es wurde möglich. Unter dem alten Rekord

$ conda env create biggorilla/py3gorilla
Collecting urllib==1.21.1
Downloading urllib-1.21.1.tar.gz (226kB)
100% |████████████████████████████████| 235kB 640kB/s
Complete output from command python setup.py egg_info:
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "/private/var/folders/bx/k4yrl_bd3nb0v8pz7fm60t8r0000gp/T/pip-build-58rsg5li/urllib/setup.py", line 191
s.connect((base64.b64decode(rip), 017620))
                                  ^
SyntaxError: invalid token
 ----------------------------------------
Command "python setup.py egg_info" failed with error code 1 in /private/var/folders/bx/k4yrl_bd3nb0v8pz7fm60t8r0000gp/T/pip-build-58rsg5li/urllib/
CondaValueError: Value error: pip returned an error.

Es ist nicht vollständig enthalten, aber ich versuche es zu aktivieren. Wenn die Quelle Py3 Gorilla aktiviert, fällt die Muschel. Wenn Sie pyenv verwenden, müssen Sie den Befehl conda enable mit dem vollständigen Pfad angeben. Hinweise zur Verwendung von Conda-Qiita Aufbau einer Python-Umgebung für diejenigen, die Datenwissenschaftler werden möchten 2016 - Qiita

$ conda info -e
# conda environments:
#
Py3Gorilla               /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/Py3Gorilla
root                  *  /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0

$ source /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/Py3Gorilla/activate Py3Gorilla

Ich habe versucht, das Jupyter NoteBook zu überprüfen, aber es heißt, dass der Py3 Gorilla-Kernel nicht gefunden werden kann.

$ anaconda download biggorilla/hi_gorilla
$ jupyter notebook hi_gorilla.ipynb

---------------------------------------------------------------------------
ImportError                               Traceback (most recent call last)
<ipython-input-1-770f0b5370fe> in <module>()
----> 1 import py_stringmatching as sm
      2
      3 # This notebook imports a package that most users do not have installed
      4 # before using BigGorilla. Running the notebook successfully implies the
      5 # successful installation of BigGorilla.

ImportError: No module named 'py_stringmatching'

Sobald conda env create erstellt wurde, wird das Präfix registriert. Verwenden Sie zum Entfernen conda env remove -n.

$ conda env create biggorilla/py3gorilla
Using Anaconda API: https://api.anaconda.org
CondaValueError: Value error: prefix already exists: /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/Py3Gorilla

$ conda env remove -n Py3Gorilla

Package plan for package removal in environment /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/Py3Gorilla:

The following packages will be REMOVED:

openssl:    1.0.2l-0
pip:        9.0.1-py36_1
python:     3.6.1-2
readline:   6.2-2
setuptools: 27.2.0-py36_0
sqlite:     3.13.0-0
tk:         8.5.18-0
wheel:      0.29.0-py36_0
xz:         5.2.2-1
zlib:       1.2.8-3

Proceed ([y]/n)? y

Unlinking packages ...
[      COMPLETE      ]|###############################################################################| 100%

~~ Als ich es am 12. Juli 2017 ausprobiert habe, habe ich bei dieser Methode den folgenden Fehler erhalten und nicht eingegeben. (Vielleicht ist der im Juni aktualisierte Dateiname falsch, ich habe das Gefühl, dass das ältere yml angewendet wird. Wahrscheinlich wird es von nun an durch das Update behoben) ~~

Nachtrag: Die Datei wurde aktualisiert und enthält nun die offizielle Dokumentation.

$ conda env create biggorilla/py3gorilla
Collecting urllib==1.21.1
Downloading urllib-1.21.1.tar.gz (226kB)
100% |████████████████████████████████| 235kB 640kB/s
Complete output from command python setup.py egg_info:
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "/private/var/folders/bx/k4yrl_bd3nb0v8pz7fm60t8r0000gp/T/pip-build-58rsg5li/urllib/setup.py", line 191
s.connect((base64.b64decode(rip), 017620))
                                  ^
SyntaxError: invalid token
 ----------------------------------------
Command "python setup.py egg_info" failed with error code 1 in /private/var/folders/bx/k4yrl_bd3nb0v8pz7fm60t8r0000gp/T/pip-build-58rsg5li/urllib/
CondaValueError: Value error: pip returned an error.

Sie können es installieren, indem Sie yml von Files :: Anaconda Cloud herunterladen und die Zeile löschen, in der urllib angegeben ist. Das neuere yml kann enthalten sein, aber die Flexmatcher-Version ist alt (entfettet?)

#Löschen Sie die Umgebung, die sich einmal auf halber Strecke befand
$ conda env remove -n Py3Gorilla

#Erstellen Sie die Umgebung neu, indem Sie die lokal geänderte yml-Datei angeben
$ vim ~/Downloads/Py3Gorilla.yml //Löschen Sie die urllib-Zeile
$ conda env create --name test --file ~/Downloads/Py3Gorilla.yml

#Wenn Sie pyenv verwenden, müssen Sie den Befehl conda enable mit dem vollständigen Pfad angeben. Wenn die Quelle Py3 Gorilla aktiviert, fällt die Muschel.
$ source /Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/test/bin/activate test

#Legen Sie das Notebook zur Funktionsprüfung ab und starten Sie es
$ anaconda download biggorilla/hi_gorilla
$ jupyter notebook hi_gorilla.ipynb

Probieren Sie das FlexMatcher-Beispiel aus

Als nächstes habe ich das Flexmatcher-Beispiel ausprobiert.

Beispielcode ist beigefügt. Kopieren Sie also die Quelle und fügen Sie sie in das Jupyter-Notizbuch ein.

Als Ergebnis des Versuchs stellte ich fest, dass es aufgrund eines Fehlers nicht funktionierte.

Ausführungsergebnis

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-5-34cd037abc3a> in <module>()
     27 mapping_list = [data1_mapping, data2_mapping]
     28 fm.create_training_data(schema_list, mapping_list)
---> 29 fm.train()
     30 
     31 # Creating a test schmea

/Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/test/lib/python3.5/site-packages/flexmatcher/flexmatcher.py in train(self)
     27     The class considers panda dataframes as databases and their column names as
     28     the schema. FlexMatcher learn to do schema matching by training on
---> 29     instances of dataframes and how their columns are matched against the
     30     mediated schema.
     31 

/Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/test/lib/python3.5/site-packages/flexmatcher/flexmatcher.py in <listcomp>(.0)
     27     The class considers panda dataframes as databases and their column names as
     28     the schema. FlexMatcher learn to do schema matching by training on
---> 29     instances of dataframes and how their columns are matched against the
     30     mediated schema.
     31 

/Users/kkanazaw/.pyenv/versions/anaconda3-4.2.0/envs/test/lib/python3.5/site-packages/flexmatcher/classify.py in predict_training(self, folds)

TypeError: 'float' object cannot be interpreted as an integer

[PYTHON] BigGorilla Umwelt Bau Memo