Sammeln von Informationen von Twitter mit Python (Umgebungskonstruktion)

System, um diese Zeit zu machen

7b140c972221df05d34479ef3cdd851e.png

Crawlen Sie Informationen von Twitter, formatieren Sie die Informationen und erstellen Sie ein System, um sie in der Datenbank zu speichern. Erstellen Sie vorerst eine Testumgebung in der virtuellen Umgebung, indem Sie Vagrant als Experiment verwenden.

Erstellen einer Umgebung um eine virtuelle Maschine

VirtualBox installieren

Installieren Sie die neueste Version von https://www.virtualbox.org/wiki/Downloads.

Erstellen Sie eine virtuelle Umgebung aus Vagrant.

Installieren Sie Vagrant

Laden Sie die neueste Version von http://www.vagrantup.com/downloads herunter und installieren Sie sie.

Erstellen Sie eine virtuelle Maschine

Erstellen Sie mit Vagrant eine virtuelle Umgebung.

$ mkdir -p ~/vagrant/debian7_twitter
$ vagrant box add debian7.6_twitter https://github.com/jose-lpa/packer-debian_7.6.0/releases/download/1.0/packer_virtualbox-iso_virtualbox.box
$ vagrant init debian7.6_twitter
$ vagrant up
$ vagrant ssh

Sie können sich jetzt bei der virtuellen Umgebung anmelden.

Wenn Sie nach dem Abmelden beenden möchten

$ vagrant halt

Sie können mit enden. Danach unter dem Verzeichnis, in dem die virtuelle Umgebung erstellt wurde, Sie können sich jederzeit mit vagrant up-> vagrant ssh in diese Umgebung einloggen.

Einstellungen rund um Python

Python Python 2.7.3 ist standardmäßig installiert, verwenden Sie es also.

$ Python -V
Python 2.7.3

virtualenv Verwenden Sie virtualenv, um die verwendeten Module projektweise zu verwalten.

Installation

Verwenden Sie apt.

$ sudo apt-get update
$ sudo apt-get install python-dev python-virtualenv

Python-Umgebung mit virtualenv wechseln

Wechseln Sie in ein beliebiges Arbeitsverzeichnis und führen Sie den folgenden Befehl aus.

$ virtualenv twi-py

Dadurch wird ein Twi-Py-Verzeichnis im aktuellen Verzeichnis erstellt, und hier wird eine unabhängige Python-Umgebung erstellt. Wechseln Sie in das erstellte Verzeichnis und führen Sie den folgenden Befehl aus.

$ source bin/activate

Wenn am Anfang der Shell-Eingabeaufforderung (twi-py) ... hinzugefügt wird, wurde die Umgebung auf twi-py umgestellt.

Führen Sie den folgenden Befehl aus, um die spezifische Modulumgebung zu verlassen und zum Standard zurückzukehren.

$ deactivate 

Installieren Sie danach MeCab-bezogene Module in dieser "Twi-Py" -Umgebung.

Einstellungen rund um MeCab

Installation des MeCab-Hauptgeräts

Verwenden Sie apt.

$ sudo apt-get update
$ sudo apt-get -y install mecab
$ sudo apt-get -y install mecab-ipadic-utf8
$ sudo update-alternatives --config mecab-dictionary # ipadic-Überprüfen Sie, ob es utf8 ist

Installieren Sie die Python-Bindung von MeCab (mecab-python).

Installation der benötigten Bibliotheken mit apt.

$ sudo apt-get -y install python-dev
$ sudo apt-get -y install libmecab-dev
$ sudo apt-get -y install build-essential
$ sudo apt-get -y install g++

Installieren Sie die Version von Python-Bindungen für Debian 7 wheezy in der "Twi-Py" -Umgebung.

(twi-py)$ pip install https://mecab.googlecode.com/files/mecab-python-0.99.tar.gz

Überprüfen der Funktion von MeCab und Python

Lassen Sie uns die Morphologie von "aus den Oberschenkeln und Oberschenkeln" analysieren.

$ Python
>>> import MeCab
>>> mecab = MeCab.Tagger("-Ochasen")
>>> print mecab.parse("Von den Oberschenkeln und Oberschenkeln")
Sumomo Sumomo Nomen-Allgemeines
Sowohl mo als auch mo-Hilfe
Oberschenkel Pfirsich Nomenklatur-Allgemeines
Sowohl mo als auch mo-Hilfe
Oberschenkel Pfirsich Nomenklatur-Allgemeines
Nonos Assistent-Union
Uchi Uchi Nomen-Nicht unabhängig-Anwalt möglich
EOS

>>>

Ich konnte es richtig analysieren.

Jetzt haben wir alle Werkzeuge, um das System zu realisieren, das wir dieses Mal herstellen werden.

MySQL-Einstellungen

Installation

Installiert mit apt.

MySQL-Einstellungen

Installation

Installiert mit apt.

$ sudo apt-get -y install libmysqlclient-dev
$ sudo apt-get -y install mysql-server-5.5

Während der Installation werden Sie aufgefordert, ein Root-Passwort festzulegen. Geben Sie also "vagrant" ein.

Funktionsprüfung

Melden Sie sich als Root an.

$ mysql -u root -pvagrant
mysql> SELECT user,host,password FROM mysql.user; 
+------------------+----------------------------------+-------------------------------------------+
| user             | host                             | password                                  |
+------------------+----------------------------------+-------------------------------------------+
| root             | localhost                        | *04E6E1273D1783DF7D57DC5479FE01CFFDFD0058 |
| root             | packer-virtualbox-iso-1411922062 | *04E6E1273D1783DF7D57DC5479FE01CFFDFD0058 |
| root             | 127.0.0.1                        | *04E6E1273D1783DF7D57DC5479FE01CFFDFD0058 |
| root             | ::1                              | *04E6E1273D1783DF7D57DC5479FE01CFFDFD0058 |
| debian-sys-maint | localhost                        | *A5B3FEE41C7F1F2C147B4876D39D6A4F65E79B7D |
+------------------+----------------------------------+-------------------------------------------+

Es hat sicher funktioniert.

Installieren Sie Python-Module, um auf MySQL zuzugreifen

Installiert unter der "Twi-Py" -Umgebung.

(twi-py)$ pip install MySQL-python

Funktionsprüfung

$ python
>>> import MySQLdb

Wenn dies kein Fehler ist, ist es OK.

Schließlich

Jetzt haben Sie alle Werkzeuge, die Sie brauchen. Von nun an erstellen wir den Crawl-Teil, den Information Moulding-Teil, den Store-Teil in der Datenbank usw. Diese Artikel werden später kommen.

Recommended Posts

Sammeln von Informationen von Twitter mit Python (Umgebungskonstruktion)
Sammeln von Informationen von Twitter mit Python (Twitter API)
Sammeln von Informationen von Twitter mit Python (morphologische Analyse mit MeCab)
Sammeln von Informationen von Twitter mit Python (Integration von MySQL und Python)
Von der Python-Umgebungskonstruktion zur virtuellen Umgebungskonstruktion mit Anaconda
Beginnen Sie mit Python! ~ ① Umweltbau ~
Python3-Umgebungskonstruktion mit pyenv-virtualenv (CentOS 7.3)
pytorch @ python3.8 Umgebungskonstruktion mit pipenv
OpenJTalk unter Windows 10 (Sprechen Sie Japanisch mit Python aus der Umgebungskonstruktion)
Umgebungskonstruktion (Python)
Python-Umgebungskonstruktion
Python - Umgebungskonstruktion
Aufbau einer Python-Umgebung
Tweet von Python mit Twitter Developer + Tweepy
Kommen wir zu Python # 0 (Umgebungskonstruktion)
Tweets mit Python sammeln
Aufbau einer explosiven Python-Umgebung ab Null (Mac)
Homebrew Python Umgebung Konstruktion
Aufbau einer Python-Entwicklungsumgebung
Poetry-Virtualenv-Umgebungskonstruktion mit Centos-Sclo-Rh-Python ~ Hinweise
Python-Umgebung mit Docker-Compose
python2.7 Konstruktion der Entwicklungsumgebung
Erste Python ① Umgebungskonstruktion mit Pythonbrew & Hello World !!
Virtuelle Umgebung mit Python 3.6
Python-Umgebungskonstruktion @ Win7
Aufbau einer virtuellen Umgebung mit Docker + Flask (Python) + Jupyter-Notebook
[Python] OpenCV-Umgebungskonstruktion mit Docker (cv2.imshow () funktioniert auch)
Von Kafka bis KSQL - Einfache Umgebungskonstruktion mit Docker
Aufbau einer Datenanalyseumgebung mit Python (IPython Notebook + Pandas)
Webanwendung erstellt mit Python3.4 + Django (Teil.1 Umgebungskonstruktion)
Aufbau der Python-Entwicklungsumgebung 2020 [Von der Python-Installation bis zur Einführung in die Poesie]
Umgebungskonstruktion mit anyenv + pyenv (nur von pyenv migrieren (Mac))
Aufbau einer QGIS3 Python-Plug-In-Entwicklungsumgebung mit VSCode (macOS)
Verfahren zum Konvertieren einer Python-Datei in eine Exe aus der Ubunts-Umgebungskonstruktion
[Grundlagen der Datenwissenschaft] Sammeln von Daten aus RSS mit Python
Installieren Sie die Python-Umgebung mit Anaconda
Twitter-Grafiknotiz mit Python
Holen Sie sich Twitter-Timeline mit Python
Verwalten Sie die Python-Umgebung mit virtualenv
Verwenden Sie die Twitter-API mit Python
Informationen von tweet_id (Python)
Aufbau einer Python-Umgebung (Windows 10 + Emacs)
CI-Umgebungskonstruktion ~ Python Edition ~
Erstellen Sie eine Python3-Umgebung mit Ubuntu 16.04
Aufbau einer Python-Umgebung für Mac
Konstruktionsverfahren für die Anaconda3-Python-Umgebung
Bereiten Sie die Python3-Umgebung mit Docker vor
Erstellen Sie mit direnv eine Python-Umgebung
Python3-Umgebungskonstruktion (für Anfänger)
Python-Umgebungskonstruktion und TensorFlow
Erstellen einer Python-Umgebung unter Windows 7
[MEMO] [Entwicklung der Entwicklungsumgebung] Python
Suche nach Twitter-Tweets mit Python
Umgebungskonstruktion von Python2 & 3 (OSX)
Mit Skype benachrichtigen Sie mit Skype von Python!
Holen Sie sich Alembic-Informationen mit Python