[PYTHON] Missverständnisse und Interpretationen von Luigis Abhängigkeiten

Ich habe das Luigi-Framework missverstanden und so viel gelitten, dass einige Leute unter den gleichen Problemen leiden können, also werde ich es aufschreiben.

Was ist Abhängigkeit?

Missverständnis

Tatsächlich

Was ist der Erfolg oder Misserfolg einer Aufgabe in einer Abhängigkeit?

Aufgabenerfolg

Dateiausgabe an das durch output angegebene Ziel

Aufgabenfehler

Ausnahmevorkommen in der Aufgabe

Das Problem dieses Missverständnisses

Betrachten Sie beispielsweise den folgenden Fall. Der Vorgang des Lesens einer Liste mit etwa 1000 Zeilen URLs in der Liste, die von "Eingabe" erstellt wurde, und des Entnehmens von Dateien von dieser URL. Ich denke, es ist ein üblicher Prozess, aber hier gibt es eine Falle. Ich möchte keine serielle Verarbeitung durchführen, um 1000 Dateien herunterzuladen, und ich möchte der Aufgabe Parameter geben, die auf den von input gesammelten Daten basieren, also [Dynamische Abhängigkeit](http: //: Ich denke, es wird als luigi.readthedocs.io/en/stable/tasks.html#dynamic-dependencies geschrieben. Wenn auch nur eine der 1000 erstellten Aufgaben fehlschlägt, wird die nachfolgende Verarbeitung nicht ausgeführt. Es ist jedoch häufig möglich, dass eine oder zwei Aufgaben aufgrund einer Fehlfunktion des WEB-Servers oder eines Fehlers in der URL-Beschreibung fehlschlagen. Dies ist ein Problem, wenn die nachfolgende Verarbeitung aufgrund dessen gestoppt wird. .. In diesem Fall ist die Schlussfolgerung, dass die nachfolgende Verarbeitungsaufgabe und die Aufgabe, die die Aufgabe generiert, nicht voneinander abhängig sein sollten und die Verarbeitung außerhalb von luigi geschrieben werden sollte.

Recommended Posts

Missverständnisse und Interpretationen von Luigis Abhängigkeiten
Mechanismus von Pyenv und Virtualenv
Vor- und Nachbearbeitung von Pytest
Kombination von rekursiv und Generator
Kombination von anyenv und direnv
Erklärung und Implementierung von SocialFoceModel
Differenzierung der Sortierung und Verallgemeinerung der Sortierung
Koexistenz von Pyenv und Autojump
Verwendung und Integration von "Shodan"
Das Problem der Lügner und der Ehrlichkeit
Auftreten und Auflösung von tensorflow.python.framework.errors_impl.FailedPreconditionError
Vergleich von Apex und Lamvery
Quellinstallation und Installation von Python
Einführung und Tipps von mlflow.Tracking