[PYTHON] Deep Learning Specialization (Coursera) Selbststudienprotokoll (C3W2)
Einführung
Dies ist der Inhalt von Kurs 3, Woche 2 (C3W2) von Deep Learning Specialization.
(C3W2L01) Carry Out Error Analysis
Inhalt
Image |
Dogs |
Great cat |
Blurry |
... |
Comments |
1 |
x |
|
|
|
|
2 |
|
x |
|
|
|
3 |
|
x |
x |
|
|
... |
|
|
|
|
|
% of total |
8% |
48% |
61% |
... |
|
(C3W2L02) Cleaning up Incorrectly labeled data
Inhalt
--Wenn der Trainingssatz falsch beschriftet ist
- DL algorithm are quite robust to random errors in the training set
- Ein systematischer Fehler hat Auswirkungen (z. B. wenn alle weißen Hunde als "Katzen" gekennzeichnet sind).
--Für Dev / Test Set eine Fehleranalyse durchführen. Wenn die Auswirkungen groß sind, korrigieren Sie sie.
Image |
Dogs |
Great cat |
Blurry |
... |
Incorrectly labeled |
Comments |
1 |
x |
|
|
|
|
|
2 |
|
x |
|
|
x |
|
3 |
|
x |
x |
|
|
|
... |
|
|
|
|
|
|
% of total |
8% |
48% |
61% |
... |
5% |
|
- Correcting incorrect dev/test set example
- Wenden Sie denselben Prozess auf Ihren Entwickler und Ihr Test-Set an, um sicherzustellen, dass sie weiterhin von derselben Distribution stammen (Dev-Set und Test-Set sind dieselbe Distribution).
- Überlegen Sie, ob Beispiele für Ihren Algorithmus richtig oder falsch sind (Überprüfen Sie nicht nur die Daten, bei denen der Algorithmus einen Fehler gemacht hat, sondern auch die Daten, die richtig beurteilt wurden).
- Zug- und Entwicklungs- / Testdaten können jetzt aus einer geringfügig unterschiedlichen Verteilung stammen (Die Verteilung der Zug- und Entwicklungs- / Testdaten kann geringfügig unterschiedlich sein).
(C3W2L03) Build First System Quickly, Then Iterate
Inhalt
- Set up dev/test set and metrics
- Build initial system quickly
- Use Bias/Variance analysis & error analysis to prioritize next step
――Es ist leicht, von Anfang an zu viel nachzudenken und ein kompliziertes System zu erstellen.
Kommentar
- Schwarz nach 5 Minuten und 30 Sekunden
(C3W2L04) Training and testing on different distribution
Inhalt
- Ich möchte einen Algorithmus zum Klassifizieren von Bildern in Mobile App entwickeln
――Aber die gesammelten Daten betragen 200 KB für das Bild (hohes Pixel) von der Webseite und 10.000 für die Daten der mobilen App. Was tun zu diesem Zeitpunkt mit Zug- / Entwicklungs- / Testdaten?
--Option 1; Fügen Sie beide hinzu, um 210.000 Daten zu erstellen, mischen und mischen
- trainin set ; 205k
- dev set ; 2.5k
- test set ; 2.5k
--Vorteile, gleiche Verteilung
- Nachteile; Dev / Test-Set besteht hauptsächlich aus Webseitendaten, nicht aus vielen mobilen App-Daten
- Option 2
- train set ; web page 200k + mobile app 5k
- dev set ; mobile app 2.5k
- test set ; mobile app 2.5k
--Vorteile: Die Verteilung des Entwicklungs- / Testsatzes entspricht dem Ziel des Algorithmus (Bildklassifizierung der mobilen App).
- Nachteile; Die Verteilung der Zugsets ist unterschiedlich
- Option 1 ist besser als Option 1
(C3W2L05) Bias and Variance with mismatched data distribution
Inhalt
Referenz