Wir stellen einen Fall vor, in dem ich vom Index in der ersten Spalte abhängig war, als ich versuchte, die vom internen System heruntergeladenen Daten mit Pandas zu verarbeiten
Problemdaten (natürlich nicht die tatsächlichen Daten)
name,population,area
Osaka,2691k,223,
Nara,353k,276,
Kyoto,1472k,827,
Koube,1542k,552,
Wakayama,355k,208,
Wenn Sie die folgenden Daten lesen, die auf den ersten Blick kein Problem zu haben scheinen, ist die erste Spalte (Name) der Index.
Die Ursache ist, dass am Ende jedes Datensatzes ein "," steht, am Ende der Kopfzeile jedoch kein ",". Wenn Sie versuchen, "," am Ende der Kopfzeile zu setzen. Wie unten gezeigt, wird eine zusätzliche Spalte hinzugefügt, aber der Index wird automatisch berechnet.
Dieses Beispiel ist zum besseren Verständnis in einer CSV-Datei zusammengefasst. Es hat jedoch zusätzliche Zeit in Anspruch genommen, da tsv (tabulatorgetrennt) tatsächlich in der Arbeit verstopft war.
Lassen Sie uns die Daten richtig sehen, ohne im Werkzeug zu ertrinken.
Trotzdem habe ich das Gefühl, dass die Chancen, Excel zu verwenden, abgenommen haben, seit ich Daten mit Pandas leicht bearbeiten konnte. Die Daten waren diesmal auch eine tsv-Datei von ungefähr 50 Millionen, aber sie konnten in wenigen Sekunden gelesen werden. (Excel hat gehangen ...)