Zu den Aufgaben, die diesmal an der Universität gestellt wurden, gehörten die Aufgaben als Vorbereitung.
① Erstellen Sie über das Internet eine Datenbank mit 1000 englischen Sätzen Stellen Sie sicher, dass Sie hier nicht den gleichen Satz haben.
Wie erwartet ist es schwierig, visuell zu beurteilen, ob es bei 1000 Sätzen doppelte Sätze gibt. Es handelt sich also um ein Programm, nachdem ich über das Schreiben mit Python nachgedacht habe, das ich kürzlich übe
check.py
# -*- coding: utf-8 -*-
import sys
str1 =""
try:
file_name = sys.argv[1]
except IndexError:
print('Usage: {0} TEXTFILE'.format(file_name))
sys.exit(1)
with open(file_name, 'r') as f:
#Duplikate verschwinden, indem sie zu einem kollektiven Typ gemacht werden (Reihenfolge ist nicht garantiert)
# .rstrip()Dadurch entfällt die Notwendigkeit, einen Zeilenumbruch in die letzte Zeile einzufügen
unique_texts = {line.rstrip() for line in f}
for i in unique_texts:
str1 += i+"\n"
with open(file_name + '.disticted.txt', 'w') as f:
f.writelines(str1)
Da dieses Programm einen Satz des Textes so vergleicht, wie er ist, wird er nicht gelöscht, wenn der letzte Satz dupliziert wird, es sei denn, nach dem letzten Satz wird ein Zeilenumbruch gemacht.
Ich habe die Bearbeitungsanforderung von Hatchinee geändert und erneut bearbeitet.
Recommended Posts