[PYTHON] Extrahieren Sie das Element, indem Sie das in der Zeichenfolge enthaltene Tag löschen

def remove_select_tags(string, start_tag, end_tag):
    start = string.find(start_tag)
    while start != -1:
        end = string.find(end_tag, start)
        string = string[:start] + " " + string[end + 1:]
        start = string.find(start_tag)
    return string.split()

def test_case():
    target_string = '''<h1>Title</h1><p>This is a
                        <a href="mt-takao.top">link</a>.<p>'''
    assert remove_select_tags(target_string, '<', '>') == ['Title', 'This', 'is', 'a', 'link', '.']
    target_string = "[test]a-I-U-E-O[test][next]Kakikukeko[next]"
    assert remove_select_tags(target_string, '[', ']') == ['a-I-U-E-O', 'Kakikukeko']
    print('test ok')
test_case()

Löscht das Element des angegebenen Zeichens in der Zeichenfolge und ruft das Element ab. Wird das Element nicht gefunden, wird -1 zurückgegeben, andernfalls wird es ausgeführt. Verbinden Sie das Teil vor dem gefundenen Index mit einem Leerzeichen und verbinden Sie es mit der Zeichenfolge nach dem am Ende gefundenen Index. Suchen Sie dann in der neu generierten Zeichenfolge nach weiteren start_tag. Trennen Sie zum Schluss die Leerzeichen durch Kommas.

Recommended Posts

Extrahieren Sie das Element, indem Sie das in der Zeichenfolge enthaltene Tag löschen
Holen Sie sich das letzte Element des Arrays, indem Sie Zeichenfolgen in Python und PHP aufteilen
Verschieben Sie die Alphabetzeichenfolge in Python um N Zeichen
Holen Sie sich die Abfragezeichenfolge (Abfragezeichenfolge) mit Django
Was ist in dem Parameter? String & Ausdruck bearbeiten
Lesen Sie die Datei Zeile für Zeile mit Python
Lesen Sie die Datei Zeile für Zeile mit Python
Ich kann das Element in Selen nicht bekommen!
Wellenförmige Klammern in der Formatzeichenfolge maskieren
Lesen aller in * .py enthaltenen Klassen in dem von Python angegebenen Verzeichnis
Teilt die Zeichenfolge durch die angegebene Anzahl von Zeichen. In Ruby und Python.
Extrahieren Sie nur den Dateinamen mit Ausnahme des Verzeichnisses im Verzeichnis
[Automatisierung] Extrahieren Sie die Tabelle als PDF mit Python
BeautifulSoup-Trick: Entscheiden Sie das Tag, indem Sie den Pfad angeben
Extrahieren Sie mit Pandas Zeilen, die eine bestimmte "Zeichenfolge" enthalten
Suchen Sie nach dem Wert der Instanz in der Liste
json.dumping Keine in Python gibt die Zeichenfolge null zurück
Teilen Sie Kamelfallzeichenfolgen in Python Wort für Wort
Extrahieren Sie den Statuscodefehler der Serie 400.500 des Apache-Zugriffsprotokolls, indem Sie den Zeitbereich angeben