[LINUX] So extrahieren Sie die gewünschte Zeichenfolge aus einem Befehl in Zeile 4

Python Crawling & Scraping - Praktischer Entwicklungsleitfaden für die Datenerfassung und -analyse https://www.amazon.co.jp/dp/B01NGWKE0P/ref=dp-kindle-redirect?_encoding=UTF8&btkr=1

Aus dem Buch 1.4.1 Ermitteln Sie die Gesamtzahl der E-Books Was ich aus dem Kapitel gelernt habe

Operation zum Extrahieren nur der Zeichenfolge mit einem regulären Ausdruck aus dem von grep extrahierten HTML-Code Es werden vier Methoden vorgestellt

1.Extrahieren Sie den Teil, der dem regulären Ausdruck entspricht, mit dem Befehl sed
2.Entfernen Sie das übereinstimmende Teil mit dem Befehl sed und entfernen Sie das verbleibende Teil
3.Verwenden Sie den Befehl cut, um das n-te aus einer Zeichenfolge zu extrahieren, die durch ein bestimmtes Zeichen getrennt ist
4.Verwenden Sie den Befehl awk, um das n-te aus einer mit Leerzeichen versehenen Zeichenfolge zu extrahieren

Ich kenne den Befehl überhaupt nicht. .. .. Auf der vorherigen Seite gab es jedoch eine Erklärung für sed und cut.

sed (kurz für Stream EDitor)

Verwendungszweck: Kann Zeilen ersetzen oder löschen, die bestimmten Bedingungen entsprechen Verwendung: 's / regulärer Ausdruck zum Suchen / Zeichenfolge zum Ersetzen / Option'

【Anwendungsbeispiel】

# .Kann durch Ersetzen durch ein Leerzeichen ausgegeben werden/g entspricht dem Ersetzen aller regulären Ausdrücke, die in einer Zeile durchsucht werden sollen, auch wenn sie mehrmals vorkommen.
XX | sed 's/./ /g'

cut Zeitpunkt der Verwendung: Dient zum Extrahieren einiger Textspalten, die durch bestimmte Zeichen getrennt sind 【Anwendungsbeispiel】

# ,Geben Sie nur die erste und die zweite Spalte getrennt durch aus.-Trennzeichen mit d,-Geben Sie die Spaltennummer mit f an.
XX | cut -d , -f 1,2

Ich möchte einen Blick auf die Prozesse des Extrahierens nacheinander mit den Methoden 1 bis 4 des Hauptthemas werfen.

1. Extrahieren Sie den Teil, der dem regulären Ausdruck entspricht, mit dem Befehl sed

Verwendung: * sed -Es /. \ * (Regulärer Ausdruck, der dem Teil entspricht, den Sie extrahieren möchten). * / \ 1 / ' Entschlüsselung: Entspricht einem einzelnen Zeichen

【Anwendungsbeispiel】

echo hello_world | sed -E 's/.\*(hello.).*/\1'
#Ausgabeergebnis
  hello

2. Verwenden Sie den Befehl sed, um das übereinstimmende Teil und das verbleibende Teil zu entfernen

Entschlüsselung: ^ In [] bedeutet Ablehnung

【Anwendungsbeispiel】

echo'<li class="pagingnumber">130/2098</li>' | sed -E 's/<[^>]*>//g'

3. Verwenden Sie den Befehl cut, um das n-te aus der Zeichenfolge zu extrahieren, die durch ein bestimmtes Zeichen getrennt ist

Zeitpunkt der Verwendung: Beim Extrahieren einer Zeichenfolge aus csv Entschlüsselung: '-d, -f 2'ist ein Trennzeichen, das zweite Element aus der begrenzten Zeichenfolge

echo '1,Baseball,Hanshin' | cut -d , -f 2
#Ausgabeergebnis
Baseball

4. Verwenden Sie den Befehl awk, um das n-te aus der mit Leerzeichen versehenen Zeichenfolge zu extrahieren

Es kann verwendet werden, wenn die Ziffern mit Leerzeichen ausgerichtet sind und die Trennzeichen aufeinander folgen. (Schnitt ist nicht geeignet, wenn Trennzeichen aufeinander folgen) Wenn Sie die Zeichenfolge {print $ n} angeben, können Sie die n-te Zeichenfolge extrahieren.

echo 'A B C D E' | awk '{print $4}'
#Ausgabeergebnis
 D

Recommended Posts

So extrahieren Sie die gewünschte Zeichenfolge aus einem Befehl in Zeile 4
# 5 [python3] Extrahiert Zeichen aus einer Zeichenfolge
[Python] So invertieren Sie eine Zeichenfolge
[Einführung in Python] So teilen Sie eine Zeichenfolge mit der Funktion split
Versuchen Sie, mit Python3 eine Zeichenfolge aus einem Bild zu extrahieren
Geben Sie die Zeile mit der angegebenen Zeichenfolge aus der Textdatei aus
So erstellen Sie ein Funktionsobjekt aus einer Zeichenfolge
So extrahieren Sie den Koeffizienten aus der Minutenformel
[Einführung in Python] So schreiben Sie eine Zeichenfolge mit der Formatierungsfunktion
So erstellen Sie einen Artikel über die Befehlszeile
[Python] So erweitern Sie Variablen in einer Zeichenfolge
So veröffentlichen Sie ein Ticket über die Shogun-API
[Ansible] Beispiel für ein Playbook, das der ersten Zeile der Datei eine Zeichenkette hinzufügt
Grundlagen des Python-Lernens ~ Wie wird eine Zeichenkette ausgegeben (angezeigt)? ~
So verbinden Sie den Inhalt der Liste mit einer Zeichenfolge
Extrahieren Sie den Wert, der einem Wert am nächsten kommt, aus einem Listenelement in Python
[Einführung in Python] So geben Sie eine Zeichenfolge in einer Print-Anweisung aus
Verwendung der visuellen Erkennung, um die LINE ID von einem Mädchen zu erhalten
[EC2] So installieren und laden Sie chromedriver über die Befehlszeile herunter
Finden Sie alle Muster, um eine bestimmte Zahl aus dem Satz zu extrahieren
So erstellen Sie einen Klon aus Github
Ich möchte mit Python eine beliebige URL aus der Zeichenfolge der HTML-Quelle extrahieren
So bedienen Sie Linux von der Konsole aus
So erstellen Sie ein Repository aus Medien
So greifen Sie von außen auf den Datenspeicher zu
So setzen Sie eine Zeilennummer am Anfang einer CSV-Datei
Verwenden Sie BeautifulSoup, um einen Link mit einer Zeichenfolge aus einer HTML-Datei zu extrahieren
So geben Sie eine Zeichenfolge in Python ein und geben sie unverändert oder in die entgegengesetzte Richtung aus.
So berechnen Sie die Volatilität einer Marke
So senden Sie eine Nachricht mit Curl an LINE
So öffnen Sie einen Webbrowser über Python
So generieren Sie ein Python-Objekt aus JSON
So bedienen Sie Linux von außen Vorgehensweise
So erstellen Sie ein 1-zeiliges Kivy-Eingabefeld
Ich habe versucht, eine zufällige Zeichenfolge zu generieren
Python-Version (PHP zu Python), die die nachfolgende Zeichenfolge aus der angegebenen Zeichenfolge (Erweiterung) löscht
Ich habe versucht, die Strichzeichnung mit Deep Learning aus dem Bild zu extrahieren
[Vorläufig] So konvertieren Sie eine Zeichenfolge mit kivy-ios Memo kivy v1.8.0 in Shift_jis
[Python] Ich habe versucht, den Typnamen als Zeichenfolge aus der Typfunktion abzurufen
Lesen Sie die Python-Markdown-Quelle: So erstellen Sie einen Parser
[Python] So entfernen Sie doppelte Werte aus der Liste
So konvertieren / wiederherstellen Sie einen String mit [] in Python
Ruft den Variablennamen der Variablen als Zeichenfolge ab.
Eine Geschichte, die fehlgeschlagen ist, als versucht wurde, das Suffix mit rstrip aus einem String zu entfernen
So schreiben Sie eine GUI mit dem Befehl maya
So erstellen Sie ein Untermenü mit dem Plug-In [Blender]
#Eine Funktion, die den Zeichencode einer Zeichenfolge zurückgibt
So starten Sie Jupyter Notebook sofort vom Terminal aus
Ich möchte eine Zeichenkette mit Hiragana teilen
Geben Sie eine Zeichenfolge mit Zeilenumbrüchen in PyYAML aus
Übergeben von Argumenten beim Aufrufen von Python-Skripten über Blender in der Befehlszeile
[Ruby] Wie ersetze ich nur einen Teil der Zeichenkette, der mit dem regulären Ausdruck übereinstimmt?
[Linux] Wenn Sie aus mehreren Dateien nach einer bestimmten Zeichenfolge suchen möchten
Wie man das Dokument der magischen Funktion (Linienmagie) trifft
Die weltweit am einfachsten zu verstehende Erklärung zur Herstellung von LINE BOT (1) [Kontoerstellung]
So nehmen Sie ein aufgenommenes Bild aus einem Video auf (OpenCV)
(Denken Sie schnell daran) Verwendung der LINUX-Befehlszeile
[Python] So rufen Sie eine Funktion von c aus Python auf (ctypes edition)
Geben Sie die Zeile mit der angegebenen Zeichenfolge aus der Textdatei aus
[Python] Lesen Sie die angegebene Zeile in der Datei
Teilen Sie die Zeichenfolge in die angegebene Anzahl von Zeichen
So löschen Sie die angegebene Zeichenfolge mit dem Befehl sed! !! !!
Geben Sie eine Zeichenfolge mit Zeilenumbrüchen in PyYAML aus
Geben Sie eine Liste der Unicode-Zeichenfolgen aus
[Python 2/3] Analysiert die Formatzeichenfolge
Filtern Sie die Ausgabe von tracemalloc
Lesen Sie die Standardausgabe eines Unterprozesses zeilenweise in Python
So extrahieren Sie die gewünschte Zeichenfolge aus einem Befehl in Zeile 4
[Python] Programmieren, um die Nummer von a in einer Zeichenfolge zu finden, die eine bestimmte Anzahl von Malen wiederholt.