[LINUX] Comment extraire la chaîne de caractères souhaitée à partir d'une ligne 4 commandes

Python Crawling & Scraping-Practical Development Guide for Data Collection and Analysis- https://www.amazon.co.jp/dp/B01NGWKE0P/ref=dp-kindle-redirect?_encoding=UTF8&btkr=1

Du livre 1.4.1 Obtenir le nombre total de livres électroniques Ce que j'ai appris du chapitre

Opération pour extraire uniquement la chaîne de caractères avec une expression régulière du code html extrait par grep Quatre méthodes sont introduites

1.Extraire la partie qui correspond à l'expression régulière avec la commande sed
2.Supprimez la partie correspondante avec la commande sed et supprimez la partie restante
3.Utilisez la commande cut pour extraire le nième d'une chaîne séparée par un caractère spécifique
4.Extrayez le nième d'une chaîne justifiée par un espace à l'aide de la commande awk

Je ne connais pas la commande en premier lieu. .. .. Cependant, il y avait une explication de sed et coupé à la page précédente.

sed (abréviation de Stream EDitor)

Quand l'utiliser: peut remplacer ou supprimer des lignes qui correspondent à des conditions spécifiques Utilisation: 's / expression régulière à rechercher / chaîne à remplacer / option'

【Exemple d'utilisation】

# .Peut être généré en remplaçant par un espace/g équivaut à remplacer toutes les expressions régulières à rechercher sur une seule ligne, même si elles apparaissent plusieurs fois.
XX | sed 's/./ /g'

cut Timing of use: Utilisé pour extraire certaines colonnes de texte séparées par des caractères spécifiques 【Exemple d'utilisation】

# ,Affiche uniquement les première et deuxième colonnes séparées par.-Délimiteur avec d,-Spécifiez le numéro de colonne avec f.
XX | cut -d , -f 1,2

Je voudrais jeter un œil aux processus d'extraction par les méthodes 1 à 4 du sujet principal un par un.

1. Extrayez la partie qui correspond à l'expression régulière avec la commande sed

Utilisation: * sed -E's /. \ * (Expression régulière qui correspond à la partie que vous souhaitez extraire). * / \ 1 / ' Décryptage: . Correspond à n'importe quel caractère

【Exemple d'utilisation】

echo hello_world | sed -E 's/.\*(hello.).*/\1'
#Résultat de sortie
  hello

2. Utilisez la commande sed pour supprimer la partie correspondante et supprimer la partie restante

Décryptage: ^ In [] indique un refus

【Exemple d'utilisation】

echo'<li class="pagingnumber">130/2098</li>' | sed -E 's/<[^>]*>//g'

3. Utilisez la commande cut pour extraire la nième chaîne de la chaîne séparée par un caractère spécifique.

Moment d'utilisation: lors de l'extraction d'une chaîne de caractères à partir de csv Décryptage: '-d, -f 2' est un délimiteur, le deuxième élément de la chaîne délimitée

echo '1,base-ball,Hanshin' | cut -d , -f 2
#Résultat de sortie
base-ball

4. Utilisez la commande awk pour extraire le nième de la chaîne justifiée par un espace

Il peut être utilisé lorsque les chiffres sont alignés avec des espaces et que les délimiteurs sont consécutifs. (la coupe ne convient pas lorsque les délimiteurs sont consécutifs) Si vous donnez la chaîne de caractères {print $ n}, vous pouvez extraire la nième chaîne de caractères.

echo 'A B C D E' | awk '{print $4}'
#Résultat de sortie
 D

Recommended Posts

Comment extraire la chaîne de caractères souhaitée à partir d'une ligne 4 commandes
# 5 [python3] Extraire des caractères d'une chaîne de caractères
[Python] Comment inverser une chaîne de caractères
[Introduction à Python] Comment fractionner une chaîne de caractères avec la fonction split
Essayez d'extraire une chaîne de caractères d'une image avec Python3
Sortie de la ligne contenant la chaîne de caractères spécifiée à partir du fichier texte
Comment créer un objet fonction à partir d'une chaîne
Comment extraire le coefficient de la formule minute
[Introduction à Python] Comment écrire une chaîne de caractères avec la fonction format
Comment créer un article à partir de la ligne de commande
[Python] Comment développer des variables dans une chaîne de caractères
Comment publier un ticket depuis l'API Shogun
[Ansible] Exemple de playbook qui ajoute une chaîne de caractères à la première ligne du fichier
Les bases de l'apprentissage Python ~ Comment générer (afficher) une chaîne de caractères ~
Comment connecter le contenu de la liste dans une chaîne de caractères
Extraire la valeur la plus proche d'une valeur à partir d'un élément de liste en Python
[Introduction à Python] Comment générer une chaîne de caractères dans une instruction Print
Comment utiliser la reconnaissance visuelle pour obtenir l'ID de ligne d'une fille
[EC2] Comment installer et télécharger chromedriver à partir de la ligne de commande
Trouvez tous les modèles pour extraire un nombre spécifique de l'ensemble
Comment créer un clone depuis Github
Je souhaite extraire une URL arbitraire de la chaîne de caractères de la source html avec python
Comment faire fonctionner Linux depuis la console
Comment créer un référentiel à partir d'un média
Comment accéder à la banque de données de l'extérieur
Comment mettre un numéro de ligne au début d'un fichier CSV
Utilisez BeautifulSoup pour extraire un lien contenant une chaîne d'un fichier HTML
Comment saisir une chaîne de caractères en Python et la sortir telle quelle ou dans la direction opposée.
Comment calculer la volatilité d'une marque
Comment envoyer un message à LINE avec curl
Comment ouvrir un navigateur Web à partir de python
Comment générer un objet Python à partir de JSON
Comment faire fonctionner Linux depuis l'extérieur Procédure
Comment créer une boîte de saisie Kivy 1 ligne
J'ai essayé de générer une chaîne de caractères aléatoire
Version Python (PHP vers Python) qui supprime la chaîne de caractères suivante de la chaîne de caractères spécifiée (extension)
J'ai essayé d'extraire le dessin au trait de l'image avec Deep Learning
[Tentative] Comment convertir une chaîne de caractères en Shift_jis avec kivy-ios Memo kivy v1.8.0
[Python] J'ai essayé d'obtenir le nom du type sous forme de chaîne de caractères à partir de la fonction type
Lire la source Python-Markdown: Comment créer un analyseur
[Python] Comment supprimer les valeurs en double de la liste
Comment convertir / restaurer une chaîne avec [] en python
Obtenez le nom de la variable sous forme de chaîne de caractères.
Une histoire qui a échoué lors de la tentative de suppression du suffixe d'une chaîne avec rstrip
Comment écrire une interface graphique à l'aide de la commande maya
Comment créer un sous-menu avec le plug-in [Blender]
#Une fonction qui renvoie le code de caractère d'une chaîne de caractères
Comment lancer instantanément Jupyter Notebook à partir du terminal
Je veux diviser une chaîne de caractères avec hiragana
Sortie d'une chaîne avec des sauts de ligne dans PyYAML
Comment passer des arguments lors de l'appel d'un script python depuis Blender sur la ligne de commande
[Ruby] Comment remplacer uniquement une partie de la chaîne de caractères correspondant à l'expression régulière?
[Linux] Lorsque vous souhaitez rechercher une chaîne de caractères spécifique dans plusieurs fichiers
Comment frapper le document de Magic Function (Line Magic)
L'explication la plus simple au monde sur la création de LINE BOT (1) [Account preparation]
Comment prendre une image capturée à partir d'une vidéo (OpenCV)
(Rappelez-vous rapidement) Comment utiliser la ligne de commande LINUX
[Python] Comment appeler une fonction de c depuis python (édition ctypes)
Sortie de la ligne contenant la chaîne de caractères spécifiée à partir du fichier texte
[Python] Lire la ligne spécifiée dans le fichier
Divisez la chaîne de caractères en le nombre de caractères spécifié
Comment supprimer la chaîne de caractères spécifiée avec la commande sed! !! !!
Sortie d'une chaîne avec des sauts de ligne dans PyYAML
Sortie d'une liste de chaînes Unicode
[Python 2/3] Analyser la chaîne de format
Filtrer la sortie de tracemalloc
Lire la sortie standard d'un sous-processus ligne par ligne en Python
Comment extraire la chaîne de caractères souhaitée à partir d'une ligne 4 commandes
[Python] Programmation pour trouver le nombre de a dans une chaîne de caractères qui se répète un nombre spécifié de fois.