[PYTHON] [SLAYER] Ich habe versucht, die Stahlseele zu bestätigen, indem ich die Texte von Slash Metal [Word Cloud] visualisiert habe.

Einführung

Mein geliebter Thrash Metal, ** SLAYER ** ist mein Favorit.

Obwohl sie seit vielen Jahren aktiv sind, haben sie endlich die letzte Welttournee erreicht und gleichzeitig den Tod der Mitglieder überwunden. Und am 30. November 2019 zierte der Abschlussvortrag in LA die unendliche Schönheit.

https://www.youtube.com/watch?v=OwsdbuxRc_s

Zum Gedenken möchte ich bestätigen, was sie vermitteln wollten.

Umgebung

Visualisierungsergebnis

wordcloud.png

Immerhin ist Blut ein Tod ... Ich habe nichts mehr zu sagen.

Vielen Dank für die wundervolle Musik und Nachricht! !! !! !! !!

Vorbereitungen

Überprüfen Sie zunächst den HTML-Code der Zielseite. Die Texte sind in der Klasse "Texte" geschrieben, aber es gibt einige zusätzliche untergeordnete Tags, die entfernt werden müssen.

sample tags


<div class="lyrics">
<h3><a name="1">1. Evil Has No Boundaries</a></h3><br />
<i>[Lyrics - Hanneman, King; Music - King]</i><br />
<br />
Blasting our way through the boundaries of Hell<br />

・ ・ ・

We conquer then move on ahead<br />
<br />
<i>[Chorus:]</i><br />
Evil<br />

・ ・ ・

Your soul now his to keep<br />
<br />

<div class="thanks">Tom Araya     - Bass/Vocals<br />
Kerry King    - Lead/Rhythm Guitar<br />
Jeff Hanneman - Lead/Rhythm Guitar<br />
Dave Lombardo - Drums<br />
<br />
Thanks to nwdrk13 for correcting track #4 lyrics.<br />
Thanks to rath00 for correcting track #6 lyrics.</div>
<br />
<div class="note">Submits, comments, corrections are welcomed at [email protected]</div><br />
<a href="http://www.darklyrics.com/s/slayer.html">SLAYER LYRICS</a>
</div>

Quellcode

Es stellte sich heraus, dass es so etwas war.

import requests
from bs4 import BeautifulSoup
import pandas as pd
import time
from wordcloud import WordCloud

#URL-Liste für jedes Album
urls = ['http://www.darklyrics.com/lyrics/slayer/shownomercy.html',
        'http://www.darklyrics.com/lyrics/slayer/hauntingthechapel.html',
        'http://www.darklyrics.com/lyrics/slayer/hellawaits.html',
        'http://www.darklyrics.com/lyrics/slayer/reigninblood.html',
        'http://www.darklyrics.com/lyrics/slayer/southofheaven.html',
        'http://www.darklyrics.com/lyrics/slayer/seasonsintheabyss.html',
        'http://www.darklyrics.com/lyrics/slayer/divineintervention.html',
        'http://www.darklyrics.com/lyrics/slayer/undisputedattitude.html',
        'http://www.darklyrics.com/lyrics/slayer/diabolusinmusica.html',
        'http://www.darklyrics.com/lyrics/slayer/godhatesusall.html',
        'http://www.darklyrics.com/lyrics/slayer/christillusion.html',
        'http://www.darklyrics.com/lyrics/slayer/worldpaintedblood.html',
        'http://www.darklyrics.com/lyrics/slayer/repentless.html']

texts = ''

for url in urls:
    #Erhalten
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'lxml')
    song_lyrics = soup.find('div', class_='lyrics')
    
    #Löschen Sie nicht benötigte Tags
    for tag in song_lyrics.find_all('h3'):
        tag.extract()
    for tag in song_lyrics.find_all('i'):
        tag.extract()
    for tag in song_lyrics.find_all('div', class_='thanks'):
        tag.extract()
    for tag in song_lyrics.find_all('div', class_='note'):
        tag.extract()
    for tag in song_lyrics.find_all('a'):
        tag.extract()
        
    song_lyric = song_lyrics.text
    song_lyric = song_lyric.replace('\n',' ')
    
    #Warten Sie 1 Sekunde (unter Berücksichtigung der Serverlast).
    time.sleep(1)

    #Fügen Sie die erworbenen Texte hinzu
    texts = texts + song_lyric + ' '
    
#Wortentfernung, die bedeutungslos erscheint
stop_words = ['the', 'of', 'to', 'is', 'in', 'for', 'with', 'that', 'my', 'all', 'will', 'from', 'can', 'your',  
              'on', 'me', 'it', 'and', 'this', 'be', 'are', 'am', 'their', 'do', 'there', 'you', 'it']

wordcloud = WordCloud(background_color='black', colormap='autumn',
    width=800, height=600, stopwords=set(stop_words)).generate(texts)

#Das Bild ist Wordcloud.Speichern Sie png im selben Verzeichnis wie die py-Datei
wordcloud.to_file('./wordcloud.png')

abschließend

Aus "Show No Mercy" im Jahr 1983, dem legendären Album "Reign in Blood" im Jahr 1986. Und das letzte Originalalbum, 2015 "Repentless".

Keine andere Band war in ihrem Leben so musikalisch. Sie waren sehr selten.

Ich werde ihren Klang und die stählerne Seele für den Rest meines Lebens in meinem Herzen halten.

Ah ... es war hier kein Blog.

Referenz

Recommended Posts

[SLAYER] Ich habe versucht, die Stahlseele zu bestätigen, indem ich die Texte von Slash Metal [Word Cloud] visualisiert habe.
Ich habe mir die Versionen von Blender und Python angesehen
Ich habe das Standardbetriebssystem und die Shell der Docker-Maschine überprüft
[Flask & Bootstrap] Visualisiere den Inhalt von Texten mit Word Cloud ~ Lyrics Word Cloud ~
Da es der 20. Jahrestag der Gründung ist, habe ich versucht, die Texte von Parfüm mit Word Cloud zu visualisieren
Ich habe den Akkord des Songs mit word2vec vektorisiert und mit t-SNE visualisiert
Ich habe die Anzahl der bundesweit geschlossenen und eröffneten Geschäfte von Corona überprüft
Ich habe den Inhalt des Docker-Volumes überprüft
Ich habe die Optionen von copyMakeBorder von OpenCV überprüft
Ich habe die Liste der Tastenkombinationen von Jupyter überprüft
Ich habe die Sitzungsaufbewahrungsdauer von Django überprüft
Ich habe die Verarbeitungsgeschwindigkeit der numpy eindimensionalisierung überprüft
Ich habe die Varianten von UKR gelesen und implementiert
Die schönen und bedauerlichen Teile von Cloud Datalab
Ich habe versucht, die Texte von Hinatazaka 46 zu vektorisieren!
Ich habe die Ausgabespezifikationen von Bidirectional LSTM von PyTorch überprüft
Ich analysierte die Rangkampfdaten des Pokemon-Schwertschilds und visualisierte sie auf Tableau