[PYTHON] Ich habe versucht, die Texte von GReeeen zu visualisieren, die ich in meiner Jugend verrückt gehört habe, aber nicht mehr gehört habe.

Auslösen

GReeeen hörte in seiner Jugend verrückt zu. Ich frage mich, warum ich es jetzt nicht gehört habe, obwohl ich es so oft gehört habe ... Ich fing an, so zu denken. Wir werden die Nachrichtentendenz von GReeeen's Songs visualisieren und die Texte analysieren, um zu verstehen, warum Sie aufgehört haben zuzuhören = warum Sie nicht mit dem Song sympathisieren konnten.

Referenzartikel

Umgebung

1. Sammlung von Texten

Schaben aus Uta Net.

import requests
from bs4 import BeautifulSoup
import pandas as pd
import time

#Erstellen Sie eine Tabelle mit den Scraped-Daten
list_df = pd.DataFrame(columns=['Text'])

for page in range(1, 3):
    #Top-Adresse der Song-Seite
    base_url = 'https://www.uta-net.com'

    #Textliste Seite
    url = 'https://www.uta-net.com/artist/5384/' + str(page) + '/'
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'lxml')
    links = soup.find_all('td', class_='side td1')
    for link in links:
        a = base_url + (link.a.get('href'))

        #Lyrics Detail Seite
        response = requests.get(a)
        soup = BeautifulSoup(response.text, 'lxml')
        song_lyrics = soup.find('div', itemprop='lyrics')
        song_lyric = song_lyrics.text
        song_lyric = song_lyric.replace('\n','')
        #Warten Sie 1 Sekunde, bis der Server nicht geladen ist
        time.sleep(1)

        #Fügen Sie die erworbenen Texte zur Tabelle hinzu
        tmp_se = pd.DataFrame([song_lyric], index=list_df.columns).T
        list_df = list_df.append(tmp_se)

print(list_df)

#CSV speichern
list_df.to_csv('/Users/Nutzername/greeeen/list.csv', mode = 'a', encoding='cp932')

2. Verwandeln Sie Texte in Wörter (morphologische Analyse)

from janome.tokenizer import Tokenizer
import pandas as pd
import re

#list.CSV-Datei lesen
df_file = pd.read_csv('/Users/Nutzername/greeeen/list.csv', encoding='cp932')

song_lyrics = df_file['Text'].tolist()

t = Tokenizer()

results = []

for s in song_lyrics:
    tokens = t.tokenize(s)

    r = []

    for tok in tokens:
        if tok.base_form == '*':
            word = tok.surface
        else:
            word = tok.base_form

        ps = tok.part_of_speech

        hinshi = ps.split(',')[0]

        if hinshi in ['Substantiv', 'Adjektiv', 'Verb', 'Adverb']:
            r.append(word)

    rl = (' '.join(r)).strip()
    results.append(rl)
    #Ersetzen des zusätzlichen Zeichencodes
    result = [i.replace('\u3000','') for i in results]
    print(result)

text_file = '/Users/Nutzername/greeeen/wakati_list.txt'
with open(text_file, 'w', encoding='utf-8') as fp:
    fp.write("\n".join(result))

3. Visualisierung (Word Cloud)

from wordcloud import WordCloud

text_file = open('/Users/Nutzername/greeeen/wakati_list.txt', encoding='utf-8')
text = text_file.read()

#Japanischer Schriftpfad
fpath = '/System/Library/Fonts/Hiragino Mincho ProN.ttc'

#Wortentfernung, die bedeutungslos erscheint
stop_words = ['damit', 'Abwesend', 'Ist', 'Machen', 'Wie es ist', 'Yo', 'Teru', 'Werden', 'Ding', 'Bereits', 'Gut', 'Gibt es', 'gehen', 'Sein']

wordcloud = WordCloud(background_color='white',
    font_path=fpath, width=800, height=600, stopwords=set(stop_words)).generate(text)

#Das Bild ist Wordcloud.Speichern Sie png im selben Verzeichnis wie die py-Datei
wordcloud.to_file('./wordcloud.png')

Fertiges Produkt

image.png

Es gibt viele Wörter wie "wir" und "heute", die zeitlich und räumlich der Person oder der Gegenwart nahe stehen. Andere sind mit Fortschritt / Veränderung verbunden, wie "gehen", "vorrücken" und "ändern", und "wahrscheinlich" mit Unsicherheit tritt häufig auf. Danach können Sie "lachen" und "lächeln" sehen.

Fazit

Diese Analyse hat gezeigt, dass mein erwachsener Verstand ziemlich rau ist.
Ich glaube, ich hatte ein kaltes Herz, um mich an die Gesellschaft anzupassen, aber es scheint, dass ich das heiße und gläubige Herz verloren habe, das ich in meiner Jugend hatte. Basierend auf diesem Ergebnis werde ich mein Bestes geben, um Jugendlichkeit wie Jugend zu haben. Ich denke, ich werde vorerst mehr lachen ...

Recommended Posts

Ich habe versucht, die Texte von GReeeen zu visualisieren, die ich in meiner Jugend verrückt gehört habe, aber nicht mehr gehört habe.
Da es der 20. Jahrestag der Gründung ist, habe ich versucht, die Texte von Parfüm mit Word Cloud zu visualisieren
Ich habe versucht, die Texte von Hinatazaka 46 zu vektorisieren!
Ich habe versucht, die Spacha-Informationen von VTuber zu visualisieren
Ich habe versucht, den in Pandas häufig verwendeten Code zusammenzufassen
[Python] Ich habe versucht, die folgende Beziehung von Twitter zu visualisieren
Ich habe versucht, die im Geschäftsleben häufig verwendeten Befehle zusammenzufassen
Ich habe versucht, den Stromverbrauch meines Hauses mit Nature Remo E lite zu visualisieren
[Verarbeitung natürlicher Sprache] Ich habe versucht, die Bemerkungen jedes Mitglieds in der Slack-Community zu visualisieren
Ich habe versucht, es sorgfältig zu verstehen, während ich den Algorithmus Adaboost beim maschinellen Lernen implementiert habe (+ ich habe mein Verständnis der Array-Berechnung vertieft)
Ich habe versucht, die häufig verwendete Implementierungsmethode von pytest-mock zusammenzufassen
Ich habe versucht, den allgemeinen Zustand der VTuber-Kanalbetrachter zu visualisieren
Ich habe versucht, die Altersgruppe und die Ratenverteilung von Atcoder zu visualisieren
Ich habe versucht, die Genauigkeit meines eigenen neuronalen Netzwerks zu verbessern
Ich möchte meine Gefühle mit den Texten von Mr. Children ausdrücken
Ich habe versucht, den Text des Romans "Wetterkind" mit Word Cloud zu visualisieren
Ich habe versucht, den Höhenwert von DTM in einem Diagramm anzuzeigen
[Ergänzung zum vorherigen Artikel] Ich habe versucht, die PUSH-API von LINE Bot zu verwenden, die im kostenlosen Plan verfügbar war, bevor ich es wusste.
Ich habe versucht, den Ortsnamen zu wecken, der in den Texten von Masashi Sada auf der Heatmap erscheint
Ich wollte die Anzahl der Zeilen in mehreren Dateien wissen und versuchte, sie mit einem Befehl abzurufen
Ich habe versucht, die beim maschinellen Lernen verwendeten Bewertungsindizes zu organisieren (Regressionsmodell).
Ich habe versucht, die Tweets von JAWS DAYS 2017 mit Python + ELK einfach zu visualisieren
Ich habe versucht, die Daten des Laptops durch Booten unter Ubuntu zu retten
Ich habe die Größenänderung von TensorFlow nicht verstanden und sie daher visuell zusammengefasst.
Ich habe mein Bestes versucht, um eine Optimierungsfunktion zu erstellen, aber es hat nicht funktioniert.
Ich habe versucht, die Trapezform des Bildes zu korrigieren
Ich habe versucht, OneHotEncoder zu erstellen, der häufig für die Datenanalyse verwendet wird, damit er den juckenden Ort erreicht.
[Kein Code] Ich habe in meiner Abschlussarbeit über elliptische Kurven und Blockchain geschrieben und versucht, die Studienmethode zusammenzufassen
Ich habe versucht, YouTube zu kratzen, aber ich kann die API verwenden, also tu es nicht.
Python-Übung 100 Schläge Ich habe versucht, den Entscheidungsbaum von Kapitel 5 mit graphviz zu visualisieren
Ich habe versucht, die Eigenschaften der neuen Informationen über mit dem Corona-Virus infizierte Personen mit Wordcloud zu visualisieren
Ich habe Python verwendet, um mich über die Rollenauswahl der 51 "Yachten" in der Welt zu informieren.
Ich habe versucht, die Laufdaten des Rennspiels (Assetto Corsa) mit Plotly zu visualisieren
Ich habe versucht, es einfach zu machen, die Einstellung des authentifizierten Proxys auf Jupyter zu ändern
Da die Aktie aufgrund des Einflusses des neuen Corona-Virus eingebrochen ist, habe ich versucht, die Performance meines Investment Trusts mit Python zu visualisieren.
Ich habe versucht, die Grundform von GPLVM zusammenzufassen
Ich habe versucht, den negativen Teil von Meros zu löschen
Ich habe versucht, die Stimmen der Sprecher zu klassifizieren
Ich habe versucht, die String-Operationen von Python zusammenzufassen
[Verarbeitung natürlicher Sprache] Ich habe diese Woche versucht, die aktuellen Themen in der Slack-Community zu visualisieren
Ich möchte etwas Schönes sehen, also habe ich versucht, die Funktion zu visualisieren, die zum Benchmarking der Optimierungsfunktion verwendet wird.
Ich war für die Pflege des Fabric-Skripts verantwortlich, weiß es aber nicht.> <Für diejenigen, die
Ich schrieb einen Test in "Ich habe versucht, die Wahrscheinlichkeit eines Bingospiels mit Python zu simulieren".
Ich habe versucht, HULFT IoT (Edge Streaming) in das Gateway Rooster von Sun Electronics zu integrieren
Ich habe versucht, den Trend der Anzahl der Schiffe in der Bucht von Tokio anhand von Satellitenbildern zu ermitteln.
[Python] Ich habe versucht, die Texte von Arashi mit WordCloud zu visualisieren und herauszufinden, was ich den Fans in 20 Jahren Ausbildung vermitteln wollte
Ich habe versucht, die Entropie des Bildes mit Python zu finden
[Pferderennen] Ich habe versucht, die Stärke des Rennpferdes zu quantifizieren
Ich habe versucht, die Standortinformationen des Odakyu-Busses zu erhalten
Ich habe versucht, mit TensorFlow den Durchschnitt mehrerer Spalten zu ermitteln
Ich habe versucht, die Zeit und die Zeit der C-Sprache zu veranschaulichen
Ich habe es in der Sprache Go geschrieben, um das SOLID-Prinzip zu verstehen
Ich habe versucht, die Mail-Sendefunktion in Python zu implementieren
[TF] Ich habe versucht, das Lernergebnis mit Tensorboard zu visualisieren
[Maschinelles Lernen] Ich habe versucht, die Theorie von Adaboost zusammenzufassen
Ich habe versucht, das lokale Minimum der Goldstein-Preis-Funktion zu bekämpfen