[PYTHON] Ich habe versucht, meinen Lieblingssänger (SHISHAMO) mit der Spotify-API zu analysieren

Einführung

Da ich Datenanalyse studiere, habe ich darüber nachgedacht, meine Lieblingssachen zu analysieren, und bin zu ** SHISHAMO ** gekommen. Als ich Qiita betrachtete, um herauszufinden, wie man es analysiert, fand ich einen interessanten Artikel.

Als Ergebnis der Analyse der Attributdaten von 76.000 Spotify-Songs war J-Rock eher Punk als Rock

Anscheinend hat Spotify Attributdaten für jeden Song, und als SHISHAMO-Fan bin ich neugierig auf die Eigenschaften der Attributdaten von SHISHAMO. Also habe ich SHISAMO mit den Attributdaten von Spotify analysiert.

Verfahren

Ich überlasse die ausführliche Erläuterung der Spotify-API jemand anderem und erkläre kurz die spezifischen Schritte.

1. Zertifizierungsarbeiten

import spotipy
import pandas as pd
client_id = 'client_id'
client_secret = 'client_secret'
client_credentials_manager = spotipy.oauth2.SpotifyClientCredentials(client_id, client_secret)
spotify = spotipy.Spotify(client_credentials_manager=client_credentials_manager)

Geben Sie die cliend_id und client_secret von spotify für Entwickler aus. Ich habe es mit Bezug auf [diesen Artikel] gemacht (https://qiita.com/musiccoffeetea/items/69a58d6d66e42b3c113f).

2. Datenerfassung


albums = spotify.artist_albums(artist_id, album_type=None, country=None, limit=20, offset=0)
df = pd.DataFrame()
for i in range(len(albums['items'])):
    album_url = albums['items'][i]['external_urls']['spotify']
    album_name = albums['items'][i]['name']
    album_truck = spotify.album_tracks(album_url)['items']
    for j in range(len(album_truck)):
        truck_name = album_truck[j]['name']
        truck_url = album_truck[j]['external_urls']['spotify']
        truck = spotify.audio_features(truck_url)[0]
        tmp = pd.DataFrame(truck,index=['1',]).iloc[:,:11]
        tmp['album_name'] = album_name
        tmp['truck_name'] = truck_name
        df = df.append(tmp)

Die artist_id kann wie unten gezeigt vom Spotify-Webplayer bezogen werden. Das Hintergrundbild wird übrigens vom Sänger gezeichnet, was sehr gut und niedlich ist. スクリーンショット 2020-07-14 18.36.52.png Ich konnte die folgenden Daten wie folgt erhalten. スクリーンショット 2020-07-14 18.41.07.png

Sehr niedliche Songtitel sind in einer Reihe und 11 Variablen werden in Spotify als Feature-Mengen angegeben, um diesen Song darzustellen. Dies sind die Attributdaten für jeden Spotify-Song. Weitere Informationen hierzu finden Sie in diesem Artikel. Es scheint, dass es ein Songtempo, Schalldruck, Instrumentalgefühl usw. gibt.

3. Datenanalyse

Dieses Mal haben wir die Dimensionskomprimierung und -visualisierung mit Umap analysiert. Einzelheiten zu Umap finden Sie in diesem Artikel. Ich hoffe, Sie können sich das als einen Algorithmus für die Projektion in einen niedrigdimensionalen Raum vorstellen, der für Clustering wie PCA geeignet ist (ich verstehe auch die Details nicht). Hier ist das Ergebnis der Darstellung der Songdaten aller SHISHAMO 1 ~ 6-Alben in zwei Dimensionen mit Umap. スクリーンショット 2020-07-15 10.46.22.png Es sieht so aus, als gäbe es 4 Gruppen. Für dieses Ergebnis gut gruppiert ** 1. Gibt es Eigenschaften für jedes Album? ** ** 2. Gibt es Eigenschaften von populären Liedern? ** ** ** ** 3. Haben deine Lieblingslieder irgendwelche Eigenschaften? ** ** ** Ich habe versucht, die drei Punkte zu betrachten.

1. Gibt es Eigenschaften für jedes Album?

Es ist eine Grafik mit roten Kreisen für jedes Album. matome.jpeg Es stellte sich heraus, dass im ersten Album unten links in der Grafik keine Songs zur Gruppe gehörten, und Sie können das Wachstum von SHISHAMO spüren, das eine größere Auswahl an Songs hat. Sie können auch sehen, dass die Songs jeder Gruppe für jedes Album ausgewogen aufgenommen werden. Ich mag kein Album mit nur Balladen, nicht wahr?

2. Gibt es irgendwelche Eigenschaften von populären Liedern?

Ich habe analysiert, ob populäre Songs Eigenschaften haben. Da es schwierig ist, die populären Songs von SHISHAMO zu beurteilen, habe ich 4 Songs ausgewählt, die nach meinem eigenen Ermessen bekannt zu sein schienen. ** "Morgen", "Du und Sommerfest", "Ich bin verliebt", "Ich habe eine Freundin" **, ich denke, die Fans werden zufrieden sein. Wenn Sie es nicht gehört haben, hören Sie bitte zu. popular (1).jpeg

Ich habe das Gefühl, dass sie oben rechts versammelt sind, liegt es daran, dass es viele schnelle Songs gibt? Ich war überrascht, dass die beiden berühmten Songs ** "Tomorrow" und "Kimi to Natsu Fes" ** ziemlich nahe beieinander lagen. ** "Koisuru" ** ist ein Up-Tempo-Song, der oft am Ende von Live-Auftritten gespielt wird, und ich war überrascht, weil ich dachte, es sei der gleiche Cluster wie ** "Kimi to Natsu Fes" **.

3. Gibt es irgendwelche Eigenschaften Ihres Lieblingssongs?

Ich habe analysiert, ob mein Lieblingslied eine Eigenschaft hat. Ich liebe alle Songs und ich kann den Unterschied nicht erkennen, also habe ich einen Song aus jedem Album ausgewählt. ** "Midnight Radio" "Flowers" "Girls in the Courtyard" "Tomorrow" "My Dawn" "Ich werde dich vergessen" ** 6 Songs, ich beabsichtige, Songs mit einer großen Auswahl an Schaukeln auszuwählen ist. myselec.jpeg Ich habe das Gefühl, dass dies auch oben rechts gesammelt ist, ** "Blumen" ** sind vollständig getrennt. Das Lied "My Dawn" ** hat eine andere Atmosphäre als ** "Tomorrow" ** und es hat eine dunkle Atmosphäre, aber es kommt oben rechts. Ich dachte, es wäre nicht sehr ähnlich, aber es könnte ein ähnliches Lied sein.

Schließlich

Ich war überrascht, dass die verkauften Songs und meine Lieblingslieder unerwartet voreingenommen waren. Dieses Mal habe ich mit meinem Lieblingssänger analysiert, aber habe ich dieselbe Analyse mit einem Künstler durchgeführt, der einen Lieblingssong hat, aber nicht viel über andere Songs weiß, und nach einem empfohlenen Song für mich gesucht. Ich dachte, es wäre interessant, </ font> auszuprobieren. Ich denke, es gibt Songs, von denen derselbe Künstler süchtig ist, und Songs, die nicht süchtig sind. Es würde also Spaß machen, wenn wir diese Songs klassifizieren könnten.

Ergänzung

Ich habe mir den Beitragssatz jeder Hauptkomponente in PCA angesehen. ![Screenshot 2020-07-15 11.42.17.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/666603/2752c565-83b6-3d41-39e0- 483b249d1a16.png) Sie können sehen, dass die erste Hauptkomponente hauptsächlich durch das Tempo und die zweite Hauptkomponente hauptsächlich durch die Tonart bestimmt wird. </ font> Die beiden Achsen von Umap sind nicht genau gleich, aber ich denke, Sie werden wahrscheinlich etwas Ähnliches sehen. Ich war etwas enttäuscht, dies am Ende der Analyse zu sehen. ..

Recommended Posts