https://qiita.com/dely13/items/5e949a384161c961d8ce Wenn Sie diesen Artikel lesen und nach dem Üben von ~~ play ~~ selbst ausprobieren, ist das Ergebnis anders → Dieser Artikel 2017 Also habe ich versucht, das Neueste herauszubringen (Stand: 29. Juni 2020, 10:00 Uhr)
Ich werde den Artikel von @ dely13 so verwenden, wie er ist
dely13.py
import pandas as pd
import requests
import numpy as np
import seaborn as sns
from scipy import stats
import matplotlib.pyplot as plt
%matplotlib inline
url = "http://api.syosetu.com/novelapi/api/"
#Geben Sie die API-Parameter im Wörterbuch an
#Unter dieser Bedingung werden Daten im JSON-Format in der Reihenfolge der Gesamtbewertung ausgegeben.
payload = {'of': 't-gp-gf', 'order': 'hyoka','out':'json'}
st = 1
lim = 500
data = []
while st < 2000:
payload = {'of': 't-gp-gf-n', 'order': 'hyoka',
'out':'json','lim':lim,'st':st}
r = requests.get(url,params=payload)
x = r.json()
data.extend(x[1:])
st = st + lim
df = pd.DataFrame(data)
#Vorverarbeitung ('year'Spalte hinzufügen,'title_len'Spalte hinzufügen)
df['general_firstup'] = pd.to_datetime(df['general_firstup'])
df['year'] = df['general_firstup'].apply(lambda x:x.year)
df['title_len'] = df['title'].apply(len)
Bitte lesen Sie den Originalartikel für Details, da es wirklich so ist, wie es ist
Im Jahr 2017
Interessante Zahlen. Der Durchschnittswert beträgt 17 Zeichen, was der Anzahl der Zeichen im Haiku entspricht. Mit anderen Worten, der Titel von Naruro war Haiku! Das Geräusch alter Teiche und Frösche, die ins Wasser springen ...
Mir wurde gesagt, aber im Jahr 2020 ...?
df['title_len'].hist()
df['title_len'].describe()
Histogrammdiagramm df ['title_len']. Hist ()
Daten
df ['title_len']. Description ()
count 2000.000000 mean 24.179500 std 15.528356 min 2.000000 25% 12.000000 50% 21.000000 75% 32.000000 max 100.000000 Name: title_len, dtype: float64
Wwwwwww, das durchschnittlich 7 Zeichen erhöht
per_year.py
title_by_year = df.groupby('year')['title_len'].agg(['mean','count','std']).reset_index()
#Handlung
title_by_year.plot(x='year',y='mean')
#Daten
title_by_year
Plot title_by_year.plot (x = 'Jahr', y = 'Mittelwert')
* Mittelwert
= Durchschnitt
Aggregieren Sie "title_by_year"
year | mean | count | std |
---|---|---|---|
2008 | 7.500000 | 2 | 2.121320 |
2009 | 12.428571 | 7 | 8.182443 |
2010 | 10.882353 | 17 | 5.278285 |
2011 | 10.180000 | 50 | 4.684712 |
2012 | 13.294737 | 95 | 6.963237 |
2013 | 14.115942 | 138 | 8.541930 |
2014 | 16.065476 | 168 | 8.780176 |
2015 | 18.218009 | 211 | 9.701245 |
2016 | 21.577358 | 265 | 12.326472 |
2017 | 24.476015 | 271 | 11.750113 |
2018 | 29.425856 | 263 | 13.890288 |
2019 | 31.327327 | 333 | 15.861156 |
2020 | 40.483333 | 180 | 22.348053 |
** Der Titel von 2019 wird ein kurzes Lied sein ** Die Person, die ich im Artikel 2017 erraten habe, ist unglaublich. Es ist Don Pisha.
Da es eine große Sache ist, werde ich versuchen, das Maximum und das Minimum zu finden
title_by_year = df.groupby('year')['title_len'].agg(['mean','min','max']).reset_index()
#Handlung
title_by_year.plot(x='year')
#Daten
title_by_year.plot
Plotten Sie title_by_year.plot (x = 'year')
Daten title_by_year
year | mean | min | max |
---|---|---|---|
2008 | 7.500000 | 6 | 9 |
2009 | 12.428571 | 5 | 25 |
2010 | 10.882353 | 2 | 23 |
2011 | 10.180000 | 4 | 26 |
2012 | 13.294737 | 3 | 40 |
2013 | 14.115942 | 3 | 54 |
2014 | 16.065476 | 4 | 63 |
2015 | 18.218009 | 3 | 59 |
2016 | 21.577358 | 2 | 77 |
2017 | 24.476015 | 4 | 69 |
2018 | 29.425856 | 5 | 74 |
2019 | 31.327327 | 4 | 100 |
2020 | 40.483333 | 4 | 100 |
Überschreiten diese 100-Zeichen-Daten nicht die Anzahl der Zeichen ...?
max_100.py
df[['ncode','title','year','title_len']].set_index('ncode').query('title_len==100')
ncode | title | year | title_len |
---|---|---|---|
N7855GF | Als inkompetent behandelt und von meiner Kindheitsparty verbannt, nutze ich das Geschenk "Übersetzung" voll aus.... | 2020 | 100 |
N6203GE | Ein Schmied, der aus der Diktatur verbannt wurde, tatsächlich unter dem Schutz der "Schmiedegöttin", plötzlich mit voller Ausrüstung der "Super Legendary Class" -Rüstung... | 2020 | 100 |
N0533FS | [Serienversion] Ich habe gesehen, wie das jagende Idol mit einem gutaussehenden Mann spazieren ging, also habe ich mir einen Teilzeitjob gekauft... | 2019 | 100 |
N4571GF | In der 7. Woche der Runde erfuhr ich, dass ich mit meinen gläubigen Freunden ausgestattet war, und in der 8. Runde feierte ich aktiv... | 2020 | 100 |
... das sind nicht mehr als 100 Zeichen ...?
Als ich nach dem Schreiben des Artikels nachgeschlagen habe, waren es genau 100 Zeichen
Gibt es eine Zeichenbeschränkung? Das ist es, was ich am Limit kämpfe.
Im Gegenteil, ich interessierte mich für Kurztitel
mini_len.py
df.groupby('title_len')['title_len'].agg(['count']).head(9).T
Liste der Korrespondenz zwischen der Anzahl der Zeichen und der Anzahl der Werke Da es länger geworden ist, wird es horizontal platziert
title_len | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|
count | 2 | 8 | 18 | 35 | 41 | 38 | 64 | 75 | 89 |
title2_4.py
df[['title','year','title_len']].set_index('title').sort_values('title_len').query('title_len<5')
4 Zeichen sind einige Auszüge
title | year | title_len |
---|---|---|
Brief | 2016 | 2 |
Dämmerung | 2010 | 2 |
Bogen und Schwert | 2013 | 3 |
Wasser Grund | 2012 | 3 |
Grabkönig! | 2013 | 3 |
Freund aus Kindertagen | 2016 | 3 |
Sucher | 2013 | 3 |
Schatten des Turms | 2012 | 3 |
Vernichtungsperson | 2015 | 3 |
Katze und Drache | 2013 | 3 |
Vergessener Heiliger | 2020 | 4 |
J/53 | 2012 | 4 |
Schwarzer Dämonenkönig | 2011 | 4 |
Mein Diener | 2019 | 4 |
Mobs Liebe | 2015 | 4 |
Salbei Enkel | 2015 | 4 |
Siebte | 2014 | 4 |
Sogar ein paar Buchstaben sind berühmt. Ich war beeindruckt von den ehemaligen Moba-Leuten, dass die vier Buchstaben einen "Titel" enthielten.
Ist es der Einfluss der Animation mobiler Romane, den viele Anfänger eingeben, wenn nicht sogar so viel wie Moba (derzeit Ebu)? Ich wurde von Moba trainiert. Selbst wenn es etwas schwierig zu lesen ist, werde ich es lesen, wenn der Inhalt interessant ist, aber trotzdem ist der Titel lang. Ich bin süchtig nach diesem und diesem sind ebenfalls lange Titel. (Ebudato this * Stemmer)
Ich wollte verschiedene Dinge ausprobieren, weil ich die Suchbedingungen mit der Naro-API eingrenzen kann. Was ist, wenn Sie mehr als 2000 Elemente extrahieren möchten ...
Recommended Posts