[PYTHON] Wie stark ist dein Qiita? Statistiken über die Anzahl der in den Daten angezeigten Beiträge

Überblick

Vorwort

In letzter Zeit war es weniger wahrscheinlich, dass ich Programme zu Hause schlug, und wie hoch sind meine technischen Fähigkeiten? Ich fing an zu denken. Also begann ich zu denken: "Lassen Sie uns unser Bestes geben, bis Contribute bis Ende dieses Jahres 1000 in Qiita erreicht", um meine technischen Fähigkeiten zu verbessern. Jetzt habe ich jedoch ungefähr 157 Beiträge. Wie schwierig ist es angesichts dessen? Ist es realistisch? Ich dachte über die Machbarkeit nach. Daher habe ich statistische Daten über die Anzahl der Beiträge von Qiita gesammelt und untersucht, wie schwierig es war.

Methode

Sie können nacheinander crawlen, aber ich habe die gewünschten Daten von der Site QiitaUserRanking extrahiert.

https://qiita-user-ranking.herokuapp.com/

Die Anzahl der Beiträge und die Daten der Anzahl der Personen wurden zusammengefasst. Zuallererst ist es leicht zu kratzen.

wget -O - https://qiita-user-ranking.herokuapp.com/chart | grep Bar | grep -o "\[.*\]" | sed "s/\],\[/\n/g" | grep -o "[0-9][0-9]*,[0-9][0-9]*" > data.csv

Als Format von data.csv

Anzahl der Beiträge,そのAnzahl der Beiträgeのユーザーの人数

Es ist. Diese Daten werden entsprechend der Anzahl der Beiträge konvertiert und in das Perzentil konvertiert. Schreiben Sie dann ein Python-Skript, das gemäß der Qiita-Notation ausgegeben wird.

qiita_stats.py


if __name__=="__main__":
    data = [
        tuple(map(int,l.split(",")))
        for l
        in open("data.csv")
    ]

    all_num = sum(l[1] for l in data)

    for num in [10,20,30,40,50,60,70,80,90,100,200,300,400,500,600,700,800,900,1000,2000,3000,4000,5000]:
        under = sum(l[1] for l in data if l[0] < num)
        print "| %5d | %5d | %5.2f |" % (num,under,(1-float(under)/all_num)*100)
    
    #Für das Ranking
    num = 159
    under = sum(l[1] for l in data if l[0] < num)
    
    print "num %5d : %5d / %5d : %5.2f%%"  % (num,under,all_num,(1-float(under)/all_num)*100)

Hier ist die Ausgabetabelle.

Anzahl der Beiträge Anzahl der Personen Perzentil
10 7767 67.19
20 11156 52.88
30 13046 44.89
40 14307 39.57
50 15275 35.48
60 16083 32.06
70 16735 29.31
80 17231 27.22
90 17686 25.29
100 18065 23.69
200 20174 14.78
300 21092 10.91
400 21684 8.41
500 22063 6.80
600 22347 5.61
700 22556 4.72
800 22718 4.04
900 22840 3.52
1000 22943 3.09
2000 23367 1.30
3000 23515 0.67
4000 23573 0.43
5000 23606 0.29

Es gibt 7767 Benutzer mit weniger als 10 Beiträgen. Daher gehören Benutzer mit 10 Beiträgen zu den Top-67,19% der Qiita-Benutzer. Ich werde die Ansicht vertreten. In einem anderen Beispiel gibt es 22063 Benutzer mit weniger als 500 Beiträgen. Daher liegen Benutzer mit 500 Beiträgen unter den besten 6,80%.

Erwägung

Laut QiitaUserRanking gibt es 23.674 Personen mit einem Beitrag von 1 oder mehr. Wie Sie der obigen Tabelle entnehmen können, scheinen Benutzer mit 20 Beiträgen unter den besten 52,88% zu sein. Daher ist ersichtlich, dass der obere und der untere Rang geteilt werden, wenn die Anzahl der Beiträge etwa 20 beträgt. Derzeit beträgt meine aktuelle Anzahl von Beiträgen 159. Als Ergebnis der Berechnung mit dem Skript,

num   159 : 19496 / 23674 : 17.65%

Die Daten kamen heraus. Daher gibt es 19.496 Benutzer mit weniger als 159 Beiträgen. Und ** mein Ranking scheint unter den besten 17,65% zu sein. ** **.

Impressionen

Ich zielte

** Benutzer mit 1000 Beiträgen gehören zu den Top 3% von Qiita. ** **.

Ich fand es ziemlich hart. Es ist eine persönliche Geschichte, aber mein Artikel hat einen durchschnittlichen Beitrag von ungefähr 14 pro Artikel. Daher sind 72 Artikel erforderlich, um ** Contribute to 1000 festzulegen. ** Seit 2017 wird für 7 Monate berechnet, ** monatliche Produktion 10-11 Artikel. Wenn Sie einen Artikel ungefähr dreimal pro Woche schreiben, wird er pünktlich sein. ** Nein, das ist schmerzhaft. Wenn überhaupt, wollte ich einen Artikel mit einer etwas höheren Qualität oder einer starken Anziehungskraft schreiben und die Anzahl der Beiträge pro Artikel erhöhen.

Recommended Posts

Wie stark ist dein Qiita? Statistiken über die Anzahl der in den Daten angezeigten Beiträge
Ändern Sie in Python das Verhalten der Methode je nach Aufruf
So ermitteln Sie die Anzahl der Stellen in Python
So finden Sie die optimale Anzahl von Clustern für k-means
Zählen Sie die Anzahl der Zeichen im Text in der Zwischenablage auf dem Mac
[Homologie] Zählen Sie mit Python die Anzahl der Löcher in den Daten
So erhalten Sie einen Überblick über Ihre Daten in Pandas
Wie ist der Fortschritt? Lassen Sie uns mit dem Boom in Python weitermachen
Holen Sie sich die Anzahl der Ansichten von Qiita
Holen Sie sich die Anzahl der Leser von Artikeln über Mendeley in Python
[Java] [Linux] Untersuchen, wie die Implementierung von untergeordneten Java-Prozessen unter Linux realisiert wird
So zählen Sie die Anzahl der Elemente in Django und geben sie in die Vorlage aus
Legen Sie die Obergrenze für die Anzahl der Wiederholungen rekursiver Funktionen in Python fest
Geben Sie die Anzahl der CPU-Kerne in Python aus
Finden Sie die Anzahl der Tage in einem Monat
Die Geschichte des Lesens von HSPICE-Daten in Python
Übergang von Baseball aus Daten gesehen
Überprüfen Sie den Status der Daten mit pandas_profiling
Wie identifiziere ich das Element mit der geringsten Anzahl von Zeichen in einer Python-Liste?
Ermitteln Sie die maximale Anzahl von Zeichen in mehrzeiligem Text, die in einem Datenrahmen gespeichert sind
So überprüfen Sie in Python, ob sich eines der Elemente einer Liste in einer anderen Liste befindet
Lassen Sie uns über das Wetter in Ihrer Lieblingsgegend von Yahoo Wetter auf LINE informiert werden!
So zählen Sie die Anzahl der Vorkommen jedes Elements in der Liste in Python mit der Gewichtung
Veröffentlichte die Anzahl der neuen Corona-Positiven in Tokio an Slack (auf Heroku bereitgestellt)
So geben Sie die Anzahl der ANSICHTEN, Likes und Bestände von Artikeln aus, die in Qiita an CSV gesendet wurden (erstellt mit "Python + Qiita API v2")
Zählen Sie die Anzahl der Parameter im Deep-Learning-Modell
Versuchen Sie, die Anzahl der Likes auf Twitter zu schätzen
Über die Ineffizienz der Datenübertragung im luigi on-memory
Ermitteln Sie die Größe (Anzahl der Elemente) von Union Find in Python
Den Inhalt der Daten in Python nicht kennen
Unterschied in den Ergebnissen abhängig vom Argument von multiprocess.Process
Anzeigen des regionalen Netzes des Government Statistics Office (eStat) in einem Webbrowser
So geben Sie eine unendliche Anzahl von Toleranzen in der Überprüfung der numerischen Argumentvalidierung von argparse an
Lassen Sie uns über das Wetter in Ihrer Lieblingsgegend von Yahoo Wetter auf LINE informiert werden! ~ TEIL2 ~
Das Bild wird in der lokalen Entwicklungsumgebung angezeigt, aber das Bild wird nicht auf dem Remote-Server von VPS angezeigt.
So berechnen Sie die Summe oder den Durchschnitt von Zeitreihen-CSV-Daten in einem Augenblick
Wie man die Anzahl der GPUs aus Python kennt ~ Hinweise zur Verwendung von Multiprocessing mit pytorch ~
Darstellung der Verteilung der Bakterienzusammensetzung aus Qiime2-Analysedaten in einem Box-Whisker-Diagramm
So löschen Sie "(base)", das im Terminal angezeigt wird, wenn Anaconda auf einem Mac installiert ist