Forscher sind möglicherweise besorgt über die Anzahl der Zitate von wissenschaftlichen Arbeiten, die sie gesehen / geschrieben haben. Sie können die Anzahl der Zitate auf Google Scholar usw. leicht überprüfen. Als Vorläufer für die Anzahl der Zitate gibt es auch die Anzahl der Leser in der Literaturverwaltungssoftware Mendeley. Zumindest scheint dies nicht bekannt zu sein, ohne Mendeley zu öffnen. Nachdem ich das Scraping geübt hatte, erstellte ich ein Skript, um die Anzahl der Mendeley-Leser zu ermitteln.
[1] Web Scraping mit Python [2] Liste der Vorsichtsmaßnahmen für das Web-Scraping
Windows Python 3
Der vollständige Text ist unten. Die Erklärung wird unten fortgesetzt.
a.py
# Modules
import requests
# Constants
Mendeley = 'https://www.mendeley.com/catalogue/'
PaperID = []
PaperID.append("5a856ac7-0d75-3560-8824-9f9061f3eb50/")
# Functions
def SandwitchedText(text_source,text_1, text_2):
return text_source.split(text_1)[1].split(text_2)[0]
for a in PaperID:
r = requests.get(Mendeley + a)
text = r.text
print("Title : " + SandwitchedText(text, "\"title\":\"", "\",\"detail"))
print("readers : " + SandwitchedText(text, "readers:", ":"))
print("citations : " + SandwitchedText(text, "citations:", ":"))
--requests ist ein Paket, das zum Scraping verwendet werden kann [1]. Beachten Sie bei der Verwendung von [2] die Scraping-Regeln.
Wenn Sie die Anzahl der Artikel in der Liste erhöhen, können Sie Informationen zu mehreren Artikeln gleichzeitig abrufen. Ich denke, es ist ein bisschen schlauer, wenn Sie ihm anstelle der URL des Papiers einen Titel geben.