Zugriff auf ein bestimmtes Quip-Dokument mit der Quip-API, um den in einer Tabelle in Quip gespeicherten Text zu analysieren. Notieren Sie sich die Zugriffsmethode zu diesem Zeitpunkt.
Holen Sie sich Token mit POSTMAN. Weitere Informationen finden Sie unter Quip API-Dokumentation.
GET https://platform.quip.com/1/users/current
Holen Sie sich Ordner und Dokumente mit der Funktion "Tabellenkalkulation abrufen" unter Github.
quip_analysis.py
import quip
# access to the quip
client = quip.QuipClient(access_token=<access_token>)
# Get your thread_id from the URL of your document
user = client.get_authenticated_user()
starred = client.get_folder(user["starred_folder_id"])
# get the spreadsheet
spreadsheet = client.get_second_spreadsheet(thread_id=<thread_id>)
parsedSpreadsheet = client.parse_spreadsheet_contents(spreadsheet)
Da Sie die Daten im Spread-Format erhalten können, können Sie sie im Datenrahmen ablegen.
quip_analysis.py
# create the dataframe
counter = 0
spreadsheetData = []
colNames = []
for rows in parsedSpreadsheet["rows"]:
cells = rows["cells"]
rowData = []
for key, value in cells.items():
if counter == 0:
colNames.append(key)
rowData.append(value['content'])
spreadsheetData.append(rowData)
counter += 1
l = pd.DataFrame(spreadsheetData, columns=colNames)
Danach wurden häufige Wörter auf dem Dokument durch morphologische Analyse extrahiert.
Recommended Posts