Eine Person, die eine Universität in Tokio besucht. Es ist ein Jahr her, seit ich an die Universität gekommen bin, und sieben Monate sind vergangen, seit ich angefangen habe zu programmieren. Normalerweise mache ich mit meinen Freunden Apps und nehme an maschinellen Lernwettbewerben teil. Ich habe gestern von einem Ereignis namens [Qiita x COTOHA API Present Plan] erfahren. Ich möchte einen Mac, also schreibe ich meinen ersten Artikel mit dem Ziel, einen Preis zu gewinnen. : fist: (Heute ist die Frist ...: angel_tone2 :)
Die Universität legt viele Berichte vor. Dies ist ein sehr schmerzhaftes Ereignis. : Stirnrunzeln2:
Eine Möglichkeit, die Dinge zu vereinfachen, besteht darin, die Berichte der Leute zusammenzudrücken. Wenn Sie jedoch jedes Wort drücken, werden Sie enttäuscht sein. Daher fragte ich mich, ob ich den Ausdruck ändern könnte, während ich den Inhalt des Berichts behalte.
Dieses Mal werde ich den folgenden Text schreiben (ein Teil des Berichts, den ich letzten Monat geschrieben habe).
Es ist kein guter Satz, den ich drücken möchte ... Es gibt viele "wieder" ...: Schweiß:
Verwenden Sie ein Synonymwörterbuch oder GCP, um nach und nach mit dem ursprünglichen Ausdruck zu spielen. Das Ergebnis ist dies.
Der Ausdruck hat sich an einigen Stellen geändert. Die dritte Regel wird befolgt, aber das "Nationale Institut für soziale Sicherheit und Bevölkerungsfragen" wurde in "Nationales Institut für Bevölkerung und soziale Sicherheit" geändert. Es entspricht nicht dem Namen der Person oder der Organisation.
Mit voller Zufriedenheit ist die COTOHA API hier. COTOHA API-Link Die COTOHA-API ist ein Dienst, der verschiedene APIs für die Verarbeitung natürlicher Sprache und die Sprachverarbeitung wie Syntaxanalyse, Korrespondenzanalyse, Schlüsselwortextraktion, Spracherkennung und Zusammenfassung bereitstellt. Das japanische Wörterbuch ist das Ergebnis von 40 Jahren Forschung der NTT Group. Sie können die erweiterte Analyse mit API problemlos verwenden, indem Sie mithilfe der Technologie die Bedeutung von mehr als 3000 Arten von Wörtern und Wörtern klassifizieren. " Unter dieser hervorragenden API werden wir dieses Mal die eindeutige Ausdrucksextraktions-API verwenden, um den Namen der Person und der Organisation zu bestimmen.
Von hier Sie können sich einfach registrieren. Überprüfen Sie nach der Registrierung hier die API-BASE-URL, die CLIENT-ID und das CLIENT-Geheimnis.
get_token.py
data = {
"grantType": "client_credentials",
"clientId": "Your CLIENT ID",
"clientSecret": "Your CLIENT secret"
}
str_json = json.dumps(data)
url = "https://api.ce-cotoha.com/v1/oauth/accesstokens"
headers={
"Content-Type": "application/json"
}
result=requests.post(url,headers=headers,data=str_json)
print(result.text)
Jetzt können Sie das Zugriffstoken sehen.
get_koyu.py
def get_koyu_(text, token):
data = {
"sentence":text,
"type": "default"
}
headers = {
"Content-Type":"application/json",
"Authorization":"Bearer " + token
}
str_json = json.dumps(data)
url = "https://api.ce-cotoha.com/api/dev/nlp/v1/ne"
rr=requests.post(url,headers=headers,data=str_json)
result = json.loads(rr.text)["result"]
Sie können den eindeutigen Ausdruck im Satz mit dem obigen Code extrahieren.
[{'begin_pos': 3, 'end_pos': 8, 'form': 'Ministerium für Gesundheit und Arbeit', 'std_form': 'Ministerium für Gesundheit und Arbeit', 'Klasse': 'ORG', 'erweiterte_Klasse': '', 'Quelle ':' basic '}, {' begin_pos ': 42,' end_pos ': 47,' form ':' 2017 ',' std_form ':' 2017 ',' class ':' DAT ',' extended_class ':' ',' source ':' basic '}, {' begin_pos ': 84,' end_pos ': 88,' form ': '50 Jahre später', 'std_form': '50 Jahre später ',' class ' : 'DAT', 'extended_class': '', 'source': 'basic'}, {'begin_pos': 156, 'end_pos': 170, 'form': 'Nationales Institut für soziale Sicherheit und Bevölkerungsprobleme', ' std_form ':' Nationales Institut für soziale Sicherheit und Bevölkerungsprobleme ',' Klasse ':' ORG ',' erweiterte_Klasse ':' ',' Quelle ':' Basis '}, ...
Es gibt Kategorien wie Ortsname, Personenname und Organisationsname, sodass Sie sich darauf verlassen können, um den Ortsnamen, den Personennamen und den Organisationsnamen zu bestimmen.
Schreiben Sie danach den Code neu, um diese eindeutigen Ausdrücke nicht zu ändern.
Vor dem Pucken
Nach dem Pucken
Die Wörter in "" und der Organisationsname bleiben gleich, aber nur die Ausdrücke haben sich geändert. Es gibt einige Feinheiten, aber ich werde es vorerst tun.
Die tatsächlich abgeschlossene App ist hier.