[PYTHON] Verarbeitung natürlicher Sprache für vielbeschäftigte Menschen

Übersicht für vielbeschäftigte Menschen

Inspiriert von dem Artikel Erzprogramm Ugokas Omae Genshijin Naru habe ich versucht, die Sprache zu verarbeiten. Ich mag die alte Geschichte "Serie für vielbeschäftigte Menschen" [^ 1], deshalb habe ich die zusammenfassende API von COTOHA API verwendet, um sie berühmt zu machen. Ich habe versucht, einige Songs für vielbeschäftigte Leute zu machen.

Beispiel: "Pulverschnee" für vielbeschäftigte Menschen [^ 2]

$ python3 youyaku.py < konayuki.txt
Lalarai. Pulverschnee. Wenn dein Herz weiß gefärbt ist.

Es scheint nicht "Ich komme nicht" zu sein, aber ich bin überzeugt (?), Dass es Orte gibt, an denen es häufig vorkommt!

Umgebung

Python 3.6.9

Implementierung

Mit der COTOHA API Summary API (https://api.ce-cotoha.com/contents/reference/apireference.html#summarization) in 3 Zeilen zusammenfassen. Der größte Teil des Codes wurde unter Bezugnahme auf den Artikel von Genshijin geschrieben, aber BASE_URL wird neu geschrieben und die Parameter werden zur Zusammenfassung geändert. Wenn ich die Texte so geben würde, wie sie waren, würden sie sie überhaupt nicht zusammenfassen, also habe ich "."

Code

Klicken Sie hier, um es zu erweitern.

youyaku.py



import requests
import json
import sys

BASE_URL = "https://api.ce-cotoha.com/api/dev/"
CLIENT_ID = "Geben Sie die mit der COTOHA-API erhaltene ID ein"
CLIENT_SECRET = "Geben Sie das von der COTOHA API erhaltene Passwort ein"


def auth(client_id, client_secret):
    token_url = "https://api.ce-cotoha.com/v1/oauth/accesstokens"
    headers = {
        "Content-Type": "application/json",
        "charset": "UTF-8"
    }

    data = {
        "grantType": "client_credentials",
        "clientId": client_id,
        "clientSecret": client_secret
    }
    r = requests.post(token_url,
                      headers=headers,
                      data=json.dumps(data))
    return r.json()["access_token"]


def summary(document, access_token, sent_len):
    base_url = BASE_URL
    headers = {
        "Content-Type": "application/json",
        "charset": "UTF-8",
        "Authorization": "Bearer {}".format(access_token)
    }
    data = {
        "document": document,
        "sent_len": sent_len
    }
    r = requests.post(base_url + "nlp/beta/summary",
                      headers=headers,
                      data=json.dumps(data))
    return r.json()


if __name__ == "__main__":
    document = "Die Texte sind hier aufgelistet"
    args = sys.argv
    if len(args) >= 2:
        document = str(args[1])

    access_token = auth(CLIENT_ID, CLIENT_SECRET)
    summary_document = summary(document, access_token, 3)
    result_list = list()
    for chunks in summary_document['result']:
      result_list.append(chunks)

    print(''.join(result_list))

Ergebnis

"Ondo" Mito Komon "Ah, es gibt Tränen im Leben" [^ 3]

$ python3 youyaku.py < mitokomon.txt
Wenn Sie nicht gerne weinen, gehen Sie jetzt. Es gibt Tränen und Lächeln in meinem Leben. Lass uns auf der Suche nach etwas leben.

"Doraemon no Uta" [^ 4]

$ python3 youyaku.py < doraemon.txt
Jeder, jeder wird wahr werden. Ann An Ann. Ich mag Doraemon wirklich.

"Das ist wichtig" [^ 5]

$ python3 youyaku.py < soregadaiji.txt
Nicht verlieren, nicht werfen, nicht weglaufen, glauben. Wenn es ruiniert zu sein scheint. Das ist das Wichtigste.

"Gatchamans Lied" [^ 6]

$ python3 youyaku.py < gachaman.txt
Gatchaman. Fliege. gehen.

"Mysterious Adventure" [^ 7]

$ python3 youyaku.py < makafushigi.txt
DRAGONBALL。try。fly。

"Geburt des Heldenkönigs!" [^ 8]

$ python3 youyaku.py < yushaou.txt
Gagagatsu. Gaogaigar!.. Gagagaga.

Zusammenfassung

Ich habe versucht, verschiedene Meisterwerke zusammenzufassen. Gute Songs sind kurz aber tief

[^ 1]: [Nikoniko Encyclopedia: Series for Busy People](https://dic.nicovideo.jp/a/%E5%BF%99%E3%81%97%E3%81%84%E4%BA % BA% E5% 90% 91% E3% 81% 91% E3% 82% B7% E3% 83% AA% E3% 83% BC% E3% 82% BA) [^ 2]: "Powder Snow" Text: Ryota Fujimaki [^ 3]: "Otodo" Mito Komon "Ah, es gibt Tränen im Leben" Text: Michio Yamagami [^ 4]: "Doraemon no Uta" Text: Kusube Ko [^ 5]: "Das ist wichtig" Text: Toshiyuki Tachikawa [^ 6]: "Gatchaman no Uta" Text: Ryuko Production Literary Club [^ 7]: "Maya Mysterious Adventure" Text: Yuriko Mori [^ 8]: "Geburt des Heldenkönigs!" Text: Yoshitomo Yone

Recommended Posts