Ich beschloss, den Rubin des Kanji-Satzes zu schütteln. Ich habe es dabei geschafft. Code unten
def hiragana_split(s):
#Teilen Sie den Originaltext mit Hiragana
#Liste von 50 Sounds
fifty_text = [chr(i) for i in range(12353, 12436)] + ['。', '、']
split_list = []
#Ob es Hiragana ist
start_point = 0
section = ''
for i in range(len(s) - 1):
if not (s[i] in fifty_text) == (s[i + 1] in fifty_text):
split_list += [s[start_point:i + 1]]
start_point = i + 1
return split_list
if __name__ == '__main__':
s = 'Ich habe keine Ahnung, wo ich geboren wurde. Ich erinnere mich, dass ich nur an einem dunklen und feuchten Ort geweint habe.'
print(hiragana_split(s))
# ['wo', 'Roh', 'Es war', 'Registrieren', 'Ich kann es nicht verstehen', 'Was', 'Aber', 'Dim', 'Mobbing', 'Platz', 'damit', 'Miau miau weinen', 'War dort', 'Ding', 'Nur', 'Erinnerung']
Recommended Posts