[PYTHON] [Enquête] Kaggle - Résumé de la solution Quora 4e place

Kaggle --Quora Question Pairs [^ 1] Solution de 4e place [^ 2] article de recherche.

Titre: [4th] Overview of 4th-Place Solution Author: HouJP Discussion URL: https://www.kaggle.com/c/quora-question-pairs/discussion/34349 Code: https://github.com/HouJP/kaggle-quora-question-pairs

couler

  1. Prétraitement
  2. Extraction de fonctionnalités
  3. Construction de modèles
  4. Post-traitement

image.png Cité de HouJP / kaggle-quora-question-pairs [^ 4]

Prétraitement

Extraction de caractéristiques

--Plus de 1400 fonctionnalités --Statistiques: ratio de mots communs, longueur de phrase, nombre de mots, etc. --Traitement du langage naturel: analyse des arbres de syntaxe, nombre de mots négatifs, etc.

Construction de modèles

--Neural net, XGBoost, LightGBM, LogisticRegression (LB = 0,122 à 0,124 est le meilleur pour un seul modèle) --140 empilement de modèles de modèles (amélioration de 0,007 sur LB)

Post-traitement

References

Recommended Posts

[Enquête] Kaggle - Résumé de la solution Quora 5e place
[Enquête] Kaggle - Résumé de la solution Quora 4e place
[Enquête] Kaggle - Résumé de la solution Quora 3e place
[Enquête] Kaggle - Récapitulatif de la solution Quora 2nd place
[Enquête] Kaggle --Data Science Bowl 2017, solution pour la 2e place
Résumé de Kaggle: Outbrain # 1
Résumé lié à Kaggle
Résumé de Kaggle: Redhat (Partie 1)
Résumé de Kaggle: BOSCH (noyaux)
Résumé Kaggle: BOSCH (gagnant)
Résumé de Kaggle: Redhat (partie 2)
Gagnez avec Kaggle en pratiquant "La technologie d'analyse des données qui gagne avec kaggle" --Kaggle M5 Forecasting Accuracy 59e (sur 5558) Résumé de la solution