[PYTHON] J'ai essayé de résumer la modélisation graphique.

introduction

Je pensais qu'il n'y avait pas d'article particulier sur la modélisation graphique dans Qiita, Voici un bref aperçu de la modélisation graphique.

"Introduction à la modélisation graphique que je n'entends plus" http://www.slideshare.net/Kawamoto_Kazuhiko/ss-35483453

1. 1. Présentation de la modélisation graphique

1) Qu'est-ce que la modélisation graphique?

En gros, c'est un modèle de raisonnement bayésien.

(Aditionellement…) Une représentation graphique de l'indépendance conditionnelle entre les variables stochastiques. L'indépendance conditionnelle est la clé de la modélisation et des algorithmes efficaces. (Il y a une connexion, mais la combinaison n'explose pas)

2) Variable latente (variable cachée)

Pour la variable d'observation observable x En définissant la variable latente z non observable Il est possible d'exprimer des valeurs qui ne sont pas observées à l'origine.

2. Types de modélisation graphique

1) type de modèle

Champ de probabilité de Markov: graphe graphique avec graphe non orienté Réseau Basian: Modélisation graphique avec des graphiques valides

-Supplément- Intuitivement, le réseau Basian est plus facile à comprendre, ・ Champ de probabilité de Markov: les nœuds adjacents doivent être indiqués ・ Réseau de base: des dépendances se produisent entre les enfants Par conséquent, il est compliqué de déterminer s'il s'agit d'une indépendance conditionnelle. Le champ stochastique de Markov est un modèle plus simple que le réseau baysien.

2) Types de variables latentes

La variable latente du champ de probabilité de Markov est ・ S'il s'agit d'une probabilité discrète: modèle de Markov caché ・ Pour probabilité continue: filtre de Kalman (distribution normale), Filtre à particules (autre que la distribution normale) est.

Si le graphique a une structure en boucle Une solution approximative peut être dérivée en utilisant la méthode de propagation stochastique (algorithme de somme des produits).

3. 3. la mise en oeuvre

↓ L'article de commentaire est facile à comprendre. "Implémentation de la propagation de champ de probabilité / probabilité de Markov avec Python networkx" http://sinhrks.hatenablog.com/entry/2014/12/27/232506

Comme le titre l'indique, l'implémentation utilisant le module networkx en Python Il est construit sur le thème du traitement d'image.

4. Résumé

La modélisation visuelle peut être effectuée à l'aide de graphiques On dit que c'est la force de la modélisation graphique, Je pense que cette compétence est nécessaire pour démontrer nos forces.

Utilisation dans la publicité Web

Depuis que j'ai écrit une description de la modélisation graphique et des variables latentes, Comment la modélisation graphique est maintenant utilisée dans l'industrie de la publicité Un exemple d'utilisation dans la tendance actuelle des annonces natives, Je voudrais écrire sur la base de l'article et du papier (Yahoo!).

    1. article [Series] Aventures over insights (utilisation de modèles de thèmes pour la publicité native) 5e future prévision du marketing de contenu -L'aventure de la poursuite de l'intérêt latent se poursuit- http://marketing.itmedia.co.jp/mm/articles/1410/02/news001.html
  1. papier Titre de l'article: rechercher des publicités liées au contenu à l'aide d'un modèle de sujet Auteur: Koji Yamamoto Masaki Noguchi Shingo Ono Koji Tsukamoto (Yahoo Japan Corporation) http://www.anlp.jp/proceedings/annual_meeting/2014/pdf_dir/P2-14.pdf

1. 1. Introduction de l'article

1). Problèmes actuels avec le "Topic Marketing System"

a) Amélioration de la précision et de la rapidité de l'interprétation des sujets

Topic Model a permis de résumer des phrases rapidement et facilement, Pour lire l'intérêt latent à partir de la liste de mots caractéristiques incluse dans le sujet Un travail analogique humain tel que la connaissance préalable et l'imagination se produira, une amélioration est donc nécessaire.

b) Génération rapide de contenu à partir du sujet (création de contexte)

Utilise le mot vec2 (technologie de traitement du langage naturel de pointe développée et publiée par Google).

c) Fusion avec des publicités natives

Fusion avec la plateforme publicitaire native

2) Comment l'approche des intérêts potentiels changera-t-elle?

a) De l'approche statique à l'approche dynamique (anticiper les signes de changement de l'intérêt latent)

Il sera nécessaire d'utiliser un modèle d'apprentissage dynamique.

b) Ciblage plus précis

En raison de l'omnicanalisation des informations d'achat et de l'évolution de la prédiction de comportement par apprentissage automatique Des publicités de ciblage très précises sont possibles.

2. Introduction à la thèse

1) Hypothèse:

Critères de sélection des annonces ・ Mots dans le contenu ・ Similitude des mots dans la publicité Il y a.

2) Problème:

Même s'il existe une publicité adaptée au contenu Si les mots utilisés dans le contenu et la publicité sont différents La publicité n'est pas un candidat pour l'affichage.

3) Méthode proposée:

Pour résoudre le problème selon lequel les publicités appropriées ne peuvent pas être affichées en tant que candidats en raison d'une incompatibilité de mots Convertissez les mots du contenu de la page et du texte de l'annonce en thèmes. ⇒ Proposition d'une méthode pour rechercher des publicités dans l'espace thématique converti.

4) Nouveauté du papier:

En combinant la recherche de mots et la recherche de sujets, Il a été démontré que la précision de la recherche publicitaire est améliorée par rapport au cas où les deux sont utilisés seuls.

5) Supplément (traitement du langage naturel et modèle de sujet)

・ Traitement du langage naturel: Qu'est-ce que le «traitement du langage naturel» également utilisé pour les smartphones? (http://logmi.jp/45207)

・ Modèle de thème: Début du modèle de thème (https://speakerdeck.com/yamano357/tokyowebmining46th) Je pense que vous pouvez le comprendre d'une manière ou d'une autre en lisant.

Recommended Posts

J'ai essayé de résumer la modélisation graphique.
J'ai essayé de résumer la commande umask
J'ai essayé de résumer SparseMatrix
LeetCode j'ai essayé de résumer les plus simples
J'ai essayé de résumer la forme de base de GPLVM
J'ai essayé de résumer les opérations de chaîne de Python
J'ai essayé de déplacer le ballon
J'ai essayé d'estimer la section.
[Première API COTOHA] J'ai essayé de résumer l'ancienne histoire
J'ai essayé de résumer le code souvent utilisé dans Pandas
J'ai essayé de résumer les commandes souvent utilisées en entreprise
[Apprentissage automatique] J'ai essayé de résumer la théorie d'Adaboost
J'ai essayé de résumer comment utiliser à nouveau le référentiel EPEL
J'ai essayé de résumer la gestion des exceptions Python
J'ai essayé de reconnaître le mot de réveil
Entrée standard Python3 que j'ai essayé de résumer
J'ai essayé d'estimer le rapport de circonférence π de manière probabiliste
J'ai essayé de toucher l'API COTOHA
J'ai essayé de résumer les modules d'Ansible - l'édition Linux
[Linux] J'ai essayé de résumer les commandes de confirmation des ressources
J'ai essayé de résumer les commandes utilisées par les ingénieurs débutants aujourd'hui
J'ai essayé de résumer la méthode de mise en œuvre fréquemment utilisée de pytest-mock
J'ai essayé de déboguer.
J'ai essayé Web Scraping pour analyser les paroles.
J'ai essayé d'optimiser le séchage du linge
J'ai essayé de sauvegarder les données avec discorde
J'ai essayé de corriger la forme trapézoïdale de l'image
Qiita Job J'ai essayé d'analyser le travail
J'ai essayé de mettre en œuvre le problème du voyageur de commerce
J'ai essayé de vectoriser les paroles de Hinatazaka 46!
J'ai essayé de résumer jusqu'à ce que je quitte la banque et devienne ingénieur
J'ai essayé de résumer diverses phrases à l'aide de l'API de synthèse automatique "summpy"
J'ai essayé de résumer la manière logique de penser l'orientation objet.
J'ai essayé de résumer les commandes Linux utilisées par les ingénieurs débutants aujourd'hui - Partie 1-
J'ai essayé d'entraîner la fonction péché avec chainer
J'ai essayé de représenter graphiquement les packages installés en Python
J'ai essayé de résumer la relation entre les distributions de probabilité à partir de la distribution de Bernoulli
J'ai essayé d'apprendre PredNet
J'ai essayé de résumer comment utiliser matplotlib de python
J'ai essayé de toucher un fichier CSV avec Python
J'ai essayé de prédire le match de la J League (analyse des données)
J'ai essayé d'organiser SVM.
J'ai essayé de résoudre Soma Cube avec python
J'ai essayé d'implémenter PCANet
J'ai essayé d'approcher la fonction sin en utilisant le chainer
J'ai essayé la bibliothèque changefinder!
J'ai essayé de résumer quatre méthodes d'optimisation de réseau neuronal
J'ai essayé de mettre Pytest dans la bataille réelle
[Python] J'ai essayé de représenter graphiquement le top 10 des ombres à paupières
J'ai essayé de réintroduire Linux
J'ai essayé de visualiser les informations spacha de VTuber
J'ai essayé de présenter Pylint
J'ai essayé de résumer comment utiliser les pandas de python
J'ai essayé d'effacer la partie négative de Meros
J'ai essayé de résoudre le problème avec Python Vol.1
J'ai essayé de simuler la méthode de calcul de la moyenne des coûts en dollars
J'ai essayé de refaire la factorisation matricielle non négative (NMF)
Je n'ai pas compris le redimensionnement de TensorFlow, alors je l'ai résumé visuellement.