[PYTHON] Essayons l'analyse! Chapitre 1: Utilisation de la technologie analytique - du point de vue commercial -

Préface

Dans cette série, nous présenterons les techniques et méthodes d'analyse. Si vous commencez avec un contenu spécialisé, vous avez tendance à être biaisé vers le contenu technique et académique, donc dans ce chapitre, je voudrais vous donner un bref aperçu de l'utilisation de la technologie d'analyse du côté commercial (par exemple, opération de publicité en ligne). Le chapitre 2 suivant donne un aperçu des techniques analytiques d'un point de vue technique.

Utilisation de la technologie d'analyse dans les opérations de publicité en ligne

Considérons l'utilisation d'une technologie d'analyse centrée sur les mots-clés suivants, en utilisant comme exemple l'opération de publicité en ligne.

A. visualisation, B. contrôle

À titre d'exemple concret, je voudrais expliquer l'utilisation de la technologie d'analyse en prenant comme exemple le processus simplifié d'opération de publicité en ligne de la figure 1 ci-dessous. Je vais expliquer brièvement le déroulement de la figure 1 afin que même ceux qui ne sont pas familiarisés avec l'opération de publicité en ligne aient une image opérationnelle.

chapter1_fig1.gif

Image opérationnelle (fig.1):

・ [Introduction au ciblage d'audience DSP / RTB] Révolution publicitaire du «cadre» aux «personnes» réalisée à l'ère du Big Data](http://www.amazon.co.jp/DSP-RTB Introduction au ciblage d'audience - À l'ère du Big Data Réalisation de la révolution publicitaire "frame" to "people"-Next-Publishing / dp / 4864780013 /) Ryuji Yokoyama, Kenichi Sugawara, Yoshiteru Umeda, Impress R & D

・ [La technologie publicitaire des bases du marketing de données au concept d'attribution](http://www.amazon.co.jp/ La technologie publicitaire-des bases du marketing de données au concept d'attribution-Sugawara- Kenichi / dp / 4798136557 /) Kenichi Sugawara, Yuichi Arizono, Yoshihiro Okada, Go Sugihara, Shosuisha

・ [Lecteur de formation professionnelle en technologie publicitaire - Optimiser l'efficacité de la publicité à l'ère du marketing numérique!](Http://www.amazon.co.jp/ Lecteur de formation professionnelle en technologie publicitaire - Optimiser l'efficacité de la publicité à l'ère du marketing numérique- Conception de logiciels / dp / 4774164291 /) Ryoji Yasushima, Yusuke Sato, Yuki Matsuda, Keiji Tokiyoshi, Takeshi Ishiguro, Taku Ogawa, société d'examen technique

A: visualisation

Il n'est pas exagéré de dire que la première étape de l'analyse des données consiste à agréger les données brutes accumulées et à visualiser (regarder) les données dans des tableaux et des graphiques. En principe, les données accumulées reflètent les faits jusqu'à présent (bien qu'il puisse y avoir du bruit). Tirer parti de la visualisation des données permet de prendre des décisions factuelles et augmente les chances de succès dans le prochain cycle économique.

Visualisation en flux opérationnel

Par exemple, considérons le processus de la figure 1. Si vous avez un historique de livraison, la technologie de visualisation vous aidera à clarifier les faits des données passées en cours (1) et à concevoir et mettre en place la livraison en cours (2). Par exemple

Technologie de visualisation

Récemment, il est devenu relativement facile de visualiser les données avec Excel (solveur, outil d'analyse, powerpivot), Google Analytics, écran de gestion du système de distribution, tableau de bord (Tableau, etc.).

Technologie d'expression pour la visualisation

Lorsque les humains ont besoin de donner un sens aux données (comme lors de la soumission d'un rapport à un client), le traçage d'une grande quantité de données en l'état rend difficile l'interprétation du rapport. Pour cette raison, il est nécessaire de concevoir un moyen de montrer les données. Si vous voulez une expression autre qu'un graphique qui peut être sortie par Excel, vous pouvez obtenir une plus large gamme d'expressions à l'aide d'outils tels que D3.js, Graphvis et R. L'utilisation de ces outils peut nécessiter des techniques de traitement des données d'entrée d'Excel.

Technologie d'agrégation pour la visualisation

En fonction de l'échelle des données et du contenu que vous souhaitez agréger, une base de données ou un traitement distribué (Hadoop est bien connu) peut être utilisé comme technologie d'analyse. Lorsqu'il est difficile de saisir les données par simple agrégation, il est souvent nécessaire de traiter les données (journal des actions utilisateur, etc.) dans le langage de programmation. Bien que l'agrégation basée sur les journaux offre une visibilité sur les détails du comportement des utilisateurs, il peut être techniquement difficile d'effectuer des agrégations à grande échelle à grande vitesse dans des conditions complexes.

B: Contrôle

Lors de la distribution de la publicité en ligne, il est important d'évaluer le résultat de la distribution et d'optimiser les paramètres de réglage (budget quotidien, CPC, etc.) chaque jour sur la figure 1: (3) à (5). La visualisation de A ci-dessus était importante pour ce faire. Bien qu'il soit possible d'effectuer manuellement la visualisation / évaluation des données et l'ajustement des paramètres de distribution dans (3) à (5), les problèmes suivants sont souvent rencontrés dans le domaine opérationnel.

Des exemples de solutions possibles à ce défi sont

Pour les processus de p1 et p3, il est possible de construire un système automatisé en utilisant la technologie introduite dans la visualisation de A (base de données, technologie de traitement distribué, etc.). Il est possible de développer un système sans utiliser de logique spéciale qui utilise l'apprentissage automatique. D'un autre côté, le processus p2 nécessite une certaine logique mathématique, dans certains cas, comment évaluer les données d'entrée. La logique d'évaluation de p2, basée sur des règles, sur des algorithmes, des hybrides, etc.

Fonctionnalités basées sur des règles et basées sur des algorithmes

Principales caractéristiques de la base de règles

Les critères KPI (CPA cible, etc.) sont définis à l'avance, plusieurs règles conçues à l'avance sont évaluées par branchement conditionnel, et les changements de budget et autres changements de paramètres de réglage utilisés pour l'opération sont exécutés à l'intérieur de la logique. .. Vous n'avez pas nécessairement besoin d'utiliser des mathématiques ou des techniques analytiques complexes. Prenons par exemple le cas où le CPA cible est de 1 000 yens et le budget à consommer en une journée est de 30 000 yens. Lorsque les données de livraison (unité campen) sont (CPA cible, budget quotidien) = (atteint, non atteint) (évaluation de branche conditionnelle), il est décidé d'augmenter le CPC (prix unitaire de l'enchère) du groupe d'annonces, ce qui favorise l'épuisement du budget. La plage de changement de CPC peut être utilisée par l'opérateur définissant à l'avance une formule simple (si le rapport est évalué sur Excel, il peut être basé sur l'expérience de l'opérateur).

mérite

Démérite

Principales caractéristiques de la base d'algorithmes

Les critères KPI (CPA cible, etc.) sont définis à l'avance, et leur respect ou non est évalué par un algorithme préconçu (mathématique), et la décision de changer le budget utilisé pour l'opération ou de modifier d'autres paramètres de réglage est la logique. Il fonctionne en interne. Par exemple, considérons le cas où le CPA cible est de 1 000 yens et le budget à consommer en une journée est de 30 000 yens, comme dans la base de règles. Lorsque les données de diffusion (unité campen) sont (CPA cible, budget quotidien) = (atteint, non atteint) (évaluation de branche conditionnelle), il est décidé d'augmenter le CPC (prix unitaire de l'enchère) du groupe d'annonces, ce qui favorise l'épuisement du budget. À ce stade, la logique interne classe toutes les campagnes et tous les groupes d'annonces à diffuser en tenant compte de la relation mutuelle entre "combien" le CPA cible est atteint et combien de budget il reste, et augmente "combien" le CPC. Decider. Des méthodes probabilistes et statistiques sont parfois utilisées pour traiter des variables avec incertitude.

mérite

Démérite

Résumé

Dans ce chapitre, nous avons examiné l'utilisation de la technologie d'analyse (visualisation et contrôle) en entreprise, en particulier dans des exemples d'opérations de publicité en ligne. La technologie de visualisation aide à lire les faits à partir des données et est utilisée pour les rapports, etc. Bien que d'énormes quantités de données visualisent le comportement détaillé des utilisateurs, il est également nécessaire de prêter attention à la technologie d'agrégation de données à grande échelle et à la manière dont les données sont affichées. La technologie de contrôle utilise une logique basée sur des règles et basée sur des algorithmes (apprentissage automatique, etc.) pour prendre en charge l'automatisation des processus. Les avantages et les inconvénients des règles / algorithmes sont complémentaires les uns des autres, et lors de leur utilisation dans la pratique, il est nécessaire de reconnaître leurs caractéristiques et d'envisager une correspondance avec les entreprises.

Dans le chapitre 2 suivant, je voudrais donner un bref aperçu des méthodes d'analyse telles que l'apprentissage automatique. Nous expliquerons chaque technologie à partir du chapitre 3.

Je suis désolé de ne pas avoir encore commencé à coder (rires) Le chapitre sans codage continuera pendant un certain temps, mais attendez-le avec impatience car nous vous donnerons toutes les connaissances utiles!

Recommended Posts

Essayons l'analyse! Chapitre 1: Utilisation de la technologie analytique - du point de vue commercial -
Essayons un script shell