introduction

Le nombre de personnes infectées par la nouvelle infection à coronavirus (COVID-19) s'est propagé de la Chine vers le monde entier et, au 14 mars 2020, le nombre de personnes infectées est de 145637 et le nombre de décès est de 5436. Cependant, si l'on regarde la situation au Japon, le nombre de personnes infectées est de 734, soit seulement 9,1% de 8086 en Corée du Sud et 4,2% de 17 660 en Italie. Il a été souligné que la raison de cette nette différence est que le Japon limite le nombre de tests PCR. C'est la théorie. Par conséquent, combien serrez-vous réellement? Quelle est la signification de la compression? N'est-ce pas un autre pays surexaminant et effondré médical? , Etc. suscitent la controverse. Cependant, comme il n'y a pas beaucoup de discussions quantitatives, il semble que la théorie émotionnelle se développe à travers la télévision et Internet, ce qui empêche une compréhension correcte. Par conséquent, dans cet article, basé sur le théorème de Bayes, ** je me suis concentré sur l'importance de réduire les tests PCR **.

Qu'est-ce qu'un test PCR?

Tout d'abord, jetons un coup d'œil à ce qu'est un test PCR (Polymerase Chain Reaction). Manuel de l'Institut national des maladies infectieuses et [Guide for PCR testing of Takara Bio](http: // En se référant à www.takara-bio.co.jp/kensa/pdfs/book_1.pdf) etc., le plan de l'inspection est le suivant. En bref, il semble positif que la région caractéristique du virus soit augmentée en décomposant le double brin d'ADN, en amplifiant un site spécifique et en répétant, et cette partie peut être observée visuellement par électrophorèse. Il semble que si seule la partie qui est vraiment caractéristique du virus peut être suffisamment amplifiée (2 ^ N fois), elle peut être détectée avec une grande précision (la précision sera discutée plus loin). Cependant, il semble que la précision de détection puisse chuter en raison des facteurs suivants.

L'ADN n'est pas suffisamment séparé au stade de la dénaturation thermique.
Au stade du recuit, les amorces se lient incorrectement.
Au stade de l'élongation, la fonction de l'ADN polymérase se détériore.
Des sous-produits sont produits.

Test de sensibilité / spécificité

La sensibilité et la singularité sont quelques-uns des mots que nous entendons souvent à propos des tests, mais trions les termes associés. Ce wiki est bien organisé.

Sensibilité ou rappel: pourcentage de positifs lorsqu'ils sont affectés
Spécificité: Pourcentage de négatifs lorsqu'ils ne sont pas affectés
Précision: pourcentage de positifs
Précision: Pourcentage de tous les affectés et positifs, non affectés et négatifs

Il existe diverses théories sur le test PCR du COVID-19 (SARS-CoV-2), mais il semble que certains rapports indiquent que la sensibilité est d'environ 70% et la spécificité est de 90% ou plus. Cependant, la sensibilité peut être affectée par la méthode de prélèvement de l'échantillon (essuyer la gorge, etc. avec un coton-tige) et l'environnement de transport, et la spécificité peut être affectée par le processus de test PCR, il ne doit donc pas s'agir d'une valeur définitive. Faisons le. En réalité, il est physiquement impossible d'inspecter tout le corps humain à la recherche d'un virus, il se peut donc que la sensibilité et la spécificité n'aient aucune valeur réelle.

En passant, en regardant la définition de la sensibilité et de la singularité ci-dessus, je pense que beaucoup de gens pensent qu'il s'agit de probabilité postérieure et de probabilité simultanée. Alors définissons-le à nouveau avec une formule.

\begin{eqnarray}
Sensibilité: RC&=& P(Inspection=T|Affecté=T) \\
Singularité: SP&=& P(Inspection=F|Affecté=F) \\
Taux de conformité: PC&=& P(Affecté=T|Inspection=T) \\
Taux de réponse correct: AC&=& P(Inspection=T,Affecté=T) + P(Inspection=F,Affecté=F)\\
\end{eqnarray}

De plus, il y a des faux positifs et des faux négatifs qui sont souvent entendus, et ceux-ci sont définis comme suit.

\begin{eqnarray}
Taux de faux positifs: FP&=& P(Inspection=T|Affecté=F) = 1 -Singularité\\
Taux de faux négatifs: FN&=& P(Inspection=F|Affecté=T) = 1 -sensibilité
\end{eqnarray}

Théorème de Bayes

[Théorème de Bayes](https://ja.wikipedia.org/wiki/%E3%83%99%E3%82%A4%E3%82%BA%E3%81%AE%E5%AE%9A%E7 % 90% 86) est une formule qui exprime la relation entre la pré-probabilité et la post-probabilité. Même dans le domaine de l'apprentissage automatique, il apparaît souvent dans l'estimation bayésienne.

P(B|A)=\frac{P(A|B)P(B)}{P(A)}

Maintenant, sur la base du théorème de Bayes, nous pouvons voir que ** la précision peut être calculée à partir de la sensibilité et de la singularité **. Ici, supposons que le taux de conformité au test positif est PC (T) et que le taux de conformité au test négatif est PC (F).

\begin{eqnarray}
PC(T) &=& P(Affecté=T|Inspection=T) \\
&=&
 \frac{P(Inspection=T|Affecté=T) P(Affecté=T)}{P(Inspection=T)} \\
&=&
 \frac{P(Inspection=T|Affecté=T) P(Affecté=T)}
{ P(Inspection=T|Affecté=T) P(Affecté=T) + P(Inspection=T|Affecté=F) P(Affecté=F)} \\
&=&
 \frac{RC \times P(Affecté=T)}
{ RC \times P(Affecté=T) + (1 - SP) \times P(Affecté=F)} \\
  \\
PC(F) &=& P(Affecté=F|Inspection=F)\\
&=&
 \frac{P(Inspection=F|Affecté=F) P(Affecté=F)}{P(Inspection=F)} \\
&=&
 \frac{P(Inspection=F|Affecté=F) P(Affecté=F)}
{ P(Inspection=F|Affecté=T) P(Affecté=T) + P(Inspection=F|Affecté=F) P(Affecté=F)} \\
&=&
 \frac{SP \times P(Affecté=T)}
{ (1-RC) \times P(Affecté=T) + SP \times P(Affecté=F)} \\
\end{eqnarray}

De plus, le taux de réponse correct est le même.

\begin{eqnarray}
AC &=& P(Inspection=T,Affecté=T) + P(Inspection=F,Affecté=F) \\
&=&
 P(Inspection=T|Affecté=T)P(Affecté=T) + P(Inspection=F|Affecté=F)P(Affecté=F) \\
&=&
 RC \times P(Affecté=T) + SP \times P(Affecté=F)
\end{eqnarray}

Peut être écrit.

Essayez de calculer avec Python

Maintenant, utilisons Python pour calculer le taux de précision au test positif PC (T), le taux de précision au test négatif PC (F) et le taux de réponse correct (AC).

Conditions préalables

Comme condition préalable, nous utilisons les hypothèses suivantes.

Taux de rappel (= sensibilité) RC est de 0,7
Spécificité SP est de 0,95
La pré-probabilité P (affectée = T) et P (affectée = F) sont utilisées comme paramètres.

Comme mentionné ci-dessus, nous ne connaissons pas les vraies valeurs de ceux-ci, il peut donc être judicieux d'apporter divers changements et de simuler.

Importez la bibliothèque.

import numpy as np
import matplotlib.pyplot as plt

Définit une fonction pour calculer le taux de précision du test positif PC (T), le taux de précision du test négatif PC (F) et le taux de réponse correct (AC). Comme arguments, donnez la probabilité P (affectée = T) et les paramètres a priori.

def PCT(p, key):
    rc = key['rc']
    fp = 1. - key['sp']
    return rc * p / ( rc * p + fp * (1. - p))

def PCF(p, key):
    sp = key['sp']
    fn = 1. - key['rc']
    return sp * (1. - p) / ( fn * p + sp * (1. - p))

def AC(p, key):
    rc = key['rc']
    sp = key['sp']
    return rc*p + sp*(1. - p)

C'est la partie à calculer en modifiant la probabilité antérieure P (affectée = T). J'essaye de rendre le maillage plus fin près de 0.

key = {'rc' : 0.7, 'sp' : 0.95 }
pp = [ np.exp( - 0.1 * i) for i in range(0,100)]
pct = [ PCT( p, key) for p in pp]
pcf = [ PCF( p, key) for p in pp]
ac = [ AC( p, key) for p in pp]

C'est la partie qui affiche le graphique.

plt.rcParams["font.size"] = 12
fig, ax = plt.subplots(figsize=(10,5))
ax.plot(pp, pct)
ax.plot(pp, pcf)
ax.plot(pp, ac)
ax.legend(['precision (infected)','precision (non-infected)','accuracy'])
xw = 0.1; xn = int(1./xw)+1
ax.set_xticks(np.linspace(0,xw*(xn-1), xn))
yw = 0.1; yn = int(1./yw)+1
ax.set_yticks(np.linspace(0,yw*(yn-1), yn))
ax.grid(which='both')
ax.set_xlabel('positive ratio (prior probability)')
plt.show()

résultat de la simulation

Jetons un coup d'œil aux résultats du calcul.

Les tendances suivantes peuvent être lues à partir de ce graphique.

Concernant le PC (T), qui est un test positif, la probabilité d'être affecté même si le test est positif est de 60% lorsque la probabilité antérieure P (morbidité = T) est faible et P (morbidité = T) = 0,1. Diplôme.
Concernant le PC (F), qui est un taux de correspondance positif au test positif, il se détériore considérablement lorsque la probabilité antérieure P (morbidité = T) est élevée. Diplôme.
Le taux de réponse correct (AC) est une forme qui complète linéairement la singularité et la sensibilité, toutes deux meilleures que des valeurs élevées.

Plus de considération

Compte tenu de l'importance de la réalisation du test, le taux de conformité au test positif et le taux de conformité au test négatif sont importants pour déterminer l'isolement, mais en plus de cela, les indicateurs suivants sont considérés comme importants.

Taux de faux positifs: Probabilité de ne pas être affecté même si le test est positif, P (affecté = F | test = T): Parce que c'est une loi qui doit être isolée si le test est positif, le lit d'hôpital est gaspillé. Parce qu'il remplit.
Taux de faux négatifs: Probabilité d'être affecté même si le test est négatif, P (affecté = T | test = F): car si le test est négatif, il est possible de propager l'infection à l'environnement sans prendre de mesures telles que des masques Parce qu'il y a du sexe.

Le taux de faux positifs est P(Inspection=T|Affecté=F), Le taux de faux négatifs est P(Inspection=F|Affecté=T)Parce qu'il est défini comme, j'ose P(Affecté=F|Inspection=T)Taux de mensonge positif, P(Affecté=T|Inspection=F)A été utilisé comme le terme taux de faux négatifs. C'est un mot inventé. Les indicateurs ci-dessus peuvent être calculés ci-dessous.

\begin{eqnarray}
Taux de faux positifs: FP&=& P(Affecté=F|Inspection=T) = 1 - P(Affecté=T|Inspection=T) = 1 - PC(T) \\
Taux de mensonge négatif: FN&=& P(Affecté=T|Inspection=F) = 1 - P(Affecté=F|Inspection=F) = 1 - PC(F) \\
\end{eqnarray}

Calculons et affichons ces valeurs.

fp = [1. - p for p in pct]
fn = [1. - p for p in pcf]

plt.rcParams["font.size"] = 12
fig, ax = plt.subplots(figsize=(10,5))
ax.plot(pp, fp)
ax.plot(pp, fn)
ax.legend([ 'fake positive', 'fake negative' ])
xw = 0.1; xn = int(1./xw)+1
ax.set_xticks(np.linspace(0,xw*(xn-1), xn))
yw = 0.1; yn = int(1./yw)+1
ax.set_yticks(np.linspace(0,yw*(yn-1), yn))
ax.grid(which='both')
ax.set_xlabel('positive ratio (prior probability)')
plt.show()

Voici le résultat.

De toute évidence, le taux de faux positifs est l'opposé du taux de précision du test positif PC (T), et le taux de faux négatifs est l'opposé du taux de précision du test négatif PC (F). Les tendances suivantes peuvent être lues à partir de ce graphique.

Concernant le taux de faux positifs, il se dégrade considérablement lorsque la probabilité a priori P (morbidité = T) est faible, et lorsque P (morbidité = T) = 0,1, la probabilité de ne pas être affecté même si le test est positif est d'environ 40%.
Concernant le taux de faux négatifs, il se dégrade considérablement lorsque la probabilité préalable P (morbidité = T) est élevée, et lorsque P (morbidité = T) = 0,9, la probabilité d'être affecté même si le test est négatif est d'environ 75%.

Considération

De ce qui précède, les tendances suivantes peuvent être dérivées de la simulation concernant le test PCR pour l'infection COVID-19. Concernant les valeurs numériques, il faut noter que les vraies valeurs de sensibilité et de singularité ne sont que des valeurs estimées.

Si la pré-probabilité P (morbidité = T) est faible, le taux de conformité au test positif et le taux de faux positifs s'aggravent, et généralement $ P (morbidité = T) \ leq 0,1 $ est plus nocif, et $ P (morbidité = T) Si \ geq 0.2 $, vous pouvez vous attendre à un taux d'appariement positif d'environ 80%.
Si la pré-probabilité P (morbidité = T) est élevée, le taux de conformité au test négatif et le taux de faux négatifs s'aggravent, et généralement $ P (morbidité = T) \ geq 0,9 $ est plus nocif, et $ P (morbidité = T) Si \ leq 0.45 $, on peut s'attendre à un taux de précision négatif d'environ 80%.

En outre ...

Le ministère de la Santé, du Travail et du Bien-être recommande les tests PCR uniquement en cas de contacts étroits, de fièvre et d'autres symptômes, de tests négatifs pour la grippe, etc., et que le médecin le juge nécessaire. ** Pré-probabilité P (affectée) Elle est extrêmement rationnelle ** en ce sens qu'elle augmente = T).
Permettre à quiconque de subir un test PCR pour le million de personnes souhaitées sans dépistage préalable est un acte de pré-probabilité extrêmement faible, et si le nombre de personnes réellement touchées est de 10 000. Ci-dessous, si $ P (affecté = T) \ leq 0.01 $, le taux de faux positifs sera de 87,5% ou plus, et il semble que les ressources médicales seront excessivement gaspillées.
Il semble que non seulement la Corée et l'Allemagne mais aussi les États-Unis essaient d'introduire l'inspection au volant, mais je suis très inquiet.

Lien de référence

Je me suis référé à la page suivante.

[Manuel de détection des agents pathogènes 2019-nCoV Ver.2.8] (https://www.niid.go.jp/niid/images/lab-manual/2019-nCoV20200304v2.pdf) [Guide d'expérimentation PCR] (http://www.takara-bio.co.jp/kensa/pdfs/book_1.pdf) Valeur F [Théorème de Bayes](https://ja.wikipedia.org/wiki/%E3%83%99%E3%82%A4%E3%82%BA%E3%81%AE%E5%AE%9A%E7 % 90% 86)

[PYTHON] Importance de la réduction de la cible de test du test PCR pour le nouveau virus corona compris par le théorème de Bayes