[Linux] Analyse eQTL avec le logiciel de statistiques génétiques PLINK

introduction

Récemment, j'ai commencé à utiliser PLINK, un logiciel de statistiques génétiques. Apprenez à utiliser PLINK en vous référant à ce livre.

Séminaire pratique à partir de zéro sur les statistiques génétiques

Ce livre est écrit pour Windows, j'écrirai donc un rappel sur la façon de le faire sur Mac. Cette fois, j'ai essayé l'analyse eQTL avec PLINK.

référence

L'utilisation de base de PLINK et de la méthode d'analyse GWAS a déjà été publiée. [Linux] J'ai essayé d'utiliser le logiciel de statistiques génétiques PLINK [Linux] GWAS avec logiciel de statistiques génétiques PLINK

Données à utiliser

bed|bim|fichier au format fam

Fichiers filtrés SNP

Fichier d'expression

Données sur le niveau d'expression du gène BLK

Analyse eQTL

Dans l'analyse eQTL, une analyse linéaire est effectuée afin d'analyser le trait quantitatif du niveau d'expression génique. Liste des commandes à utiliser. --pheno: Entrez le fichier d'expression (Exp_BLK.txt cette fois) utilisé pour GWAS --linear: effectuer une régression linéaire `` --ci 0.95 '': sortie intervalle de confiance à 95%

GWAS (analyse linéaire)


$ ./plink --bfile SNP_QC --out SNP_QC_Exp_BLK --pheno Exp_BLK.txt --linear --ci 0.95

Confirmez que le fichier nommé ** SNP_QC_Exp_BLK.assoc.linear ** est sorti dans le répertoire de travail et ouvrez-le avec un éditeur de texte. La première colonne est le numéro du chromosome, la deuxième colonne est l'ID SNP, la troisième colonne est la position du chromosome et la douzième colonne est la valeur * p *.

Extraction d'éléments par AWK

À partir du résultat GWAS, utilisez la commande AWK pour extraire les colonnes «numéro de chromosome», «ID SNP», «position du chromosome» et «valeur * p *». Utilisez la commande AWK pour définir le fichier d'entrée sur ** SNP_QC_Exp_BLK.assoc.linear ** et le fichier de sortie sur ** SNP_QC_Exp_BLK.assoc.linear.P.txt *. Dans AWK, séparez-les par «» et écrivez-y des commandes pour les exécuter. Par {print $ 2 "\ t" $ 1 "\ t" $ 3 "\ t" $ 12} La trame de données est "2ème colonne [ID SNP] 1ère colonne [numéro de chromosome] 3ème colonne [position du chromosome] 4ème colonne [ p * valeur]". La commande que "\ t" est séparée par des tabulations. Sortie sous forme de fichier texte spécifié par ``> ''.

Extraire des éléments des résultats GWAS avec la commande AWK et le fichier texte de sortie


$ awk '{print $2"\t"$1"\t"$3"\t"$12}' SNP_QC_Exp_BLK.assoc.linear > SNP_QC_Exp_BLK.assoc.linear.P.txt

Dessinez un graphique de Manhattan en utilisant ce résultat GWAS.

Dessin de l'intrigue de Manhattan

Quand j'ai dessiné un complot de Manhattan, ça ressemblait à ça. 1KG_EUR_QC_Exp_BLK.assoc.linear.P_position_P_15.png

Identification du SNP

Extrayons le SNP qui a montré l'effet eQTL.

Extraire SNP avec AWK


awk '$4<=10^-12 {print $0}' 1KG_EUR_QC_Exp_BLK.assoc.linear.P.txt

production

rs13255193	8	11309192	4.539e-13
rs13257831	8	11332964	6.545e-13
rs2736345	8	11352485	1.707e-14
rs1478898	8	11395079	6.882e-16
rs2244894	8	11448659	1.497e-13
rs2244648	8	11450422	2.068e-14
rs13273172	8	11461111	1.188e-14

Le SNP avec la plus petite valeur * p * était ** rs1478898 **.

Recommended Posts

[Linux] Analyse eQTL avec le logiciel de statistiques génétiques PLINK
[Linux] GWAS avec logiciel de statistiques génétiques PLINK
[Linux] J'ai essayé d'utiliser le logiciel de statistiques génétiques PLINK
Statistiques avec python
Text mining avec Python ① Analyse morphologique (re: version Linux)
[Commande Linux] Analyse des petites données avec la commande grep / awk / sort