[Linux] eQTL-Analyse mit der genetischen Statistiksoftware PLINK

Einführung

Vor kurzem habe ich angefangen, PLINK, eine Software für genetische Statistiken, zu verwenden. Erfahren Sie anhand dieses Buches, wie Sie PLINK verwenden.

Seminar zur genetischen Statistik von Grund auf üben

Dieses Buch ist für Windows geschrieben, daher werde ich eine Erinnerung daran schreiben, wie es auf dem Mac gemacht wird. Dieses Mal habe ich die eQTL-Analyse mit PLINK versucht.

Referenz

Die grundlegende Verwendung von PLINK und die GWAS-Analysemethode wurden bereits veröffentlicht. [Linux] Ich habe versucht, die genetische Statistiksoftware PLINK zu verwenden [Linux] GWAS mit genetischer Statistiksoftware PLINK

Zu verwendende Daten

bed|bim|Fam-Format-Datei

SNP-gefilterte Dateien

Ausdrucksdatei

Daten zum BLK-Genexpressionsniveau

eQTL-Analyse

Bei der eQTL-Analyse wird eine lineare Analyse durchgeführt, um das quantitative Merkmal des Genexpressionsniveaus zu analysieren. Liste der zu verwendenden Befehle. --pheno: Geben Sie die Ausdrucksdatei (diesmal Exp_BLK.txt) ein, die für GWAS verwendet wird --linear: Führen Sie eine lineare Regression durch --ci 0.95: 95% -Konfidenzintervall ausgeben

GWAS (Lineare Analyse)


$ ./plink --bfile SNP_QC --out SNP_QC_Exp_BLK --pheno Exp_BLK.txt --linear --ci 0.95

Stellen Sie sicher, dass die Datei mit dem Namen ** SNP_QC_Exp_BLK.assoc.linear ** in das Arbeitsverzeichnis ausgegeben wird, und öffnen Sie sie mit einem Texteditor. Die erste Spalte ist die Chromosomenzahl, die zweite Spalte ist die SNP-ID, die dritte Spalte ist die Chromosomenposition und die zwölfte Spalte ist der * p * -Wert.

Extraktion von Elementen durch AWK

Verwenden Sie aus dem GWAS-Ergebnis den Befehl AWK, um die Spalten "Chromosomenzahl", "SNP-ID", "Chromosomenposition" und "* p * -Wert" zu extrahieren. Verwenden Sie den Befehl AWK, um die Eingabedatei auf ** SNP_QC_Exp_BLK.assoc.linear ** und die Ausgabedatei auf ** SNP_QC_Exp_BLK.assoc.linear.P.txt ** zu setzen. Trennen Sie sie in AWK mit "" und schreiben Sie Befehle in sie, um sie auszuführen. Mit {print $ 2 "\ t" $ 1 "\ t" $ 3 "\ t" $ 12} Der Datenrahmen ist "2. Spalte [SNP ID] 1. Spalte [Chromosomenzahl] 3. Spalte [Chromosomenposition] 4. Spalte [* p * Wert]". Der Befehl "\ t" wird durch Tabulatoren getrennt. Ausgabe als Textdatei, angegeben durch > .

Extrahieren Sie Elemente aus GWAS-Ergebnissen mit dem AWK-Befehl und der Ausgabetextdatei


$ awk '{print $2"\t"$1"\t"$3"\t"$12}' SNP_QC_Exp_BLK.assoc.linear > SNP_QC_Exp_BLK.assoc.linear.P.txt

Zeichnen Sie mit diesem GWAS-Ergebnis ein Manhattan-Diagramm.

Zeichnung Manhattan Handlung

Als ich eine Handlung in Manhattan zeichnete, sah es so aus. 1KG_EUR_QC_Exp_BLK.assoc.linear.P_position_P_15.png

Identifizierung von SNP

Extrahieren wir den SNP, der den eQTL-Effekt gezeigt hat.

SNP mit AWK extrahieren


awk '$4<=10^-12 {print $0}' 1KG_EUR_QC_Exp_BLK.assoc.linear.P.txt

Ausgabe

rs13255193	8	11309192	4.539e-13
rs13257831	8	11332964	6.545e-13
rs2736345	8	11352485	1.707e-14
rs1478898	8	11395079	6.882e-16
rs2244894	8	11448659	1.497e-13
rs2244648	8	11450422	2.068e-14
rs13273172	8	11461111	1.188e-14

Der SNP mit dem kleinsten * p * -Wert war ** rs1478898 **.

Recommended Posts

[Linux] eQTL-Analyse mit der genetischen Statistiksoftware PLINK
[Linux] GWAS mit genetischer Statistiksoftware PLINK
[Linux] Ich habe versucht, die genetische Statistiksoftware PLINK zu verwenden
Statistik mit Python
Text Mining mit Python ① Morphologische Analyse (re: Linux-Version)
[Linux-Befehl] Petit-Datenanalyse mit dem Befehl grep / awk / sort