Ich denke, ich brauche statistische Genetik bei der Arbeit, also habe ich versucht, die genetische Statistiksoftware PLINK zu verwenden. Kürzlich wurde ein schönes Buch veröffentlicht, also habe ich es selbst ausprobiert.
Seminar zur genetischen Statistik von Grund auf neu
Da dieses Buch jedoch für Windows geschrieben wurde, dachte ich, ich sollte ein Memorandum darüber schreiben, wie es auf dem Mac gemacht wird. Dieses Buch ist gut.
Laden Sie die MacOS-Version von PLINK von der folgenden Seite herunter.
Starten Sie das Mac-Terminal.
Geben Sie auf dem Terminal das Arbeitsverzeichnis mit dem Befehl cd
an.
Arbeitsverzeichnis angeben
$ cd /Arbeitsverzeichnispfad/
Verschieben Sie den heruntergeladenen ** PLINK ** (ausführbare PLINK-Datei) in Ihr Arbeitsverzeichnis.
Geben Sie auf dem Terminal . / Plink
ein.
Starten Sie PLINK
$ ./plink
Ausführungsergebnis
PLINK v1.90b6.16 64-bit (19 Feb 2020) www.cog-genomics.org/plink/1.9/
(C) 2005-2020 Shaun Purcell, Christopher Chang GNU General Public License v3
plink <input flag(s)...> [command flag(s)...] [other flag(s)...]
plink --help [flag name(s)...]
Commands include --make-bed, --recode, --flip-scan, --merge-list,
--write-snplist, --list-duplicate-vars, --freqx, --missing, --test-mishap,
--hardy, --mendel, --ibc, --impute-sex, --indep-pairphase, --r2, --show-tags,
--blocks, --distance, --genome, --homozyg, --make-rel, --make-grm-gz,
--rel-cutoff, --cluster, --pca, --neighbour, --ibs-test, --regress-distance,
--model, --bd, --gxe, --logistic, --dosage, --lasso, --test-missing,
--make-perm-pheno, --tdt, --qfam, --annotate, --clump, --gene-report,
--meta-analysis, --epistasis, --fast-epistasis, and --score.
"plink --help | more" describes all functions (warning: long).
PLINK wird mit ./plink-(command) (argument)
ausgeführt.
Die Dateilesebefehle sind --file
und --bfile
.
--file
liest Genotypdaten im Format ** ped | map .
--bfile
Istbed|bim|famLesen Sie die Genotypdaten des Formats.
NGS-DatenvcfDas Format ist einfach,ped|mapDaten in Format konvertiert,ped|mapKonvertiertes Format in Binärformatbed|bim|fam**Verwenden Sie das Format.
--out
gibt den Namen der Ausgabedatei an.
Diese Datei wurde im Arbeitsverzeichnis gespeichertSNP.bed、SNP.bim、SNP.famvonbed|bim|famFormat. Daher lautet das Argument von "--bfile" "SNP" vor der Erweiterung der Datei.
Datei lesen
$ ./plink --bfile SNP --out test
Dadurch wird eine Datei mit dem Namen ** test.log ** generiert. Öffnen Sie diese Datei mit einem Texteditor oder dem folgenden Befehl.
$ less test.log
Sie können die Allelfrequenz jedes SNP mit "--freq" berechnen.
Berechnen Sie die SNP-Allelfrequenz
$ ./plink --bfile SNP --out test1 --freq
Öffnen Sie die Ausgabedatei mit einem Texteditor oder dem folgenden Befehl.
$ less test1.frq
Vor der Analyse werden Genomdaten gefiltert, um SNPs mit einer MAF-Häufigkeit (Minor Allel) von 1% oder 0,5% oder weniger auszuschließen.
Art in GWAS.
Schließen Sie SNPs von MAF unterhalb des numerischen Werts mit --maf (numerischer Wert)
aus.
--make-bed
Neue gefilterte Daten mitbed|bim|famErstellt als Formatdatei.
Diesmal sind SNPs von 1% oder weniger ausgeschlossen.
Filtern Sie SNP nach geringer Allergenfrequenz
$ ./plink --bfile SNP --out test2 --maf 0.01 --make-bed
Recommended Posts