[Linux] Ich habe versucht, die genetische Statistiksoftware PLINK zu verwenden

Einführung

Ich denke, ich brauche statistische Genetik bei der Arbeit, also habe ich versucht, die genetische Statistiksoftware PLINK zu verwenden. Kürzlich wurde ein schönes Buch veröffentlicht, also habe ich es selbst ausprobiert.

Seminar zur genetischen Statistik von Grund auf neu

Da dieses Buch jedoch für Windows geschrieben wurde, dachte ich, ich sollte ein Memorandum darüber schreiben, wie es auf dem Mac gemacht wird. Dieses Buch ist gut.

Laden Sie PLINK herunter

Laden Sie die MacOS-Version von PLINK von der folgenden Seite herunter.

PLINK

Starten Sie das Mac-Terminal. Geben Sie auf dem Terminal das Arbeitsverzeichnis mit dem Befehl cd an.

Arbeitsverzeichnis angeben


$ cd /Arbeitsverzeichnispfad/

Verschieben Sie den heruntergeladenen ** PLINK ** (ausführbare PLINK-Datei) in Ihr Arbeitsverzeichnis.

Starten Sie PLINK

Geben Sie auf dem Terminal . / Plink ein.

Starten Sie PLINK


$ ./plink

Ausführungsergebnis

PLINK v1.90b6.16 64-bit (19 Feb 2020)          www.cog-genomics.org/plink/1.9/
(C) 2005-2020 Shaun Purcell, Christopher Chang   GNU General Public License v3

  plink <input flag(s)...> [command flag(s)...] [other flag(s)...]
  plink --help [flag name(s)...]

Commands include --make-bed, --recode, --flip-scan, --merge-list,
--write-snplist, --list-duplicate-vars, --freqx, --missing, --test-mishap,
--hardy, --mendel, --ibc, --impute-sex, --indep-pairphase, --r2, --show-tags,
--blocks, --distance, --genome, --homozyg, --make-rel, --make-grm-gz,
--rel-cutoff, --cluster, --pca, --neighbour, --ibs-test, --regress-distance,
--model, --bd, --gxe, --logistic, --dosage, --lasso, --test-missing,
--make-perm-pheno, --tdt, --qfam, --annotate, --clump, --gene-report,
--meta-analysis, --epistasis, --fast-epistasis, and --score.

"plink --help | more" describes all functions (warning: long).

PLINK wird mit ./plink-(command) (argument) ausgeführt.

Datei lesen

Die Dateilesebefehle sind --file und --bfile. --file liest Genotypdaten im Format ** ped | map . --bfileIstbed|bim|famLesen Sie die Genotypdaten des Formats. NGS-DatenvcfDas Format ist einfach,ped|mapDaten in Format konvertiert,ped|mapKonvertiertes Format in Binärformatbed|bim|fam**Verwenden Sie das Format.

--out gibt den Namen der Ausgabedatei an.

Diese Datei wurde im Arbeitsverzeichnis gespeichertSNP.bedSNP.bimSNP.famvonbed|bim|famFormat. Daher lautet das Argument von "--bfile" "SNP" vor der Erweiterung der Datei.

Datei lesen


$ ./plink --bfile SNP --out test

Dadurch wird eine Datei mit dem Namen ** test.log ** generiert. Öffnen Sie diese Datei mit einem Texteditor oder dem folgenden Befehl.


$ less test.log

Berechnung der Allerhäufigkeit

Sie können die Allelfrequenz jedes SNP mit "--freq" berechnen.

Berechnen Sie die SNP-Allelfrequenz


$ ./plink --bfile SNP --out test1 --freq

Öffnen Sie die Ausgabedatei mit einem Texteditor oder dem folgenden Befehl.


$ less test1.frq

SNP-Filterung

Vor der Analyse werden Genomdaten gefiltert, um SNPs mit einer MAF-Häufigkeit (Minor Allel) von 1% oder 0,5% oder weniger auszuschließen. Art in GWAS. Schließen Sie SNPs von MAF unterhalb des numerischen Werts mit --maf (numerischer Wert) aus. --make-bedNeue gefilterte Daten mitbed|bim|famErstellt als Formatdatei. Diesmal sind SNPs von 1% oder weniger ausgeschlossen.

Filtern Sie SNP nach geringer Allergenfrequenz


$ ./plink --bfile SNP --out test2 --maf 0.01 --make-bed

Recommended Posts

[Linux] Ich habe versucht, die genetische Statistiksoftware PLINK zu verwenden
[Linux] GWAS mit genetischer Statistiksoftware PLINK
[Linux] eQTL-Analyse mit der genetischen Statistiksoftware PLINK
Ich habe versucht, die checkio-API zu verwenden
Ich habe versucht, die BigQuery-Speicher-API zu verwenden
vprof - Ich habe versucht, den Profiler für Python zu verwenden
Ich habe versucht, PyCaret mit der schnellsten Geschwindigkeit zu verwenden
Ich habe versucht, das Datetime-Modul von Python zu verwenden
Ich habe versucht, den Bildfilter von OpenCV zu verwenden
Ich habe versucht, die funktionale Programmierbibliothek toolz zu verwenden
Ich habe versucht, parametrisiert zu verwenden
Ich habe versucht, Argparse zu verwenden
Ich habe versucht, Mimesis zu verwenden
Ich habe versucht, anytree zu verwenden
Ich habe versucht, aiomysql zu verwenden
Ich habe versucht, Summpy zu verwenden
Ich habe versucht, Coturn zu verwenden
Ich habe versucht, Pipenv zu verwenden
Ich habe versucht, Matplotlib zu verwenden
Ich habe versucht, "Anvil" zu verwenden.
Ich habe versucht, Hubot zu verwenden
Ich habe versucht, ESPCN zu verwenden
Ich habe versucht, openpyxl zu verwenden
Ich habe versucht, Ipython zu verwenden
Ich habe versucht, PyCaret zu verwenden
Ich habe versucht, Cron zu verwenden
Ich habe versucht, ngrok zu verwenden
Ich habe versucht, face_recognition zu verwenden
Ich habe versucht, Jupyter zu verwenden
Ich habe versucht, doctest zu verwenden
Ich habe versucht, Folium zu verwenden
Ich habe versucht, jinja2 zu verwenden
Ich habe versucht, Folium zu verwenden
Ich habe versucht, das Zeitfenster zu verwenden
Ich habe versucht, EKG-Daten mit der K-Shape-Methode zu gruppieren
Ich habe versucht, die Sündenfunktion mit Chainer zu approximieren
Ich habe versucht, die API von Sakenowa Data Project zu verwenden
Ich habe versucht, den Linux-Kernel auf virtualbox + vagrant zu installieren
Ich habe versucht, die Sprache mit CNN + Melspectogram zu identifizieren
Ich habe versucht, das Wissensdiagramm mit OpenKE zu ergänzen
Ich habe versucht, das Bild mithilfe von maschinellem Lernen zu komprimieren
[Ich habe versucht, Pythonista 3 zu verwenden] Einführung
Ich habe versucht, easydict (Memo) zu verwenden.
Ich habe versucht, das Gesicht mit Face ++ zu erkennen
Ich habe versucht, BigQuery ML zu verwenden
Ich habe versucht, Amazon Glacier zu verwenden
Ich habe die Changefinder-Bibliothek ausprobiert!
Ich habe versucht, Git Inspector zu verwenden
Ich habe versucht, Linux wieder einzuführen
Ich habe versucht, Magenta / TensorFlow zu verwenden
Ich habe versucht, AWS Chalice zu verwenden
Ich habe versucht, Slack Emojinator zu verwenden
Ich habe versucht, die Python-Bibliothek von Ruby mit PyCall zu verwenden
Ich habe versucht, das CNN-Modell von TensorFlow mit TF-Slim umzugestalten
Ich habe versucht, das Lachproblem mit Keras zu erkennen.