scanpy ist ein Tool zum Analysieren von scRNA-seq-Daten mit Python. Viele Leute mögen Rs seurat verwenden, aber ich denke, es gibt eine bestimmte Anzahl von Leuten, die scRNAseq-Daten mit Python analysieren möchten. Es ist ein Werkzeug, das solchen Menschen antwortet. Kürzlich ~~ (vor ungefähr einem halben Jahr) ~~ Ich habe ein Tutorial, um Daten in den Scanpy zu integrieren. (Stand 18.04.2018)
Wie bereits oben erwähnt, wurde seit Version 1.4.5 von scanpy eine Funktion namens sc.tl.ingest implementiert, um die neu erfassten Daten in die Referenzdaten zu integrieren. Es gibt bereits ein Tutorial. (Integrieren von Daten mithilfe von Ingest und BBKNN: https://scanpy-tutorials.readthedocs.io/en/latest/integrating-data-using-ingest.html)
Beeindruckend! Ich möchte es benutzen!
Ich denke, es gibt viele Leute, die das sagen. Wenn ich jedoch versuche, mit conda wie unten gezeigt zu installieren
.sh
$ conda install -c bioconda scanpy
Collecting package metadata (repodata.json): done
(Unterlassung)
The following NEW packages will be INSTALLED:
scanpy bioconda/noarch::scanpy-1.4.3-py_0
Wird Angezeigt werden. Wenn Sie es so installieren, wie es ist, wird scanpy-1.4.3 installiert und Sie können die Datenintegrationsfunktion nicht verwenden (obwohl es ein Tutorial gibt!).
Ich denke, dass die Bioconda von Conda auf eine höhere Version als Scanpy 1.4.5 aktualisiert wird, aber es ist eine große Sache, also lasst es uns zuerst verwenden.
[Hinweis!] ** Mischen Sie nicht Conda und Pip! Es besteht ein Anspruch **. (Obwohl einige Leute argumentieren, dass es in Ordnung ist, sie zu mischen ...) Bitte gehen Sie unten auf eigenes Risiko.
scanpy-Homepage (https://scanpy.readthedocs.io/en/latest) Die neueste Version scheint 1.4.6 zu sein. Lassen Sie uns also scanpy-1.4.6 installieren.
.sh
$ pip install scanpy=="1.4.6"
Collecting scanpy==1.4.6
(Unterlassung)
Successfully installed anndata-0.7.1 h5py-2.10.0 matplotlib-3.2.1 scanpy-1.4.6
Die Pip-Installation verlief gut.
Es ist jedoch noch früh, um entlastet zu werden. Für alle Fälle überprüfen wir, ob 1.4.6 wirklich von Python installiert ist.
import scanpy as sc
sc.logging.print_versions()
>scanpy==1.4.6 anndata==0.7.1 umap==0.3.10 numpy==1.17.4 scipy==1.4.1 pandas==1.0.3 scikit-learn==0.22 statsmodels==0.10.1 python-igraph==0.7.1 louvain==0.6.1
Es scheint, dass scanpy Version 1.4.6 erfolgreich installiert wurde.
Möglicherweise wird jedoch eine Fehlermeldung angezeigt, wenn Sie die zu integrierende Funktion tatsächlich verwenden. Tutorial (https://scanpy-tutorials.readthedocs.io/en/latest/integrating-data-using-ingest.html) Wir werden weitermachen.
(Unterlassung)
sc.tl.ingest(adata, adata_ref, obs='leiden')
>running ingest
finished (0:00:06)
Die Datenintegrationsfunktion hat auch funktioniert! (Obwohl in diesem Artikel nicht erwähnt, kann es auch mit der bbknn-Methode integriert werden.)
Wenn Sie diese Funktion nach der Integration visualisieren, können Sie sehen, wie sich die Referenz und der Batch-Effekt der neuen Daten überschneiden. Zitat: https://scanpy-tutorials.readthedocs.io/en/latest/integrating-data-using-ingest.html
Wenn ich analysiere, denke ich immer, dass die Bioinformatik ein Bereich ist, in dem verschiedene Tools herauskommen, und wenn Sie sie verwenden, werden Sie vorerst solche Ergebnisse erzielen. Dieses Mal habe ich die Integrationssicherheit nicht überprüft, aber ich würde gerne mehr darüber erfahren. Wenn Sie Fehler oder Ratschläge haben, würden wir uns sehr freuen, wenn Sie uns eine Anleitung geben könnten.
1,Seurat:https://satijalab.org/seurat/ 2,Scanpy:https://scanpy-tutorials.readthedocs.io/en/latest/integrating-data-using-ingest.html 3, Informationen zur Paketverwaltung mit Conda und Pip: https://qiita.com/ynakayama/items/29efebeb38604d10acef
Recommended Posts