[PYTHON] Versuchen Sie es mit der Datenintegrationsfunktion von scanpy (sc.tl.ingest).

Was ist scanpy?

scanpy ist ein Tool zum Analysieren von scRNA-seq-Daten mit Python. Viele Leute mögen Rs seurat verwenden, aber ich denke, es gibt eine bestimmte Anzahl von Leuten, die scRNAseq-Daten mit Python analysieren möchten. Es ist ein Werkzeug, das solchen Menschen antwortet. Kürzlich ~~ (vor ungefähr einem halben Jahr) ~~ Ich habe ein Tutorial, um Daten in den Scanpy zu integrieren. (Stand 18.04.2018)

Datenintegration in Scanpy implementiert

Wie bereits oben erwähnt, wurde seit Version 1.4.5 von scanpy eine Funktion namens sc.tl.ingest implementiert, um die neu erfassten Daten in die Referenzdaten zu integrieren. Es gibt bereits ein Tutorial. (Integrieren von Daten mithilfe von Ingest und BBKNN: https://scanpy-tutorials.readthedocs.io/en/latest/integrating-data-using-ingest.html)

Beeindruckend! Ich möchte es benutzen!

Ich denke, es gibt viele Leute, die das sagen. Wenn ich jedoch versuche, mit conda wie unten gezeigt zu installieren

.sh


$ conda install -c bioconda scanpy
Collecting package metadata (repodata.json): done

(Unterlassung)

The following NEW packages will be INSTALLED:
  scanpy             bioconda/noarch::scanpy-1.4.3-py_0

Wird Angezeigt werden. Wenn Sie es so installieren, wie es ist, wird scanpy-1.4.3 installiert und Sie können die Datenintegrationsfunktion nicht verwenden (obwohl es ein Tutorial gibt!).

Ich denke, dass die Bioconda von Conda auf eine höhere Version als Scanpy 1.4.5 aktualisiert wird, aber es ist eine große Sache, also lasst es uns zuerst verwenden.

pip installiere die neueste Version von scanpy

[Hinweis!] ** Mischen Sie nicht Conda und Pip! Es besteht ein Anspruch **. (Obwohl einige Leute argumentieren, dass es in Ordnung ist, sie zu mischen ...) Bitte gehen Sie unten auf eigenes Risiko.

scanpy-Homepage (https://scanpy.readthedocs.io/en/latest) Die neueste Version scheint 1.4.6 zu sein. Lassen Sie uns also scanpy-1.4.6 installieren.

.sh


$ pip install scanpy=="1.4.6"
Collecting scanpy==1.4.6

(Unterlassung)

Successfully installed anndata-0.7.1 h5py-2.10.0 matplotlib-3.2.1 scanpy-1.4.6

Die Pip-Installation verlief gut.

Version prüfen

Es ist jedoch noch früh, um entlastet zu werden. Für alle Fälle überprüfen wir, ob 1.4.6 wirklich von Python installiert ist.

import scanpy as sc
sc.logging.print_versions()
>scanpy==1.4.6 anndata==0.7.1 umap==0.3.10 numpy==1.17.4 scipy==1.4.1  pandas==1.0.3 scikit-learn==0.22 statsmodels==0.10.1 python-igraph==0.7.1 louvain==0.6.1

Es scheint, dass scanpy Version 1.4.6 erfolgreich installiert wurde.

Möglicherweise wird jedoch eine Fehlermeldung angezeigt, wenn Sie die zu integrierende Funktion tatsächlich verwenden. Tutorial (https://scanpy-tutorials.readthedocs.io/en/latest/integrating-data-using-ingest.html) Wir werden weitermachen.

(Unterlassung)
sc.tl.ingest(adata, adata_ref, obs='leiden')
>running ingest
    finished (0:00:06)

Die Datenintegrationsfunktion hat auch funktioniert! (Obwohl in diesem Artikel nicht erwähnt, kann es auch mit der bbknn-Methode integriert werden.)

Wenn Sie diese Funktion nach der Integration visualisieren, können Sie sehen, wie sich die Referenz und der Batch-Effekt der neuen Daten überschneiden. image.png Zitat: https://scanpy-tutorials.readthedocs.io/en/latest/integrating-data-using-ingest.html

Schließlich

Wenn ich analysiere, denke ich immer, dass die Bioinformatik ein Bereich ist, in dem verschiedene Tools herauskommen, und wenn Sie sie verwenden, werden Sie vorerst solche Ergebnisse erzielen. Dieses Mal habe ich die Integrationssicherheit nicht überprüft, aber ich würde gerne mehr darüber erfahren. Wenn Sie Fehler oder Ratschläge haben, würden wir uns sehr freuen, wenn Sie uns eine Anleitung geben könnten.

Verweise

1,Seurat:https://satijalab.org/seurat/ 2,Scanpy:https://scanpy-tutorials.readthedocs.io/en/latest/integrating-data-using-ingest.html 3, Informationen zur Paketverwaltung mit Conda und Pip: https://qiita.com/ynakayama/items/29efebeb38604d10acef

Recommended Posts

Versuchen Sie es mit der Datenintegrationsfunktion von scanpy (sc.tl.ingest).
Versuchen Sie die Funktionsoptimierung mit Hyperopt
Versuchen Sie, mit django-import-export csv-Daten zu django hinzuzufügen
Versuchen Sie es mit Docker-Py
Versuchen Sie es mit einem Ausstecher
Versuchen Sie es mit PDFMiner
Versuchen Sie es mit Geopandas
Versuchen Sie es mit Selen
Versuchen Sie es mit scipy
Versuchen Sie es mit pandas.DataFrame
Versuchen Sie es mit Django-Swiftbrowser
Versuchen Sie es mit matplotlib
Versuchen Sie es mit tf.metrics
Versuchen Sie es mit PyODE
Versuchen Sie, die offenen Daten von COVID-19 aus Yokohama / Tokio / Osaka zu verwenden
Datenanalyse mit xarray
Funktionsanpassung (mit Keras)
Versuchen Sie es mit virtualenv (virtualenvwrapper)
Datenbereinigung 2 Datenbereinigung mit DataFrame
Datenbereinigung mit Python
[Azure] Versuchen Sie, Azure-Funktionen zu verwenden
Versuchen Sie es jetzt mit virtualenv
Versuchen Sie es mit W & B.
Versuchen Sie es mit Django templates.html
[Kaggle] Versuchen Sie es mit LGBM
Versuchen Sie es mit dem Feed-Parser von Python.
Versuchen Sie es mit Pythons Tkinter
Versuchen Sie es mit Tweepy [Python2.7]
Versuchen Sie es mit Pytorchs collate_fn
Versuchen Sie, mit Oracle Cloud Infrastructure Data Science auf AWS Redshift-Daten zuzugreifen
Versuchen Sie, eine in Python geschriebene Funktion mit Fn Project auszuführen
Versuchen Sie die Verschlüsselung / Entschlüsselung mit dem OpenSSL-Schlüssel mit Python3-Pow-Funktion