Hier erklären wir RDKit, das für die Chemoinfomatik unverzichtbar ist. Ich werde die grundlegende Methode mit Python zusammenfassen.
Um RDKit zu verwenden, wird empfohlen, Anaconda zu installieren und mit conda
zu installieren.
$ conda install -c rdkit rdkit
Importieren Sie es wie folgt, wenn Sie es verwenden.
from rdkit import Chem
So speichern Sie beispielsweise die Struktur der in SMILES gezeigten Verbindung als PNG-Datei:
from rdkit import Chem
molecule = Chem.MolFromSmiles(Zusammengesetztes LÄCHELN)
Chem.Draw.MolToFile(molecule, 'Dateiname.png')
Sie können es auch aus einer Mol-Datei erstellen.
from rdkit import Chem
molecule = Chem.MolFromMolFile(Mol Datei der Verbindung)
Chem.Draw.MolToFile(molecule, 'Dateiname.png')
So berechnen Sie den Deskriptor der von SMILES gelesenen Verbindung:
from rdkit import Chem
from rdkit.ML.Descriptors import MoleculeDescriptors
smiles_list = [Liste der LÄCHELN der Zielverbindungen]
target_descriptors = []
for desc in Chem.Descriptors.descList:
target_descriptors.append(desc[0]) #desc ist ein Tupel von Deskriptornamen und verwandten Informationen.
print(len(target_descriptors))
print(target_descirptors)
descriptor_calculator = MoleculeDescriptors.MolecularDescriptorCalculator(target_descriptors)
descriptors = []
for smiles in smiles_list:
molecule = Chem.MolFromSmiles(smiles)
descriptors.append(descriptor_calculator.CalcDescriptors(molecule))
print(descriptors)
Hier habe ich erklärt, wie RDKit mit Python verwendet wird. Wenn Sie diesen Inhalt verstehen, können Sie den Deskriptor der Verbindung leicht berechnen.
Wie kann Chemoinfomatik Pharmaunternehmen helfen? Welche Art von Wissen benötigen Sie?
Recommended Posts