Sie können das gleiche mit seqkit grep tun
https://github.com/shenwei356/seqkit
Löschen Sie das Array mit der ID-Listendatei oder extrahieren Sie nur dieses Array.
fasta_extract.py
#!/usr/bin/env python
# -*- coding: utf-8 -*-
#fasta_Setzen Sie das ID-Element auf key und senden Sie das Hit-Array an die Standardausgabe
import sys
from Bio import SeqIO
fasta_in = sys.argv[1] #Geben Sie im ersten Argument die Fasta-Datei an, die Sie ändern möchten.
query = sys.argv[2] #Geben Sie im zweiten Argument die Datei an, die die keyID für jede Zeile beschreibt
for record in SeqIO.parse(fasta_in, 'fasta'): #Öffnen Sie die Fasta-Datei Parse mit SeqIO(Lesen Sie jeweils einen Artikel.
id_part = record.id #Lesen Sie den ID-Teil von fasta
m_part = id_part.rstrip() #chomp und m_Teilweise setzen
description_part = record.description
seq = record.seq #Lesen Sie den Array-Teil von Fastan
for q in open(query, "r"): #Öffnen Sie die Anmerkungsinformationsdatei
if m_part == q.rstrip(): #Wenn der ID-Teil der Fasta-Datei und der ID-Teil des Wechslerelements übereinstimmen. ..
fasta_seq = '>' + description_part + '\n' + seq #Im Fasta-Format anordnen
print(fasta_seq) #Ausgabe fasta auf Standardausgabe
fasta_remove.py
#!/usr/bin/env python
# -*- coding: utf-8 -*-
#fasta_Setzen Sie das ID-Element auf den Schlüssel und geben Sie das Array aus, das nicht in der Standardausgabe getroffen wurde
import sys
from Bio import SeqIO
fasta_in = sys.argv[1] #Geben Sie im ersten Argument die Fasta-Datei an, die Sie ändern möchten.
query = sys.argv[2] #Geben Sie im zweiten Argument die Datei an, die die keyID für jede Zeile beschreibt
hit = 0
for record in SeqIO.parse(fasta_in, 'fasta'): #Öffnen Sie die Fasta-Datei Parse mit SeqIO(Lesen Sie jeweils einen Artikel.
id_part = record.id #Lesen Sie den ID-Teil von fasta
m_part = id_part.rstrip() #chomp und m_Teilweise setzen
description_part = record.description
seq = record.seq #Lesen Sie den Array-Teil von Fastan
for q in open(query, "r"): #Öffnen Sie die Anmerkungsinformationsdatei
if m_part == q.rstrip(): #Wenn der ID-Teil der Fasta-Datei und der ID-Teil des Wechslerelements übereinstimmen. ..
hit += 1
if hit == 0:
fasta_seq = '>' + description_part + '\n' + seq #Im Fasta-Format anordnen
print(fasta_seq) #Ausgabe fasta auf Standardausgabe
hit = 0
fasta_extract_cont.py
#!/usr/bin/env python
# -*- coding: utf-8 -*-
#fasta_Setzen Sie das ID-Element auf key und senden Sie das Hit-Array an die Standardausgabe(Version entsprechend Teilübereinstimmung)
import sys
from Bio import SeqIO
fasta_in = sys.argv[1] #Geben Sie im ersten Argument die Fasta-Datei an, die Sie ändern möchten.
query = sys.argv[2] #Geben Sie im zweiten Argument die Datei an, die die keyID für jede Zeile beschreibt
for record in SeqIO.parse(fasta_in, 'fasta'): #Öffnen Sie die Fasta-Datei Parse mit SeqIO(Lesen Sie jeweils einen Artikel.
id_part = record.id #Lesen Sie den ID-Teil von fasta
m_part = id_part.rstrip() #chomp und m_Teilweise setzen
description_part = record.description
seq = record.seq #Lesen Sie den Array-Teil von Fastan
for q in open(query, "r"): #Öffnen Sie die Anmerkungsinformationsdatei
if q.rstrip() in m_part: #Einschließen oder suchen
fasta_seq = '>' + description_part + '\n' + seq #Im Fasta-Format anordnen
print(fasta_seq) #Ausgabe fasta auf Standardausgabe
fasta_remove_cont.py
#!/usr/bin/env python
# -*- coding: utf-8 -*-
#fasta_Setzen Sie das ID-Element auf key und senden Sie das Hit-Array an die Standardausgabe(Version entsprechend Teilübereinstimmung)
import sys
from Bio import SeqIO
fasta_in = sys.argv[1] #Geben Sie im ersten Argument die Fasta-Datei an, die Sie ändern möchten.
query = sys.argv[2] #Geben Sie im zweiten Argument die Datei an, die die keyID für jede Zeile beschreibt
hit = 0
for record in SeqIO.parse(fasta_in, 'fasta'): #Öffnen Sie die Fasta-Datei Parse mit SeqIO(Lesen Sie jeweils einen Artikel.
id_part = record.id #Lesen Sie den ID-Teil von fasta
m_part = id_part.rstrip() #chomp und m_Teilweise setzen
description_part = record.description
seq = record.seq #Lesen Sie den Array-Teil von Fastan
for q in open(query, "r"): #Öffnen Sie die Anmerkungsinformationsdatei
if q.rstrip() in m_part: #Einschließen oder suchen
hit += 1
if hit == 0:
fasta_seq = '>' + description_part + '\n' + seq #Im Fasta-Format anordnen
print(fasta_seq) #Ausgabe fasta auf Standardausgabe
hit = 0
fasta_remove_V3.py
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import sys
from Bio import SeqIO
fasta_in = sys.argv[1] #Geben Sie im ersten Argument die Fasta-Datei an, die Sie ändern möchten.
query = sys.argv[2] #Geben Sie im zweiten Argument die Datei an, die das Suchschlüsselwort für jede Zeile beschreibt
hit = 0
for record in SeqIO.parse(fasta_in, 'fasta'): #Öffnen Sie die Fasta-Datei Parse mit SeqIO(Lesen Sie jeweils einen Artikel.
id_part = record.description #Lesen Sie den Beschreibungsteil von fasta
m_part = id_part.rstrip() #chomp und m_Teilweise setzen
description_part = record.description
seq = record.seq #Lesen Sie den Array-Teil von Fastan
for q in open(query, "r"): #Öffnen Sie die Anmerkungsinformationsdatei
if q.rstrip() in m_part: #Wenn der ID-Teil der Fasta-Datei und der ID-Teil des Wechslerelements übereinstimmen. ..
hit += 1
if hit == 0:
fasta_seq = '>' + description_part + '\n' + seq #Im Fasta-Format anordnen
print(fasta_seq) #Ausgabe fasta auf Standardausgabe
hit = 0
Recommended Posts