Puncte:0

Cum să tăiați intervalele de linii ale unui fișier și să le puneți în mai multe fișiere?

drapel af

Am un fișier fasta care conține ID-uri și secvențe de genul acesta:

>4S3O_2:C
GSMSQAVQTNGTQPLSKTWELSLYELQRTPQEAITDGLEIVVSPRSLHSELMCPICLDMLKNTMTTKECLHRFCADCIITALRSGNKECPTCRKKLVSKRSLRPDPNFDALISKIYPS
>5JH8_1:A
AAMVLAYYSGYAGNYAALTRYAASFNAVAVDFYNITAQGAVTGNGDPAPNDAISFLLGRKIPAYGCVSNVDGNGNWSADIAHAVSTSAQSQAVANLVKFAQDKRFSGINVDFEAVAQGDRNNFSHFI

Vreau să tai recursiv liniile care conțin id-urile și secvențele și să le pun în noi fișiere multiple denumite după id-urile corespunzătoare (excluse lanțurile), așa cum ar fi noul fișier cointains

>4S3O_2:C
GSMSQAVQTNGTQPLSKTWELSLYELQRTPQEAITDGLEIVVSPRSLHSELMCPICLDMLKNTMTTKECLHRFCADCIITALRSGNKECPTCRKKLVSKRSLRPDPNFDALISKIYPS

și este numit 4S30_2.fasta

Asta am incercat:

awk -F ">" | sed -i -e '$0,$1{w file.fasta d}' BlindSet150.fasta 
Puncte:2
drapel hr

Probabil că există un instrument bioinformatic robust pentru extragerea secvențelor fasta în fișiere individuale, dar dacă doriți să vă rulați singur cu awk, v-aș sugera ceva de genul

awk -F '[>:]' '/^>/ {close(f); f = $2 ".fasta" } f {print > f}' BlindSet150.fasta

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.