Puncte:1

Cum să selectați anumite coloane într-un fișier alternand între linii

drapel af

Am un fișier text care conține linii de informații despre secvențele de proteine ​​și secvențele aferente.

>4YDY_1|Lanturile A, C[auth B]|DARPIN 44C12V5|constructie sintetica (32630)
MRGSHHHHHHGSDLGKKLLEAARAGQDDEVRILMANGADVNALDDSGYTPLHLAAEDGHLEIVEVLLKHGADVNAADRLGDTPLHLAAFVGHLEIVEVLLKAGADVNAVDLAGVTPLHVAAFYGHLEIVEVLLKAGADVNAQDKFGKTPADIAADNGHEDIAEVLQKL

Pentru aceste lanțuri există o secvență. Vreau să parcurg fiecare linie a fișierului și să păstrez doar ID-ul și primul lanț, să elimin numărul entității, care este imediat după ID-ul (_1), să pun o virgulă între ID și lanț e să elimin orice alte lucruri din linia. Această operație ar trebui făcută o linie da și una nu. De asemenea, există unele secvențe (literele din a doua linie) care au mai puțin de 50 de litere. Vreau să elimin fiecare secvență care conține mai puțin de 50 de litere împreună cu ID-ul său, care este linia de deasupra ei.

Pentru a fi clar, aceasta este rezultatul pe care îl caut pentru fiecare secvență din fișier:

>4YDY:A
MRGSHHHHHHGSDLGKKLLEAARAGQDDEVRILMANGADVNALDDSGYTPLHLAAEDGHLEIVEVLLKHGADVNAADRLGDTPLHLAAFVGHLEIVEVLLKAGADVNAVDLAGVTPLHVAAFYGHLEIVEVLLKAGADVNAQDKFGKTPADIAADNGHEDIAEVLQKL

Multumesc anticipat.

drapel cn
Ray
Pentru ceea ce vrei să faci, probabil că vrei să apelezi la Perl sau Python. Poate că altcineva vă poate oferi ajutor cu `bash`, dar cred că ar fi destul de dificil.
Puncte:0
drapel jp

Acest lucru este testat și funcționează cu exemplul dvs.

#!/bin/bash
# Citiți fișierul două rânduri la un moment dat
în timp ce citește -r unul; do
   citeste -r doi
   # Dacă al doilea rând are cincizeci sau mai multe caractere
   dacă ((${#două} >= 50)); atunci
     IFS='|' citește -ra f <<< "$one"
     id="${f[0]}"
     # Îndepărtați liniuța de subliniere „_” și tot ce urmează din ID
     id=${id%_*}
     # Prinde primul lanț
     chain="${f[1]}"
     lanț=$(cut -d ' ' -f2 <<<"$lanț" | tăiat -d ',' -f1)
     one="$id:$lanț" 
     # Imprimați cele două linii în formatul dorit
     printf '%s\n' "$unu" "$două"
   fi
terminat < file.txt

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.