Vad Är FASTA format?

May 21

Rå biokemiska och biologiska data kan representeras som enstaka eller flera filer, så kallade platta filer. Platta filformat har normalt en enkel, vanlig intern struktur och innehålla texttecken, som kan läsas av vanliga textredigerare. FASTA-formatet är en enkel, kompakt filformat som gör att sekvensdata - såsom sekvensen av aminosyror i en proteinmolekyl, eller den sekvens av nukleotider i en DNA-molekyl - som skall spelas in i en datafil.

Vad är FASTA?

FASTA-formatet är uppkallad efter FASTA justeringsverktyg - en föregångare till de grundläggande lokala Alignment Search Tool, som finner regioner av likhet mellan sekvenser - som ursprungligen använt format. FASTA är också känd som Pearson format, efter upphovs av FASTA justeringsredskapet. FASTA formaterade filer kan ha filnamns ".fasta", ".fa" eller ".ffa."

rubrikrad

FASTA-formatet består en enda rubrikrad eller definitionslinjen, följt av en eller flera rader av sekvensdata. Rubrikraden börjar alltid med en ">", följt av en sekvens identifieringskod, eller sekvensnamn - vanligtvis den första delen av uppgifterna på rubrikraden - och eventuellt en begränsad textbeskrivning. Den textbeskrivning kan användas för att inkludera kompletterande information, såsom - för nukleotidsekvenser - kromosom, tråd och gen information. Beskrivningen är inte officiellt en del av beskrivningen av FASTA-formatet, så vissa tillämpningar kan ignorera det, även om det är närvarande.

sekvens Lines

FASTA-formatet är mycket enkel i den mån som, med undantag av tomma rader, varje rad som inte är ett rubrikraden behandlas som en sekvens linje. Resterande i FASTA-formaterad fil innehåller bara sekvenser av aminosyror och nukleotider, vanligtvis formaterade till 60 tecken per rad. En fil i FASTA format kan innehålla mer än en sekvens med en sekvens listas direkt efter varandra. FASTA-formatet är, i själva verket accepterat av många multipla sekvensinriktningsprogram.

överväganden

En tom rad i en FASTA-formaterad fil kan ignoreras helt eller tolkas som att avsluta varje sekvens, beroende på det program som används för att undersöka ärendet. På samma sätt, mellanslag och andra tecken, såsom bindestreck, understreck och perioder, kan ignoreras eller behandlas som luckor i en sekvens.


        

Välkommen till dig för att skicka en kommentar:

            
            
            
            

© 2021 Astrixsoft.com | Contact us: webmaster# astrixsoft.com