Vad Är FASTA format?
May 21Rå biokemiska och biologiska data kan representeras som enstaka eller flera filer, så kallade platta filer. Platta filformat har normalt en enkel, vanlig intern struktur och innehålla texttecken, som kan läsas av vanliga textredigerare. FASTA-formatet är en enkel, kompakt filformat som gör att sekvensdata - såsom sekvensen av aminosyror i en proteinmolekyl, eller den sekvens av nukleotider i en DNA-molekyl - som skall spelas in i en datafil.
Vad är FASTA?
FASTA-formatet är uppkallad efter FASTA justeringsverktyg - en föregångare till de grundläggande lokala Alignment Search Tool, som finner regioner av likhet mellan sekvenser - som ursprungligen använt format. FASTA är också känd som Pearson format, efter upphovs av FASTA justeringsredskapet. FASTA formaterade filer kan ha filnamns ".fasta", ".fa" eller ".ffa."
rubrikrad
FASTA-formatet består en enda rubrikrad eller definitionslinjen, följt av en eller flera rader av sekvensdata. Rubrikraden börjar alltid med en ">", följt av en sekvens identifieringskod, eller sekvensnamn - vanligtvis den första delen av uppgifterna på rubrikraden - och eventuellt en begränsad textbeskrivning. Den textbeskrivning kan användas för att inkludera kompletterande information, såsom - för nukleotidsekvenser - kromosom, tråd och gen information. Beskrivningen är inte officiellt en del av beskrivningen av FASTA-formatet, så vissa tillämpningar kan ignorera det, även om det är närvarande.
sekvens Lines
FASTA-formatet är mycket enkel i den mån som, med undantag av tomma rader, varje rad som inte är ett rubrikraden behandlas som en sekvens linje. Resterande i FASTA-formaterad fil innehåller bara sekvenser av aminosyror och nukleotider, vanligtvis formaterade till 60 tecken per rad. En fil i FASTA format kan innehålla mer än en sekvens med en sekvens listas direkt efter varandra. FASTA-formatet är, i själva verket accepterat av många multipla sekvensinriktningsprogram.
överväganden
En tom rad i en FASTA-formaterad fil kan ignoreras helt eller tolkas som att avsluta varje sekvens, beroende på det program som används för att undersöka ärendet. På samma sätt, mellanslag och andra tecken, såsom bindestreck, understreck och perioder, kan ignoreras eller behandlas som luckor i en sekvens.
relaterade artiklar
- Vad gör Formatera en hårddisk gör?
- Vad är QCP format?
- Vad gör Formatera en disk Mean?
- Vad Är MBP Format?
- Vad är MARC-format?
- Vad är Tk format?
- Vad är fast trådlöst Internet?
- Vad är TPB format?
- Vad är titeln format som används för i Microsoft Word?
- DU KANSKE OCKSÅ GILLAR
-
- • Hur man bygger en zip-fil
- • Lägga till musik till en blogg
- • Specifikationer för AMD X4 Quad 9750 Processor
- • Lägga till eller ta bort tangentkommandon i Logic Pro 8
- • Gratis verktyg att hitta folk
- • Computer Video Player Program
- • IBM E74 datorskärm specifikation
- • Hur konvertera PPTXs Into MPGs
- • Kännetecken för tunna klienter
- • Så här konfigurerar datorn för Ethernet
Välkommen till dig för att skicka en kommentar: