Tecnología

Inicio

Definición de FASTA

Definición de FASTA


Según el Centro Nacional de Información sobre Biotecnología, ha habido varios avances tecnológicos en el campo de la biología molecular. La bioinformática está trabajando para combinar los datos genómicos con la tecnología. En concreto las bases de datos están siendo uso para mantener la información genómica como biólogos trabajan para armar un genoma humano completo. Para comparar la información a la base de datos, se necesita un protocolo de búsqueda tales como FASTA para crear un formato coherente de la búsqueda de la información.

Definición

FASTA es un formato de secuencia utilizado para analizar estructuras de proteínas en contra de una base de datos conocida de secuencias de ADN. La base de datos proporcione resultados FASTA en función de su puntuación de similitud. Cada lista de resultados devuelve hasta 200 secuencias similares. FASTA es un formato basado en texto que utiliza una letra para representar los aminoácidos y los pares de bases.

Bases de datos

Hay un par de diferentes bases de datos que el formato FASTA se utiliza para comparar. El primero es UniProtKB. El centro de datos contiene los datos sobre cómo funcionan las proteínas. Los investigadores también pueden utilizar un subconjunto de la base de datos para comparar una secuencia de proteínas. La segunda base de datos se conoce como UniRef100 combina conjuntos de datos de la base de datos UniProt y otro para ocultar las secuencias redundantes.

Sintaxis

El formato FASTA comienza con una línea de descripción, seguido de los datos de secuencia. La descripción comienza con un símbolo de mayor que. Esto indica que la línea no es parte de la secuencia de datos a buscar. La secuencia de la proteína comienza en la segunda línea con menos de 80 caracteres por línea. Si hay un hueco en la secuencia, un guión se utiliza para identificar la brecha. Sólo un guión se debe utilizar no importa la sospecha de longitud de la brecha.

Propósito

El propósito de el formato FASTA es ayudar a los investigadores en la identificación de secuencias de la proteína y su función al compararla contra secuencias de ADN conocidas. Si la secuencia exacta no se puede encontrar, los resultados pueden ayudar a los investigadores en la determinación de la función de la proteína.