Mini-BLAST: computer systems to search for the pattern sequences in the bioinformatics databases

GENNADIY BURLAK

Bioinformatics focuses on developing and applying computationally intensive techniques to increase the understanding of biological processes. In this report we describe the compact computer system Mini-BLAST, designed to find DNA sequences in bioinformatics databases placed in local or web configurations. Our system allows the identification of gene sequences relating to new patterns (metagenome) that are not yet identified in such databases, containing data on known nucleotides. Such a task is a quite expensive and time consuming operation; therefore, for large genomes parallel algorithms are required. We developed a user-friendly graphical interface that allows the simple input of query data and outputs representative statistical analysis. Additionally, users can select particular databases for cases when a specific alignment is required. Although the package is developed in MS .NET 3.5/4.0 Visual C# system, it works with no limitations in Linux through the Mono framework.

La bioinformática se enfoca en el desarrollo y aplicación de técnicas de cómputo intensivo con la finalidad de incrementar el entendimiento de procesos biológicos. En este reporte describimos un sistema computacional compacto (Mini-BLAST) que encuentra similitudes entre secuencias de ADN (ácido desoxirribonucleico) en bases de datos bioinformáticas almacenadas de forma local o en configuraciones web. Nuestro sistema permite identificar secuencias de genes nuevas, tales como metagenomas, a partir de secuencias nucleotídicas conocidas. Dado que esta tarea consume mucho tiempo y recursos computacionales, para genomas grandes se requiere procesamiento en paralelo. Desarrollamos una interfaz gráfica amigable al usuario que permite introducir de manera simple datos y devuelve análisis estadísticos representativos a la salida. Adicionalmente, el usuario puede seleccionar determinados organismos de las bases de datos, cuando requiere alineamientos más específicos. Este paquete fue diseñado en MS .NET 3.5/4.0 Visual C#, sin embargo funciona sin limitaciones en Linux a través del sistema Mono.

Tipo de documento: Artículo

Formato: Adobe PDF

Audiencia: Investigadores

Idioma: Inglés

Área de conocimiento: INGENIERÍA Y TECNOLOGÍA

Campo disciplinar: CIENCIAS TECNOLÓGICAS

Nivel de acceso: Acceso Abierto