Parallelization of bioinformatics methods using a computational grid
Abstract:
Recent advances in
computer science improve research in several areas. These include an area with
great emphasis, the biology, which is the field of study of this work. The use
of computer for analysis of data, and processing methods of biology is called
bioinformatics. However, when are analyzed DNA sequences from complex organisms
which have thousands nucleotides is required a greater processing power. Due to
the increase the amount of data to be processed we can use HPCA. Within this
context in this work, we study the use of computing capabilities in performance
processing DNA sequences. More specifically the parallelization of methods used
by the research group in bioinformatics at UCS(University of Caxias do Sul).
For development this work we chose to use computational grids, since this type
of platform provides a high processing capacity at low cost.
References:
[1.] ANDRADE,
N.;COSTA, L .;GERMÓGLIO, G.; CIRNE, W.; Peer-to-peer grid computing with the
OurGrid Community. Universidade Federal de Campina Grande, Campina Grande,
2005.
[2.]
ANDRADE, N.; CIRNE W.; BRASILEIRO, F.; OurGrid: An Approach to Easily Assemble
Grids with Equitable Resource Sharing. Federal University of Campina Grande,
Campina Grande, 2003.
[3.]
BUYYA, R. High Performance Cluster Computing: Architectures and Systems.
[S.l.]: Prentice Hall, 1999.
[4.]
CIRNE, W.; NETO, E. S.; Grids Computacionais: Da Computação de Alto Desempenho
a Serviços Sob Demanda. Fortaleza, CE: SBC, Federal University of Ceara, State
University of Ceara, 2005.
[5.]
DANTAS, M. Computacão distribuída de alto desempenho. Rio de Janeiro: Axcel
Books, 2005.
[6.]
FARACH, M.; NOORDEWIER M.; SAVARI S.; SHEPP L.; WYNER A.; ZIV J.; On the
entropy of DNA: Algorithms and measurements based on memory and rapid
convergence. Proc. 5th Annual ACM-SIAM symposium on Discrete Algorithms; ACM-SIAM,
1994.
[7.]
FOSTER Ian. Designing and Building Parallel Programs. 1. ed. Reading, USA:
Addison Wesley, 1995.
[8.]
GERHARDT ,G. J.L.; LEMKE, N.; CORSO,G.;Network clustering coefficient approach
to DNA sequence analysis; Paper published in Chaos, Solitons and Fractals,
2005;
[9.]
GERHARDT ,G. J. L.; PANIS, R. J.; SANTOS, L. Presença de Períodos em Sequências
de DNA. Caxias do Sul: UCS, Artigo não publicado, ano 2004.
[10.]
GERHARDT, G. J. L., SILVA, S. de A.; PANIS, R. J.; SANTOS, L. dos; Correlações
entre Cromossomos Usando Periodicidades em Seqüências de DNA. II Workshop of
Technology in Computer Applied at Natural Enviroment; Publicado em 2004.
[11.]
GIBAS, C.; JAMBECK, P.; Developing Bioinformatics Computer Skills; Estados
Unidos, O’Reilly, 2001.
[12.]
HAYKIN, S.. Neural networks: a comprehensive foundation. 2. ed. New Jersey:
Prentice-Hall, 2005.
[13.]
HORTA, J. O. C.; Estimadores de Entropia para Sequências de DNA; 2001; 144p.
Dissertation (Masters dissertation in Computer Applied) - University of Sao
Paulo, São Paulo.
[14.]
JACOB, B.; BROWN, M.; FUKUI, K.; TRIVEDI, N. Introduction to Grid Computing. ,
2005. Disponvel em: http://www.redbooks.ibm.com/abstracts/sg246778.html. Access
in: october. 2009.
[15.]
KONIGES, A. E.; Industrial Strength Parallel Computing; San Francisco,
California, Morgan Kaufmann Publishers, 2000.
[16.]
LESK, Arthur M., Introdução à Bioinformática, 2a Ed.- Porto Alegre: Artmed,
2008.
[17.]
LEWIN, B.; Genes VII; 1.ed.; Porto Alegre, Artmed, 2001.
[18.]
MARIANI, M. A. ,GERHARDT, G. J. L., SILVA, S. de A.;MARTINOTTO, A. L.,
ECHEVER-RIGARAY, S.; Utilização de Grids Computacionais para a Paralelização de
um Algoritmo de Aprendizado de Máquina; XVII Encontro de Jovens Pesquisadores
da UCS; 009.
[19.]
MOUNT, David W. Bioinformatics : Sequence and Genome Analysis. New York: Cold
Spring Harbor Laboratory, 2000.
[20.]
NELSON, D. L.; COX, M. M.; Lehninger Princípios de Bioquímica.; 3.ed.; São
Paulo, Sarvier, 2002.
[21.]
Regulon DB. Disponvel em: <http://regulondb.ccg.unam.mx>. Access in:
october. 2009.
[22.]
RUSSELL, S.; NORVIG, P.; Inteligencia Artificial; Rio de Janeiro. Elsevier.
2004.
[23.]
SANTOS, L. dos;Caracterização Computacional de Padrões Estruturais em
Sequências de DNA Relacionadas a Processos em Redes Metabólicas; 2009; 127p.;
Dissertation(Masters dissertation in Computer Applied) – National Institute of
Space Research(INPE), São José dos Campos.
[24.]
SEEFELD, K.; R For Bioinformatics; OREILLY & ASSOC; 2005
[25.]
SHANNON, C.; WEAVER, W. The Mathematical theory of communication. 5 ed.
Urbana/Chicago, Illinois State University Press, 1963
[26.]
SILVA, S. de A.; Redes Neurais Artificiais Aplicadas na Caracterização e
Predição de Regiões Promotoras; 2006; 144 p.; Dissertation (Masters
dissertation in Computer Applied) - University of Vale dos Sinos(UNISINOS), São
Leopoldo.
[27.] TANENBAUM, A. S.;Organização
Estruturada de Computadores; Rio de Janeiro, RJ, Livros Técnicos e Científicos
Editora, 2007.
[28.]
VOET, D.; VOET J. G.; Bioquímica; 3.ed; Porto Alegre, Artmed, 2006.
[29.]
WHEELER, David L.; BARRET, Tanya; BENSON, Dennis A.; BRYANT, Stephen H.;
Canese, Kathi; CHETVERNIN, Vyacheslav; CHURCH, Deanna M.; DICUCCIO, Michael;
EDGAR, Ron; FEDERHEN, Scott; GEER, Lewis Y.; HELMBERG, Wolfgang; KAPUSTIN,
Yuri; KENTON, David L.; KHOVAYKO, Oleg; LIPMAN, David J.; MADDEN, Thomas L.;
MAGLOTT, James Ostell; PRUITT, Kim D.; SCHULER, Gregory D.; SCHRIML, Lynn M.;
SEQUEIRA, Edwin; SHERRY, Stephen T.; SIROTKIN, Karl; SOUVOROV, Alexandre;
STARCHENKO, Grigory; SUZEK, Tubga O.; TATUSOV, Roman; TATUSOVA, Tatiana A.;
WAGNER, Lukas; YASCHENKO, Eugene. Database resources of the National Center for
Biotechnology Information. Nucleic Acids Research, v. 34, 2006.