I SIMPOSIO DE APLICACOES DA INFORMATICA EM BIOLOGIA Campinas, 4 a 6 de agosto de 1993 RESUMOS Universidade Estadual de Campinas Agosto de 1993 Editor: Renato M.E. Sabbatini Universidade Estadual de Campinas (c) 1993 Universidade Estadual de Campinas ---------- PROMOCAO Nucleo de Informatica Biomedica Disciplina de Informatica Medica da Faculdade de Ciencias Medicas Universidade Estadual de Campinas APOIO Instituto de Biologia Empresa Junior de Biologia Universidade Estadual de Campinas Sociedade Brasileira de Informatica em Saude COMISSAO ORGANIZADORA Renato M.E. Sabbatini (NIB e FCM/UNICAMP) Marcelo Okamoto Tanaka (IB/UNICAMP e EJB) Carlos Eduardo Nascimento de Lima (NIB/UNICAMP e EJB) Joao Meidanis (IMECC/UNICAMP) Raul Neder Porrelli (NIB/UNICAMP) Hilton Silveira Pinto (CEPEAGRI e CCUEC/UNICAMP) Jacques Vieilliard (IB/UNICAMP) Alexandre Gianini Martins (NIB/UNICAMP) ------- PREFACIO Este pequeno volume reune as contribuicoes apresentadas ao I Simposio de Aplicacoes da Informatica na Biologia (InfoBio'93), realizado na Universidade Estadual de Campinas, SP, em agosto de 1993. O InfoBio'93 foi uma iniciativa conjunta do Nucleo de Informatica Biomedica (NIB), da Disciplina de Informatica Medica do Departamento de Genetica Medica da Faculdade de Ciencias Medicas e da Empresa Junior de Biologia (EJBU), todos da Universidade Estadual de Campinas (UNICAMP). Esta iniciativa recebeu o apoio oficial do Instituto de Biologia (IB) da UNICAMP e da Sociedade Brasileira de Informatica em Saude (SBIS). Embora este nao tenha sido o primeiro evento do genero (varios outros congressos biologicos, como os de Zoologia, e algumas reunioes da Sociedade Brasileira para o Progresso da Ciencia e da Federacao das Sociedades de Biologia Experimental, tiveram em seu bojo iniciativas similares), queremos crer que este e' foi o primeiro evento isolado de relativo porte realizado no Brasil. Como parte da missao institucional do Nucleo de Informatica Biomedica (NIB) da UNICAMP, esta a difusao, pesquisa e ensino de novas tecnologias baseadas na Informatica nos campos de Biologia e Saude. Entretanto, os biologos demoraram a acordar para o potencial e as novas realidades proporcionadas pela Informatica em sua area. Em consequencia, a demanda inicial sobre o NIB foi bem maior a partir da area medica, a qual se organizou mais cedo do que as demais (o primeiro Simposio foi em 1985, e o primeiro Congresso Brasileiro em 1986, juntamente com a primeira revista especializada e a primeira sociedade cientifica na area). Em julho de 1993 o NIB completa 10 anos de atividade. Muito apropriadamente, frente a importancia cada vez maior que a Informatica assume perante as atividades de pesquisa e ensino em Biologia, resolvemos comemorar o aniversario promovendo um evento especifico, com uma programacao inteiramente dedicada as aplicacoes em Biologia, e a computacao inspirada biologicamente. Embora o numero de trabalhos apresentados tenha sido relativamente pequeno, reflete com fidelidade a variedade das areas de interacao entre Biologia e Informatica, e demonstra o rapido crescimento desta area multidisciplinar no Brasil. Uma ideia do valor da Informatica para a Biologia pode ser dada pelo fato de que, pela primeira vez em nosso grupo, um congresso cientifico de certa complexidade foi inteiramente organizado utilizando-se o correio eletronico (redes academicas Internet, Bitnet e Rede Nacional de Pesquisa), desde a divulgacao do evento e das sucessivas versoes do seu programa, ate' o envio de todos os resumos e a correspondencia com todos os palestrantes. Outro fato significativo e' que uma versao eletronica destes anais foi tornada disponivel para acesso remoto, em um computador da UNICAMP ligado a rede Internet. Esperamos sinceramente que este evento nao seja o ultimo da serie (como infelizmente acontece tantas vezes no Brasil), e que outros venha a ocorrer, fomentando o desenvolvimento de um setor ainda carente no Brasil, mas que ja e' big science nos paises mais desenvolvidos. Campinas, agosto de 1993 Renato M.E. Sabbatini Presidente da Comissao Organizadora RESUMOS INFORMATICA E BIOLOGIA: A NOVA ALIANCA Sabbatini, R.M.E. Depto. Genetica Medica, Faculdade de Ciencias Medicas e Nucleo de Informatica Biomedica da UNICAMP, Campinas, SP Email: sabbatini@ccvax.unicamp.br Gradualmente, nos ultimos cinco anos, a Biologia tem se apropriado com avidez das ferramentas proporcionadas pela Informatica. Esta progressao tem sido tao rapida e avassaladora, que ja existem nao apenas uma, mas varias subespecialidades da Biologia e da Informatica que formam um mosaico multidisciplinar riquissimo, onde aos poucos a antiga distincao entre as duas areas se dissolve. Biologia computacional, genetica computacional, ecologia matematica, algoritmos geneticos ou evolutivos, redes neurais artificiais, sao hoje varias dessas denominacoes que tipificam a interacao entre Informatica e Biologia; nos dois sentidos: desde conceitos de Biologia, como evolucao natural e auto- organizacao de tecidos vivos, inspirando a criacao de novas areas das ciencias exatas; ate' novas e poderosas tecnicas sendo criadas com a finalidade especifica de resolver complexos problemas de processamento de dados e conhecimentos biologicos, tais como a comparacao de sequencias de polimeros biologicos, os bancos de dados geneticos, a predicao de estruturas moleculares, etc. De forma mais fascinante ainda, constata-se que o circulo de influencia mutua entre as duas disciplinas se fecha, quando se constata a cada vez mais intensa utilizacao de tecnologias biologicamente inspiradas (por exemplo, algoritmos geneticos), para resolver problemas da propria Biologia ! Um dos grandes estimulos para o desenvolvimento acelerado da Informatica Biologica tem sido, sem duvida, o esforco conjugado de mapeamento do genoma de diversas especies. Sem a ajuda da Informatica, qualquer um desses esforcos, mesmo os dos organismos mais simples, como a levedura, seria impossivel. Tanto e' assim que o famoso projeto HUGO (mapeamento do genoma humano) tem investido grandes somas de dinheiro na infraestrutura computacional. Outro estimulo importante e' o crescimento de diversas linhas de pesquisa, reunidas sob o nome de Sistemas Complexos, que procura caracterizar, modelar e simular (novamente com a ajuda de computadores) diversos sistemas biologicos termodinamicamente abertos, como sistemas auto-organizados, aprendizado, sociedades animais, sistemas caoticos, transmissao e armazenamento de informacao genetica, etc. Um grande estimulo para a Biologia Computacional e para a Informatica Biologica tem sido as bases de dados biologicos informatizadas e as redes academicas internacionais. Atualmente, e impensavel realizar pesquisa, desenvolvimento e producao em certas areas da Biologia, como Engenharia Genetica, Taxonomia, etc., sem o acesso as bases de dados contendo sequencias de DNA, genomas, proteinas, organismos, etc. O acesso internacional e a contribuicao acelerada a essas bases, assim como a comunicacao entre os biologos e demais profissionais trabalhando na area sao enormemente facilitados pelas redes Internet, Bitnet e outras, que por sua vez servem de esqueleto para implementar numerosas redes conceptuais, tais como a do Centro Internacional de Engenharia Genetica, de Trieste; da Rede Brasileira de Biologia Molecular, da EMBRAPA, da Base de Dados Tropical, da Fundacao "Andre' Tosello", etc. Algumas organizacoes de pesquisa biologica, como o European Molecular Biology Laboratory (EMBL), em Heidelberg, e outras, assumiram o papel de gigantescas provedoras de informacao em forma eletronica em Biologia. O crescimento da Informatica Biologica e da Biologia Computacional tambem se reflete no grande numero de novos titulos de revistas especificamente dedicadas ao tema, congressos, livros, etc.; e ate os primeiros cursos de pos-graduacao. A realidade do dia-a-dia do biologo foi irreversivelmente mudada com o uso do microcomputador e da estacao de trabalho como ferramentas de acesso, armazenamento e manipulacao de dados. E' possivel que a Biologia seja a primeira ciencia natural complexa a transpor os limiares estabelecidos pelas ciencias eminentemente quantitativas, como a Fisica. Se isso acontecer, certamente sera por merito quase exclusivo da Informatica, que se constitui como a unica metodologia capaz de enfrentar a complexidade matematica dos sistemas biologicos. --------------------------------- Processamento de Sinais e Imagens DIGITAL IMAGE PROCESSING APPLICATIONS TO BIOLOGY Amman, J.-J. Instituto de Biologia da UNICAMP, Campinas, SP Email: jjacques@ibi.unicamp.br Images have always been one of the most useful tools in biological sciences. Classification of living beings and determination of their structure is principally based on images obtained from naked eye observations, optical microscopes and then electron microscopes, both scanning and transmission, and now from the new generation of tunelling and atomic force microscopes and from high resolution light microscopes. If the image acquisition is a primordial step in any of these techniques, the analysis of images is not, by far, a simple task. Basically due to the very high amount of information catched in an image, extraction the information that is really significant and useful for a specific research has long had the only support of the extraordinary power of the human brain. However, modern research requires higher and higher precision along with a satisfactory reproducibility in the measurements, two properties in which the human brain is not so comfortable. This is especially critical in the biomedical domain where objects are often subject to large variation, and where the effects of a treatment are often small and require a large scale of time to develop. Thus the development of more powerful computers along with a large flexibility and good users interfaces is giving to image analysis a new scope which will soon become as important as the step of image acquisition itself for the researcher. We will try to present here some basic ideas on digital image processing and analysis and show how these powerful tools can be used in biology. As illustrations, several examples will be shown. INTELIGENCIA ARTIFICIAL E REDES NEURAIS EM PROSPECCAO AMBIENTAL E SENSORIAMENTO REMOTO Engel, P.M. Instituto de Informatica da Universidade Federal do Rio Grande do Sul, Porto Alegre, RS Email: engel@inf.ufrgs.br A classificacao de imagens baseada em computador e' de grande importancia em muitas aplicacoes. Especialmente imagens multiespectrais de superficies, tomadas por satelites de sensoriamento remoto, podem contribuir de forma destacada na area de protecao ambiental, por exemplo, para supervisionar e interpretar danos em florestas. Para esta finalidade, os dados referentes as imagens obtidas devem ser classificados por metodos apropriados de reconhecimento de padroes oticos, apos serem preprocessados adequadamente. Metodos convencionais usualmente aplicam uma classificacao de Bayes combinada com uma estimativa do tipo maxima probabilidade, ou ainda com metodos de regressao, parametrizados anteriormente a classificacao, por areas de treinamento selecionadas. Ambos estes metodos apresentam restricoes em relacao a morfologia dos clusters individuais a serem separados no espaco de caracteristica. Por este motivo, os resultados obtidos com estes metodos sao somente em parte satisfatorio, principalmente para vetores de caracteristica que nao sejam distribuido de forma gaussiana. Alem disso, para os varios canais espectrais o vetor de caracteristica inclui nao so valores de pixel puro, mas tambem informacao de textura. A analise desta situacao no espaco de caracteristica e a avaliacao de areas de treinamento podem ser realizados por metodos de analise de clusters, nao- supervisionados. Uma alternativa bastante favoravel para os metodos convencionais de classificacao, se constitui no emprego de redes neurais artificiais (RNA). Hoje em dia se dispoe de arquiteturas neurais que apresentam bons desempenhos, tanto para os metodos de reconhecimento supervisionado, como para o reconhecimento nao-supervisionado. Dentre as arquiteturas neurais que implementam algoritmos de classificacao supervisionada se destaca a chamada rede de Perceptrons multicamada, tambem conhecida como rede Backpropagation, devido ao nome do seu algoritmo de treinamento. Estas redes apresentam resultados de classificacao muito bons, mas exigem a especificacao de um arquivo de treinamento, com entradas e saidas conhecidas, que cubra uniformemente o espaco de caracteristica. Devido a complexidade das imagens multiespectrais, uma boa estrategia para a analise destas imagens se constitui na combinacao de algoritmos nao-supervisionados com metodos supervisionados. Neste sentido, as redes neurais permitem a realizacao dos chamados mapas de caracteristica auto- organizados (SOM), que implementam a clusterizacao dos vetores de caracteristica, segundo metodos de auto-organizacao topologica. Uma rede deste tipo, realiza a projecao do espaco multidimensional dos vetores de caracteristica, sobre um espaco bidimensional de neuronios. A partir desta clusterizacao, pode- se empregar tecnicas de classificacao supervisionada do tipo quantizacao vetorial adaptativa (LVQ), atingindo assim resultados de classificacao bastante bons. Alem das redes neurais, outras tecnicas de inteligencia artificial podem ser empregadas na analise de imagens multiespectrais. Em especial, a logica fuzzy tem encontrado aplicacao na tomada de decisao dos classificadores. Aqui, a principal aplicacao esta relacionada com a utilizacao de funcoes de pertinencia de conjuntos fuzzy, para a classificacao dos chamados pixel mistura, onde mais de uma classe ocorre simultaneamente dentro de um mesmo pixel. Com a utilizacao desta metodologia consegue-se aumentar sensivelmente o indice de classificacao correta do sistema. INTERPRETACAO DE IMAGENS DE SATELITE DA AMAZONIA USANDO REDES NEURAIS Machado, R.J. Centro Cientifico Rio, IBM Brasil Email: machado@riosc.bitnet O Centro Cientifico Rio da IBM Brasil participa conjuntamente com o INPE de um projeto que preve o desenvolvimento de um sistema de extracao automatica de informacao de imagens da Amazonia brasileira, obtidas por sensoriamento remoto, com o objetivo de identificar os diversos temas de interesse para avaliacao do processo de desflorestamento. Atualmente este tipo de atividade e' realizado manualmente por especialistas humanos, cuja produtividade nao e' suficiente para dar conta do grande volume de dados novos continuamente produzidos, bem como para analisar imagens muito complexas, tais como as imagens da colonizacao do estado de Rondonia. A abordagem usada para interpretacao das imagens processa-se em duas fases. A primeira fase, ao contrario da abordagem usual pixel-a-pixel, consiste na segmentacao da imagem em regioes espectralmente homogeneas (chamadas de segmentos) pela aplicacao de uma tecnica de crescimento de regioes. Na segunda fase, cada segmento e entao classificado em uma ou mais das categorias tematicas Floresta, Cerrado, Agua, Area Desflorestada, Nuvem, Sombra, e Pluma. As quatro primeiras categorias englobam toda informacao relevante a ser monitorada sendo chamadas de categorias basicas. As tres ultimas categorias refletem as interferencias ocasionadas ao processo de classificacao pela presenca de nuvens, sombras e fumaca nas imagens. A classificacao dos segmentos nessas categorias segue uma abordagem de logica nebulosa, ou seja, um segmento pode pertencer a multiplas categorias com graus parciais de pertinencia. Dessa forma e' possivel modelar fenomenos de transicao, por exemplo uma area desmatada que se regenera atraves de um processo de rebrota. A arquitetura do classificador e' baseada numa rede neural treinada usando o modelo de Retropropagacao de Erros (backpropagation). A arquitetura implementa tambem um procedimento de relaxacao no topo da rede neural treinada com backpropagation, com o intuito de se beneficiar das relacoes de vizinhanca entre segmentos adjacentes. Os resultados obtidos durante testes dessa arquitetura, usando um conjunto de cenas tipicas e de cenas consideradas dificeis, revela um grande potencial para a automacao da tarefa de automatizacao da tarefa de monitoramento ambiental da Amazonia. ANALISE DIGITAL DE GLOMERULOS RENAIS Andrade, M.C. 1,2; Araujo, A.A. 1; Santos, A.M.M. 2; Lameiras, F.S. 2; Bambirra, E.A. 3 1 Departamento de Ciencia da Computacao, Universidade Federal de Minas Gerais Belo Horizonte; 2 Centro de Desenvolvimento da Tecnologia Nuclear, Comissao Nacional de Energia Nuclear, Belo Horizonte, 3 Departamento de Anatomia Patologica, Universidade Federal de Minas Gerais, Belo Horizonte Email: andrade@dcc.ufmg.br, arnaldo@dcc.ufmg.br, cdtn@brufmg A analise digital da estrutura dos glomerulos renais, atraves de imagens de secoes planas de fragmentos cirurgicos ou biopsias do cortex renal, fornece ao nefrologista um padrao sistematico de avaliacao da morfologia destas microestruturas. Nos casos de transplantes renais, o farmaco imunossupressor utilizado para evitar a rejeicao do orgao transplantado, por exemplo a Ciclosporina (CsA), induz alteracoes morfologicas significativas na estrutura glomerular [Kumar-89], que podem ser quantificadas atraves da analise digital de imagens. A estrutura microscopica dos rins revela a presenca de elementos denominados nefrons que sao essencialmente identicos em estrutura e funcao. Cada nefron consiste de um glomerulo e um tubulo. A parte interna do glomerulo e composta de um tufo de capilares, de forma quase esferica, envolto por uma capsula de parede dupla, denominada capsula de Bowman. Esta parede constitui a membrana filtrante do glomerulo. O espaco entre o tufo de capilares e a parede interior da capsula esta em contato direto com a luz do tubulo. Neste trabalho, a experiencia inicial dos autores com a analise digital de glomerulos renais e descrita e ilustrada. Duas situacoes foram estudadas: a evolucao das estruturas glomerulares em biopsias percutaneas, feitas em rim transplantado em paciente tratado com CsA [Araujo-93], para tres instantes de tempo apos o transplante e a determinacao da distribuicao volumetrica destas estruturas, em um fragmento cirurgico do cortex renal [Andrade-93], empregando-se o metodo estereometrico de Saltykov [Saltykov-74], [Elias-71]. Os fragmentos foram retirados da superficie do cortex renal, fixados em parafina e seccionados atraves de microtomo produzindo secoes de poucos micrometros de espessura. As secoes foram coletadas em laminas histologicas de vidro, fotografadas atraves de microscopio otico e, entao, digitalizadas atraves de um scanner de mesa com resolucao mantida em 200 dpi e 256 niveis de cinza. Nas imagens aqui utilizadas, frequentemente, se fez necessario retificar, de forma manual, as bordas mal definidas das capsulas de Bowman. Apos a etapa de edicao as imagens foram segmentadas e a partir delas determinaram-se as areas e os diametros equivalentes de cada uma das seguintes regioes de interesse: a area total da secao de corte do glomerulo, a area da luz glomerular entre a capsula de Bowman e o tufo de capilares e, tambem, a area do tufo de capilares. Cada regiao de interesse foi previamente preenchida, com coloracoes convenientemente escolhidas, de forma a permitir o processamento automatico das imagens. Os seguintes resultados foram obtidos: para o caso das biopsias observou-se que o efeito da CsA sobre os glomerulos significou um aumento global do volume glomerular durante o tratamento. Determinou-se, tambem, que a fracao volumetrica glomerular representou 7% do volume do cortex renal para os tres instantes de tempo analisados. Para os fragmentos cirurgicos mediu-se a distribuicao de tamanhos de capsulas e tufos dos glomerulos do cortex renal com auxilio de metodo estereometrico de Saltykov. Observou-se que os volumes mais frequentes aparecem na classe de maior diametro (~ 212 *m ) e que as frequencias de ocorrencia nas demais classes e significativamente menor. Deduz-se que os glomerulos possuem volumes concentrados numa faixa de valores relativamente pequena. Tanto as capsulas quanto os tufos analisados apresentaram alta esfericidade e volumes numa pequena faixa de valores (relacao diametro maximo / diametro minimo de 2,1 para os tufos e 2,7 para as capsulas). Neste trabalho, foi utilizado um analisador de imagens [Andrade-93] desenvolvido pelo Nucleo de Processamento Digital de Imagens - NPDI (DCC-UFMG), originalmente concebido para analise de materiais ceramicos [Chermant-86]. A versao prototipo do analisador foi implementada sobre a interface PIXELWARE [Davis-92] em microcomputador 486, dotado de placa grafica SuperVGA. Parte dos algoritmos de imageamento microscopico, aqui utilizados, baseou-se no conjunto de subrotinas SPIDER [Tamura-82]. M. C. Andrade, Imageamento microscopico. Belo Horizonte: UFMG, 1993. Dissertacao (mestrado em computacao), UFMG, 1993. A. de A. Araujo, et al. Digital processing of histopathological aspects in renal transplantation. Proceedings of the IS&T/SPIE. Conf. 1905, Biomedical Image Processing and Biomedical Visualization, 1993. J. L. Chermant, Characterization of the ceramics by image analysis .Ceramics International. v. 12, p. 67-80, 1986. C. Davis Jr., PIXELWARE: Um sistema de processamento digital de imagens. Belo Horizonte: UFMG, 1992. Dissertacao (mestrado em computacao), UFMG, 1992. S.A. Saltykov, Stereometrische Metallographie, Leipzig, VEB , 1974. H. Tamura et al., Design and implemetation of SPIDER - a transportable image processing software package .Computer Vision, Graphics and Image Processing, v. 23, p. 273-294, 1982. H. Elias et al. Stereology: Application to biomedical research. Physiological Reviews, v. 51, n. 1, p.158-200, 1971. M. S. A. Kumar et al., Chronic cyclosporine nephrotoxity in renal transplantation: Is it effect or preservation?, Transplantation Proceedings, v. 21, p. 1552-1553, 1989. Agradecimentos ao Conselho Nacional de Desenvolvimento Cientifico e Tecnologico - CNPq ( 400190/90-7, 500908/91-5 ) e Fundacao de Amparo C Pesquisa do Estado de Minas Gerais - FAPEMIG ( TEC 1113-90 ) pelo apoio financeiro a este trabalho. PROCESSAMENTO DIGITAL DE VOCALIZACOES Viellard, J.M.E. Departamento de Zoologia, Instituto de Biologia UNICAMP e CNPq) Vocalizacoes sao os sons produzidos pelos orgaos vocais de certos animais (principalmente as siringes das aves e laringe dos mamiferos e anfibios) atraves da compressao periodica de um fluxo de ar. Sao usadas como sinais portadores de informacao para a comunicacao. Essas variacoes de pressao do meio de transmissao (ar ou agua) sao sinusoidais, simples (som puro) ou complexas. Apesar das sinusoidais serem curvas continuas, elas podem ser facilmente digitalizadas por serem, no caso das vocalizacoes, periodicas, ou seja, repetitivas (o que nao se verifica nos sons instrumentais estalidos). A teoria indica que uma sinusoide pode ser reconstituida com somente 3,4 valores por ciclo; dai a taxa de amostragem precisa ser somente 3,4 vezes a frequencia mais alta do som a ser digitalizado. No caso dos sons complexos ou sobrepostos, a resultante e' facilmente decomposta em sinusoides simples por tratamento matematico (Transformacao de Fourier): hoje o computador realiza esta operacao quase instantaneamente (real time) com o algoritmo FFT (Fast Fourier Transform). O som digitalizado pode ser arquivado sob a forma binaria (disco CD, fita DAT, computador) para ser reproduzido ulteriormente. Ele tambem pode ser tratado atraves de programas de edicao. Finalmente, pode ser representado por seus parametros fisicos (frequencia, amplitude e duracao calculado diretamente a partir dos valores das componentes sinusoidais digitalizados. Isto facilita muito a analise fonografica (medicao e representacao grafica dos parametros sonoros) das vocalizacoes animais. FRAGMENTACAO AUTOMATICA DO SONO UTILIZANDO REDES NEURONAIS Coimbra, A.J.F. Grupo de Engenharia Biomedica, Centro de Tecnologia da Universidade Federal de Santa Catarina, Florianopolis, SC Email: alex@gpeb.ufsc.br Esta' sendo implementado um sistema de analise automatizada de EEG para fragmentacao do sono utilizando alguns algoritmos de extracao de caracteristicas do sinal e redes neuronais para classificacao das fases do sono. Analises visuais de registros prolongados de EEG sao trabalhosas e consomem muito tempo do especialista. Registros prolongados sao necessarios, por exemplo, na monitoracao continua de pacientes epileticos em vigilia e/ou durante o sono, em polissonografia noturna para caracterizar disturbios do sono e/ou para realizar fragmentacao do sono. O estudo da fragmentacao do sono pode ser interessante para avaliar o efeito de drogas ou stress ambiental sobre as fases do sono. Variacoes nas caracteristicas das fases podem ser utilizadas como marcadores biologicos em disturbios psiquiatricos tais como a depressao endogena. Segmentadores automaticos de sono vem sendo desenvolvidos ja' ha alguns anos e, com o advento dos microcomputadores (e com o aprimoramento de suas caracteristicas de velocidade e poder de processamento), vem se tornando mais e mais acessiveis. Atualmente estao sendo pesquisados os algoritmos de extracao de caracteristica do sinal. Estes algoritmos extraem do sinal informacoes como as contribuicoes energeticas de cada faixa de frequencia de interesse (teta, delta, alfa, beta), os coeficientes de modelos autorregressivos (AR) do sinal, e as caracteristicas de amplitude-frequencia das ondas (evento contido entre dois extremos locais) componentes do sinal. Estas informacoes sao fornecidas as entradas das redes neuronais que realizam a classificacao das fases. Pretende-se utilizar o sistema para auxiliar em pesquisas de efeitos de drogas em pombos (COLUMBA LIVIA) realizadas no Depto. de Ciencias Fisiologicas - CCB da Universidade Federal de Santa Catarina. Futuramente pretende-se implementar um sistema similar para humanos, que encontrara aplicacao no Grupo de Eletroencefalografia do Hospital Universitario da UFSC. TECNICAS PARA ANALISE DE RITMOS BIOLOGICOS Benedito-Silva, A.A.; Menna-Barreto, L. Grupo Multidisciplinar de Desenvolvimento e Ritmos Biologicos. Depto. Fisiologia e Biofisica, ICB, Universidade de Sao Paulo, Brasil. Email: mennaicb@brusp.bitnet Serao apresentados alguns sistemas computacionais que implementam tecnicas de analise de ritmos biologicos. Estes sistemas foram confeccionados em nosso laboratorio de acordo com as necessidades atuais das nossas pesquisas. Foram desenvolvidos em Fortran-77 o programa COSANA, baseado no procedimento do cosinor individual, e o programa denominado COSPOP que estima os parametros ritmicos de uma populacao. Foi tambem desenvolvido um programa em FORTRAN-77 para investigar os componentes espectrais de uma serie temporal de dados de ciclo vigilia/sono, de acordo com um algoritmo que correlaciona uma serie de dados com ondas quadradas, no caso as funcoes de Walsh. Foram tambem desenvolvidos programas em dBase 3 Plus para detectar a periodicidade dominante numa serie temporal, baseado no teste de Fisher (1929), bem como periodicidades compostas, baseado no teste de Siegel (1980). Um programa em Turbo- Pascal foi tambem confeccionado para analisar dados atraves das tecnicas de estatistica circular. TESTE PARA DETECTAR PERIODICIDADES COMPOSTAS EM SERIES TEMPORAIS Benedito-Silva, A.A.; Menna-Barreto, L. Grupo Multidisciplinar de Desenvolvimento e Ritmos Biologicos. Depto. Fisiologia e Biofisica, ICB, Universidade de Sao Paulo, Brasil. Email: mennaicb@brusp.bitnet Testes para detectar periodicidades compostas em series temporais biologicas sao uteis em pesquisas relacionadas com intermodulacao de frequencias em ritmos biologicos. Uma aplicacao possivel destes testes e' a investigacao de componentes espectrais vigilia/sono nos primeiros meses de vida. O objetivo deste trabalho e' apresentar a adaptacao a Cronobiologia de um teste para deteccao de periodicidades compostas (J.Amer.Stat.Assoc. 75: 345, 1980). Este teste consiste numa modificacao do teste de Fischer (Proc. Royal Soc. Ser.A, 125: 54, 1929) uma vez que ele se baseia nas ordenadas do periodograma, e nao apenas na maior delas. Os espectros de potencia Fourier do ciclo vigilia/sono de 5 criancas, com idades variando de 3 a 14 meses foram coletados e submetidos a este teste. A partir dos resultados obtidos, foi possivel verificar que o conjunto de oscilacoes ritmicas simultaneamente significativas varia de acordo com, contribuindo para uma investigacao ontogenetica do ciclo vigilia/sono. ------------------------------------------------------ Aplicacoes em Biologia Molecular e Engenharia Genetica ENGENHARIA GENETICA E INFORMATICA Leite, A. Centro de Biologia Molecular e Engenharia Genetica (CBMEG), Universidade Estadual de Campinas, SP Email: cbmeg@ccvax.unicamp.br Devido a caracteristica modular dos genes e proteinas, suas sequencias e propriedades armazenadas nos grandes bancos de dados constituem importante fonte de informacoes para projetos nas areas de Engenharia Genetica e Engenharia de Proteinas. O desenvolvimento de tecnicas mais rapidas, simples e confiaveis de sequenciamento de DNA determinou um grande aumento no numero de sequencias publicadas e armazenadas nestes bancos nos ultimos 20 anos. Softwares especificos permitem o acesso as sequencias seja atraves da determinacao de similaridades entre sequencias, seja a partir de palavras-chave do documentario que acompanha cada uma das sequencias publicadas. Bancos de dados podem ser acessados diretamente (on line) via centrais de coleta e distribuicao de dados, em estacoes de trabalhos individuais ou ainda, atraves de servidoras locais. A manipulacao dos dados dispoe de um grande numero de softwares voltados para a analise de sequencias. Tais programas permitem a edicao, alinhamento e traducao de sequencias, construcao de mapas de restricao, predicao de estruturas de RNAs e de conformacao estrutural de proteinas e a localizacao de regioes codificadoras, tRNAs e sinais regulatorios. A alta repetitividade de tarefas realizadas num laboratorio de Biologia Molecular, assim como a demanda pela reprodutibilidade dos experimentos, tem levado a automacao de processos laboratoriais. Desde a pipetagem de reagentes, passando pela realizacao dos experimentos (como e' o caso de colunas cromatograficas, geis de sequenciamento e aparelhos para amplificacao de acidos nucleicos), ate' a leitura e interpretacao dos resultados, podem hoje ser feitas por sistemas completamente automatizados. A velocidade exponencial na qual os bancos de dados tem crescido e a automacao das tarefas laboratoriais devera ser ainda incrementada com os grandes projetos internacionais visando o sequenciamento de genomas completos. Tal velocidade de crescimento constitui um grande desafio para a Ciencia da Computacao, a qual sera responsavel pelo fornecimento de ferramentas destinadas a obtencao e analise do incrivel numero de sequencias com certeza disponiveis nas proximas decadas. TRES METODOS PARA PREVISAO DE ESTRUTURA SECUNDARIA DE PROTEINAS, VERSOES PARA MICROS Panepucci, E.H. 1, Barbosa, J.A.R.G. 1, Ventura, M.M. 2 1 Instituto de Fisica e Quimica de Sao Carlos, USP, Sao Carlos, S.P.; 2 Depto. de Biologia Celular, Laboratorio de Biofisica, UnB, Brasilia. Ja faz algum tempo desde que Chou e Fasman publicaram seu metodo para previsao de estrutura secundaria de proteinas. Existem hoje em dia diversos metodos com esse proposito, podemos agrupa-los de acordo com a metodologia utilizada para previsao (redes neurais, teoria da informacao, aspectos estereoquimico, simples estatistica). A maioria desses metodos se utiliza de tabelas de valores para cada um dos 20 residuos de aminoacidos. Os algoritmos para obtencao da predicao a partir dessas tabelas estao publicados em artigos e sao transformados em programas, facilitando o seu uso. Apesar de existirem versoes desses programas para computadores de grande porte, os mesmos podem ser aplicados a microcomputadores com uma eficiencia muito boa. Nosso objetivo e fornecer, a pessoas que nao tenham acesso a computadores de grande porte, uma saida para obter informacoes estruturais com suas sequencias. Esse trabalho apresenta 3 programas de predicao em 2 versoes: TurboPascal e C, que podem ser aplicados a qualquer sequencia proteica. Os algoritmos utilizados foram extraidos de Holley e Karplus [1], McGregor, Flores e Sternberg [2] e Garneir, Osguthorpe e Robson [3]. Os dois primeiros metodos sao fruto da metodologia de redes neurais, enquanto que o ultimo e uma aplicacao da teoria da informacao. E um fato inquestionavel que a predicao de estruturas ainda tem um erro muito grande. Para minimizar o mesmo sao utilizados varios programas de predicao, sendo seus resultados compilados de maneira tal que regioes onde a maioria dos metodos preve uma determinada estrutura, esta e aceita. Hoje existem formas mais confiaveis de se prever estruturas, utilizando-se do fato das proteinas poderem ser agrupadas em familias, e que dentro dessas familias a estrutura e conservada, pode-se prever, atraves de alinhamentos, o folding de uma proteina. Em um projeto futuro, pretendemos fornecer um pequeno pacote com capacidade de satisfazer as pessoas que nao tenham acesso aos computadores de grande porte, afim de que elas possam trabalhar com suas sequencias. [1] Holley, L.H. and Karplus, M. Proc. Natl. Acad. Sci., 86:152-156, 1989. [2] McGregor, M.J., Flores, T.P. and Sternberg, M.J.E. Protein Engineering, 2(7):521-526, 1989. [3] Garneir, J., Osguthorpe, D.J. and Robson, B. J. Mol. Biol., 120:97-120, 1978. Agradecemos pelo apoio financeiro fornecido pelo CNPq. PREVISAO DE ESTRUTURA SECUNDARIA DE PROTEINAS USANDO MODELOS LOGISTICOS Munson, P.J.; di Francesco, V.; Porrelli, R.N. Laboratory of Structural Biology, Division of Computer Research and Technology, National Intitutes of Health, USA e Nucleo de Informatica Biomedica, UNICAMP Email: porrelli@ccsun.unicamp.br Utilizamos tecnicas estatisticas para tentar melhorar a capacidade de prever estrutura secundaria de proteinas baseada na sequencia de amino-acidos. Funcoes discriminantes logisticas foram estendidas para acomodar termos quadraticos e assim poder competir com algoritmos baseados em redes neurais artificiais e aprendizado de maquina. Nosso modelo limita o numero de parametros quadraticos explorando a natureza periodica das alfa- helices e placas pregueadas. Tambem utilizamos utilizamos tecnicas semi-parametricas para melhor ajustar o modelo aos dados. Com esta abordagem fomos capazes de elevar a acuracia do modelo GOR original, obtida com validacao cruzada, para 62.5% ( modelo otimizado de maximo-verossimilhanca penalizada). Quando selecionamos os pares de amino-acidos a serem considerados nos parametros quadraticos, a acuracia com validacao cruzada subiu para 65.9%. A selecao do melhor modelo foi baseada no calculo do numero efetivo de parametros de varios modelos diferentes. O resultado otimo correspondeu a um modelo com cerca de 800 parametros efetivos. Uma das vantagens da utilizacao de tecnicas estatisticas e a possibilidade de interpretacao dos parametros do modelo. Ainda que nao tenha sido incluida qualquer informacao sobre a natureza quimica dos diferentes amino-acidos, os valores obtidos para os parametros lineares refletem algumas propriedades conhecidas dos mesmos. Os valores dos parametros quadraticos, correspondentes a interacao entre pares de amino-acidos, mostram grande concordancia com potenciais de contato calculados por outros autores. SISTEMAS DE AUXILIO A SEQUENCIAMENTO DE DNA EM LARGA ESCALA Meidanis, J. Departamento de Ciencia da Computacao, Instituto de Matematica, Estatistica e Ciencia da Computacao, UNICAMP, Campinas, SP Email: meidanis@dcc.unicamp.br Com o advento de tecnicas laboratoriais rapidas para sequenciamento de DNA os cientistas ganharam acesso ao nivel mais elementar de informacao genetica, a saber, a sequencia de bases de uma molecula de DNA. A principio, apenas moleculas relativamente curtas puderam ser assim desvendadas, na faixa de ate 5000 bases. Hoje em dia projetos bem mais ambiciosos sao objeto de atencao, culminando com o famoso Projeto do Genoma Humano, cuja meta final e' obter as sequencias de todos os cromossomos do homem. Apesar de todos os avancos tecnologicos, uma limitacao ainda permanece: so e' possivel ler diretamente de um filme de autoradiografia sequencias de no maximo 300 a 500 bases. Para sequenciar moleculas maiores deve-se quebra-las em fragmentos, sequenciar os fragmentos e a seguir monta-los para obter a molecula original. Nesta montagem o uso de computadores e' indispensavel, devido ao grande volume de dados. Nesta palestra faremos uma revisao dos diversos metodos e programas que tem sido desenvolvidos para este fim, mostrando vantagens e desvantagens em relacao a varios aspectos. Descreveremos ainda um sistema novo que esta sendo desenvolvido no Departamento de Ciencia da Computacao da UNICAMP. Este sistema esta voltado especialmente para projetos de sequenciamento em larga escala (envolvendo milhares de fragmentos), que possuem toda uma gama de problemas e desafios proprios, nao encontrados em projetos menores. Bases de Dados e Telematica THE BRAZILIAN MOLECULAR BIOLOGY AND BIOTECHNOLOGY NETWORK (BMBBNet) Neshich, G. EMBRAPA, Brasilia, DF Email: bbrc@cenargen.embrapa.br BMBBnet is an initiative to develop the Brazilian infrastructure for academic and commercial information services in molecular biology and biotechnology. With the growing importance of biotechnology for agriculture and of genome projects for biotechnology and medicine, the long-range impact of a Bioinform- atics Resource in Brazil can be considerable, providing essential information services to the entire national research community in biotechnology in a very cost-effective way. The network consists of a national central node: Brazilian Bioinformatics Resource Center (BBRC) and already existing network (Internet) of the RNP. The latter functions as the backbone network connecting various state capitals. It is supported and maintained by the Genetic Resource and Biotechnology Center (CENARGEN) of the Brazilian Agriculture Research Corporation (EMBRAPA), an enterprise affiliated to the federal Ministry of Agriculture. The Network activities are: Data Distribution: In collaboration with the EMBL-Heidelberg the BBRC will receive the daily updates of the EMBL data bases. The BBRC should be therefore supplied with the most comprehensive collection of sequence data and it is furthermore licensed by the EMBL to distribute its data-bases to local state nodes within Brazil and also, to all interested Latin American countries. Similar mechanisms could be useful for distribution of other databases. A computational assistance to molecular biologists in Brazil will be also provided. Computer Conferencing System: The development of a bulletin-board and conferencing system, as well as a biotechnology discussion list (bbrc-l) on the network will provide the vehicle for information exchange between all network partners. To be effective, this will involve relevant research topics and will be easily accessible to laboratory scientists on the computers they commonly use for their work. Access to Remote Facilities: Systems for interactive access to remote facilities should be developed, for example: access to specialized hardware and software, database hosts, software collections or other resources. Training: Where necessary, training for variety of potential users should be arranged. Possible topics include the installation and support of particular software packages and technical networking issues. Full participation of the EMBL technical staff is guaranteed. All information on BMBBNet and the BBRC is available through the on-line information server gopher. Interested laboratories could contact the BBRC using the E-mail address, or write to: Dr. Goran Neshich, BMBBNet coordinator, EMBRAPA/CENARGEN, P.O.Box 02.372, 70879-970, Brasilia - DF, Brazil, phone: +55 61 272-3212, fax: +55 61 274-3212 ICGEBnet: AN INTERNATIONAL BIOLOGICAL COMPUTER RESOURCE Bevilacqua, V.; Pongor, S. ICGEB - International Centre For Genetic Engineering and Biotechnology, Area Science Park, 34012 Trieste, Italy Email: valeria@icgeb.trieste.it The International Centre for Genetic Engineering and Biotechnology (ICGEB) is an international organization presently operating as a special programme of the United Nations Industrial Development Organization (UNIDO). ICGEB's aim is to help its member countries (Afghanistan, Algeria, Argentina, Bhutan, Bolivia, Brazil, Bulgaria, Chile, China, Colombia, Congo, Costa Rica, Croatia, Cuba, Ecuador, Egypt, Greece, Hungary, India, Indonesia, Iran, Iraq, Italy, Kuwait, Mauritania, Mauritius, Mexico, Morocco, Nigeria, Pakistan, Panama, Peru, Poland, Russia, Senegal, Sri Lanka, Sudan, Syria, Thailand, Trindad and Tobago, Tunisia, Turkey, Venezuela, Viet Nam, Yugoslavia, Zaire) in molecular biology and biotechnology research. ICGEBnet is a biocomputing resource of ICGEB that currently provides login facilities for 550 users in Latin America, Central and Eastern Europe, Asia and Africa via X.25 and Internet connections. Biological sequence databases of genes and proteins play a fundamental role in molecular biology. Maintainance of such databases and the necessary softwares packages require a complex know-how and is best done via centralized computer resources such as the EMBnet Informatics Network of the European Molecular Biology Organization. In 1990 ICGEB started the ICGEB computer resource project, (ICGEBnet), in order to provide similar services for developing countries. The primary purpose of the ICGEBnet is to disseminate the best of currently available computational technology to the molecular biologists of the ICGEB research community. ICGEBnet provides on-line access to up-to-date databases, softwares for sequence analysis and communication tools to promote a rapid sharing of information among the ICGEB member countries scientists. Access to the ICGEBnet resource is available free of charge to all ICGEB member country scientists; however, preference is given to those scientists whose research is directly related to the research goals of ICGEB. The ICGEBnet can be accessed trough the Internet or via the X25 Public Data Network. Hardware comprises one SUN4 server/390 and one SPARC server10 with 8 Gbytes disk space, accessible through X.25 and Internet lines. Molecular modeling facility is provided by a Silicon Graphics IRIS Indigo XS24. Software components are: 1) Biological databases: EMBL, GenBank, TFD, HIV-NA, PIR, Swiss-Prot, SEQDB, PROSITE, SBASE, HIV-AA, LiMB, OMIM, Brookhaven PDB, Restriction Enzymes, Biocomputing Bibliography, PBASE. Sequence analysis software available are GCG Wisconsin Sequence Analysis package, Clustal V, Phylip, Plsearch, blast, Signal Scan and IRX. Gopher based information containing many databases, help for system facilities and links to other information servers world-wide. USENET news including bionet, embnet, news and gnu groups. Menu systems have been developed for ICGEBnet facilities, GCG programs, Phylip and Waissearch; a file manager for novice user on UNIX was also implemented in C using curses library. Automated database update protocols and the SBASE protein domain database were also developed in-house. The programs and databases developed in-house are available through anonymous ftp from (ftp.icgeb.trieste.it). The ICGEBnet resource became an EMBnet node in 1992 and now provides services that are beyond the European average, using relatively inexpensive hardware components. ICGEBnet is ready to help the member countries in establishing similar biocomputing resources. Pongor, S., Simon, G., Falaschi, A. (1992) The UNIDO computer resource for molecular biology. The Internet Society News, 2, 23-24 Pongor, S., Skerl, V., Cserzo, M. and Hatsagi, Z., Simon, G. and Bevilacqua, V. (1993): The SBASE domain library: A collection of annotated protein sequence segments. Protein Engineering, 6(4), 391-395 Simon, G. and Pongor, S. (1992): ICGEBnet: The UNIDO computer resource for molecular biology. Bioinformatics, 1, 12 BASES DE DADOS EM BIOLOGIA Canhos, V.P. Fundacao Andre' Tosello, Campinas, SP Email: vcanhos@bdt.ftpt.br Em funcao dos avancos em instrumentacao e informatica, os especialistas em biologia contam agora com inumeras ferramentas e metodos avancados para a sistematica, estudos fisiologicos e aplicacoes biotecnologicas. Um dos problemas fundamentais e' de como se manter atualizado com a oferta dinamica de novas tecnologias disponiveis para o estudo das relacoes entre organismos e a sua aplicacao no desenvolvimento de novas tecnologias em agricultura, industria, medicina e meio ambiente. O estabelecimento de bases de dados biologicos compreensiveis e abrangentes, assim como a disseminacao via redes eletronicas e cada vez mais importante para desenvolvimento de programas de ecologia, biodiversidade e desenvolvimento socio-economico sustentavel. Como resultado do investimento de paises industrializados na implantacao de infraestrutras de redes de transmissao eletronica de dados a altas velocidades, estamos vivendo uma verdadeira revolucao que esta levando a uma era de pesquisa cooperativa nunca vista. Estes desenvolvimentos podem ser medidos pela rapida evolucao da conectividade da rede Internet (no Brasil, a RNP - Rede Nacional de Pesquisa) que esta mudando a forma pela qual nos percebemos a interligacao de centros provedores de dados e usuarios. Muito desta evolucao esta ocorrendo em software que e de dominio publico, e e' acessivel a qualquer individuo que tenha uma conexao Internet. A democratizacao do acesso a Internet torna possivel o compartilhamento de informacoes sem a imposicao de estruturas rigidas. Bases de dados de dominio publico estao proliferando em todas as areas da biologia. Atraves da Internet podemos fazer buscas em varias centenas de bases de dados disponiveis em servidores distribuidos pelo mundo afora. De fato e possivel, em certo grau, qualquer usuario se tornar um provedor de dados. Como exemplo podemos citar as bases de dados de dominio publico do Genbank e EMBL. De forma coordenada e atraves de metodos constantemente aprimorados de acessos a bases de dados de biologia molecular, milhares de pesquisadores espalhados pelo mundo estao usando e contribuindo para compilacoes de dados sobre proteinas e DNA. Os desenvolvimentos em biologia molecular fornecem um bom modelo para o desenho e implementacao de outras bases de dados e redes tematicas. A consolidacao da Internet permite o fortalecimento de bases de dados de dominio publico, o que possibilita a maximizacao do uso das informacoes disponiveis, alem de promover a coordenacao de atividades de pesquisa e fomento. No Brasil, a Base de Dados Tropical (BDT) vem atuando desde 1985 na area de bancos de dados biologicos e comunicacao eletronica. Atraves de sua atuacao perseverante com recursos reduzidos, a BDT tem se mostrado capaz de incorporar os avancos significativos que vem ocorrendo no panorama internacional. Desde o inicio de suas atividades, utilizando-se do Servico Cirandao da EMBRATEL, ate' o momento atual, a BDT progrediu atraves da adocao de solucoes criativas e adequadas para resolver problemas de infraestrutura e recursos limitados. A BDT hoje, oferece cerca de 40 bancos de dados via linha X.25 e/ou Internet, mantem uma lista de discussao internacional (biodiv-l, Biodiversity Information Network List) e oferece ainda um Gopher server, com os bancos de dados nacionais (13), a lista de discussao, relacao de cursos, a publicacao eletronica da SBPC (SBPC Hoje) e a Publicacao Eletronica C&T Radiobras. Oferece tambem o Usenet News Groups relacionados com ciencias biologicas. BASE DE DADOS TROPICAL: DISSEMINACAO DE INFORMACOES PARA BIODIVERSIDADE E BIOTECNOLOGIA Souza, S.; Brefe, C.A.F.; Canhos, D.A.L.: Oliveira, P.: Canhos, V.P. Fundacao Andre' Tosello, Campinas, SP Email: vcanhos@bdt.ftpt.br A Base de Dados Tropical, BDT, e o centro de informacoes da Fundacao Tropical de Pesquisas e Tecnologia Andre' Tosello, uma entidade de direito privado, sem fins lucrativos, orgao de utilidade publica federal, estabelecida em marco de 1971. A BDT tem como meta a disseminacao de informacao eletronica, como ferramenta na organizacao da comunidade cientifica e tecnologica do pais. Atua especificamente na area de informacao biologica, de interesse industrial e ambiental, e pretende, atraves de sua atuacao, contribuir diretamente para a conservacao e utilizacao racional da biodiversidade do pais. Um pacote unico de bancos de dados especializados e distribuido atraves da BDT-Net, incluindo informacoes de interesse para microbiologia, biotecnologia, genetica e biodiversidade. Diferentes fontes de dados incluem informacoes sobre isolados microbianos caracterizados em colecoes de culturas do mundo inteiro, informacoes taxonomicas de bacterias e virus, hibridomas, linhagens celulares, sondas moleculares, e outros. Inclui tambem bancos de dados sobre pesquisadores atuantes nos diferentes campos da biodiversidade e biotecnologia. Todos os bancos de dados do MSDN (Microbial Strain Data Network) e do IRRO (Information Resource on Release of Organisms into the Environment) tambem estao disponiveis. Sao 38 bancos de dados nacionais e internacionais gerenciados pela BDT. Catalogos de Colecoes de Culturas: - Catalogo Nacional de Linhagens: Bacterias - Catalogo Nacional de Linhagens: Fungos - Catalogo Nacional de Linhagens: Algas - Catalogo Nacional de Linhagens: Protozoarios - Catalogo Nacional de Linhagens: Virus - Catalogo Nacional de Linhagens: Linhagens Celulares - ATCC Animal Viruses and Antisera Catalogue - ATCC Bacteria and Bacteriophages Catalogue - ATCC Filamentous Fungi and Yeasts Catalogue - ATCC Plant Viruses and Antisera Catalogue - ATCC Protozoa and Algae Catalogue - ATCC Clones, Vectors, Libraries, and Hosts Catalogue - ATCC Cell Lines Catalogue - DSM Deutsche Sammlung von Mikroorganismen und Zellkulturen - IMI Catalogue of Fungi - Peterhoff Genetic Collection of Saccharomyces Cerevisiae Yeasts - CCALA Catalogue of Algae and Cyanobacteria - CCF Catalogue of Filamentous Fungi - CCM Catalogue of Bacteria Quem e' Quem: - Quem e' Quem em Biodiversidade - Quem e' Quem em Botanica - Herbarios Brasileiros - Censo dos Zoologicos Brasileiros - Cadastro das Colecoes de Culturas Brasileira - MSDN Directory Nomenclatura e Informacoes Taxonomicas: - Nomenclatura Bacteriana - IJSB, Intern. J. Systematic Bacteriology - AVIS Animal Virus Information System Biotecnologia: - Agentes Antimicrobianos - BIA BioIndustry Association Databases - BEMET Biotechnology Courses Database - BKS Biotech Knowledge Sources Databases - BIOCAT Database on Insect Control by Release of Natural Enemies Meio Ambiente: - a lista de discussao BIODIV-L - Unido Code of Conduct for Environmental Release of GMOs - OECD BIOTRACK Database on Environmental Release of GMOs Estao tambem disponiveis aos usuarios da BDT-Net a revista eletronica SBPCHoje, da Sociedade Brasileira para o Progresso da Ciencia, alem de uma relacao de cursos de treinamento, simposios e congressos de interesse para Biotecnologia e/ou Biodiversidade. A BDT-Net faz parte da Internet, uma rede mundial de mais de 2 milhoes de computadores interconectados. Existe uma variedade incrivel de bases de dados de acesso publico e listas de discussao disponivel a qualquer usuario BDT interessado. Assim, todo usuario BDT tem a sua disposicao servicos de correio eletronico, buscas em bases de dados nacionais e internacionais, alem da possibilidade de participar em listas de discussao dos mais variados assuntos. A BDT nao visa lucros. Tem por objetivo estabelecer elos de comunicacao eletronica para promover um maior intercambio cientifico e tecnologico no pais e no exterior. Apenas para auxiliar na manutencao de suas atividades, e cobrada a seguinte taxa: Assinatura por um periodo de 6 (seis) meses: assinante individual: o equivalente a 220 UFIRs; assinante institucional: o equivalente a 2200 UFIRs (com direito de ate' 20 contas). Para maiores informacoes, envie uma mensagem para manager@bdt.ftpt.br; ou escreva para: Base de Dados Tropical, Fundacao Tropical de Pesquisas e Tecnologia Andre' Tosello, Rua Latino Coelho 1301, Parque Taquaral, 13.087-010 Campinas, Sao Paulo, Brasil, Telefone: (0192) 42-7022, Fax: (0192) 42-7827 BIN21 - THE BIODIVERSITY INFORMATION NETWORK Canhos, D.A.L.: Brefe, C.A.F.: Souza, S.: Oliveira. P. e Canhos, V.P. Fundacao Andre' Tosello, Campinas, SP Email: dora@bdt.ftpt.br Em julho de 1992, foi realizado na Base de Dados Tropical (BDT), em Campinas, Sao Paulo, Brasil um workshop para discutir o Estabelecimento de uma Rede de Informacoes sobre Biodiversidade patrocinado pela Uniao Internacional de Ciencias Biologicas (IUBS), pela Uniao Internacional das Sociedades de Microbiologia (IUMS) e pela Federacao Mundial de Colecoes de Culturas (WFCC), com o apoio do Governo Brasileiro (IBAMA, CNPq, Finep), da UNEP e do Conselho Britanico. O evento foi organizado pela BDT, e pelo Microbial Strain Data Network (MSDN). Como resultado do workshop foi estabelecida uma iniciativa internacional conhecida por BIN21 - Biodiversity Information Network/Agenda 21. O secretariado interino da BIN21, hoje esta localizado no Brasil, na propria BDT, que e tambem a mediadora da lista de discussao BIODIV-L (biodiv-l@bdt.ftpt.br), lancada em junho de 1992. A BDT foi convidada, pela WFCC (World Federation for Culture Collections), a organizar o evento (juntamente com o MSDN-Microbial Strain Data Network) por estar localizada no Brasil, pais rico em biodiversidade, e pelo seu trabalho na informatizacao de dados biologicos. Participaram do Workshop 18 representantes de universidades e instituicoes de pesquisa do Brasil (ALTERNEX/IBASE, BDT/FTPT, EMBRAPA, FAPESP, IBAMA, IBICT, IBGE, SMA/SP, TELEBRAS, UNICAMP), e 21 representantes de organizacoes internacionais (Mexico, Estados Unidos, Inglaterra, Suecia, Italia, Israel, Japao, Coreia, Russia, Australia). A participacao nao so da BDT, como tambem dos demais Brasileiros no workshop foi muito positiva. Fomos nomeados coordenadores de alguns grupos de trabalho e conseguimos fazer com que os interesses dos paises em desenvolvimento fossem preservados. A BDT hoje e a secretaria interina da BIN21. A configuracao pretendida da rede preve, nao somente a producao de diretorios de informacoes ja disponiveis em redes internacionais, mas a criacao e/ou fortalecimento de nos regionais, com o papel de organizar e difundir a informacao local, oferecer treinamento regional e auxiliar na busca de informacao internacional. O grupo de trabalho tecnico da BIN21 esta discutindo formas de organizar esta informacao em grupos tematicos, sendo que uma das ferramentas mais importantes atualmente disponiveis na Internet para a realizacao desta tarefa e o Gopher. Esta se discutindo tambem a criacao de interfaces para permitir o acesso dessa informacao atraves de correio eletronico. No Brasil, existem varias instituicoes gerando informacoes sobre biodiversidade e ha tambem uma comunidade de usuarios em grande expansao. Exemplos de instituicoes geradoras de informacoes sao: IBAMA, EMBRAPA, IBGE, FIOCRUZ, INPA, GOELDI, Universidades como a USP, UFRJ, UnB, UFMG, UFRS, UFPR, UFPE, UNICAMP, UNESP (existem mais de 100), Jardins Botanicos, como os do Rio de Janeiro e Sao Paulo (aproximadamente 15), Jardins Zoologicos, como os de Sao Paulo e Rio de Janeiro (aproximadamente 40), Museus, como o Museu Nacional do Rio de Janeiro, e o Museu de Zoologia de Sao Paulo, INPE, IBICT, BINAGRI, BIRENE, ONGs, como Funatura, Biodiversitas, SOS Mata Atlantica, SPVS, Alternex/Ibase, BDT, alem dos Departamentos Estaduais de Meio-Ambiente, entre outras. A grande maioria destas instituicoes nao possui um sistema de informacao de acesso publico. E fundamental que este quadro seja revertido o mais rapidamente possivel. A RNP em seu servidor Gopher lista 6 servidores Gopher no Brasil, sendo que somente a BDT e o BBRC (Brazilian Bioinformatics Resource Center) trabalham com informacao biologica. Com informacoes relevantes para o tema biodiversidade, existe tambem a AlterNex/Ibase (nao disponivel na rede gopher), responsavel pela disseminacao de informacao eletronica durante a ECO-92. Os anais do evento foram publicados pela UNEP (United Nations Environment Protection), e estao sendo distribuidos gratuitamente para instituicoes internacionais atuantes em biodiversidade. Para maiores informacoes favor contactar: Dora Ann Lange Canhos, Gerente de Projetos Base de Dados Tropical, Fundacao Tropical de Pesquisas e Tecnologia Andre' Tosello, Rua Latino Coelho, 1301 - Parque Taquaral, 13087-010 Campinas, SP, Brasil, Tel: +55 192 42-7022, Fax: +55 192 42-7827, E-Mail: dora@bdt.ftpt.br. ECOLOG: UM SISTEMA GERENCIADOR DE BANCOS DE DADOS PARA LEVANTAMENTOS ECOLOGICOS DE CAMPO Cavalcanti, M.J. Departamento de Biologia Geral, Centro de Ciencias Biologicas, Universidade Santa Ursula, Rio de Janeiro, RJ Email: maurobio@ibase.br A execucao de inventarios sobre a diversidade de especies da flora e da fauna de uma regiao constitui-se num pre-requisito indispensavel a conservacao e uso sustentavel dos recursos naturais por elas representados. Em particular nos paises tropicais, onde estes recursos vem sendo degradados rapidamente e em larga escala como consequencia de politicas ambientais inadequadas, os inventarios de biodiversidade tem adquirido uma importancia cada vez maior. Dada a velocidade com que os ambientes naturais nos tropicos estao sendo degradados ou inteiramente destruidos, e' urgente que o maior numero possivel de areas sejam inventariadas quanto as suas especies de animais e plantas, muitas das quais talvez venham a ser extintas antes mesmo que possam ser descritas e, sobretudo, que tenham seus usos potenciais analisados. Contudo, o volume de dados obtido por inventarios de biodiversidade frequentemente constitui-se em um grande problema, no que se refere ao armazenamento, atualizacao, recuperacao e analise. A dificuldade de acesso rapido as informacoes oriundas de tais inventarios tem sido, em parte, responsavel pela lentidao do processo de geracao de resultados uteis para apoiar os esforcos de conservacao e uso sustentavel dos recursos naturais. Neste contexto, um Sistema Gerenciador de Bancos de Dados (SGBD) apresenta-se como um eficiente meio de armazenamento e organizacao dos dados sobre diversidade de especies, reduzindo seu tempo de acesso e processamento e garantindo sua integridade e consistencia. Sistemas de bancos de dados vem sendo empregados no manejo de dados de inventarios de biodiversidade pelo menos desde a decada de 70. Nao obstante, ate' recentemente, poucos sistemas especificos estavam disponiveis, sendo todos invariavelmente desenvolvidos para computadores de grande porte ou minicomputadores; a proliferacao dos microcomputadores, a partir dos anos 80, levou ao desenvolvimento de varias novas aplicacoes, de baixo custo operacional e mais amplamente acessiveis. Neste trabalho, e' apresentada uma aplicacao de SGBD com capacidade relacional, especificamente projetada para o manejo de dados sobre locais, especies e individuos obtidos em levantamentos de campo e inventarios de biodiversidade. Este sistema foi desenvolvido para uso em equipamentos de baixo custo e facil acesso (microcomputadores da linha IBM-PC, sob o sistema operacional MS-DOS), apresentando como principais carateristicas: a facilidade de interacao com o usuario; a flexibilidade na recuperacao de registros para consulta e geracao de relatorios (a partir de qualquer campo ou combinacao de campos); a integracao com outros sistemas; e, sobretudo, a producao de analises quantitativas de dados ecologicos (indices de diversidade, curvas de rarefacao, etc.). Para o desenvolvimento do sistema, foi utilizado o compilador Clipper 5.01, fazendo-se amplo uso de tecnicas de Programacao Orientada para Objeto (POO). Algumas questoes relacionadas ao desenvolvimento de sistemas computacionais para a area biologica atraves da metodologia de POO sao tambem apresentadas e discutidas. Apoio MacArthur Foundation/Shell do Brasil/CNPq/Jardim Botanico do Rio de Janeiro-IBAMA. --------------------- Modelagem e Simulacao MODELAGEM MATEMATICA E SIMULACAO EM BIOLOGIA Meyer, J.F.C.A. Departamento de Matematica Aplicada, Instituto de Matematica, Estatistica e Ciencia da Computacao, UNICAMP, Campinas, SP Email: joni@ime.unicamp.br Neste trabalho e' apresentada uma descricao matematica do processo de dialise extracorporea. Para tanto e' usada a transformacao de uma Equacao a Derivadas Parciais de Difusao-Adveccao. E tambem proposto um metodo de aproximacao da solucao dessa EDP, com um esquema numerico para serem realizadas simulacoes computacionais. Este Metodo - Crank-Nicolson na variavel do tempo, e Elementos Finitos nas variaveis espaciais - e' modificado usando Petrov-Galerkin devido as carateristicas do problema e, com base nas simulacoes realizadas, uma modificacao possivel e' apresentada como sugestao para os aparelhos de hemodialise. A SIMPLE MODEL FOR MICELLIZATION: SIMULATION EXPERIMENT Bernardes, A.T.1; Bisch, P.M.2; Henriques, V.B.3 1 Universidade Federal de Ouro Preto, MG; 2 Centro Brasileiro de Pesquisas Fisicas e 3 Instituto de Quimica da Universidade de Sao Paulo Email: atbernar@brufmg.bitnet We have studied the characteristic properties of aggregation into micelles of amphipiles in water through Monte Carlo simulations of a very simple model system. Amphiphiles and water are modeled as trimers and monomers respectively, on a square lattice. The model micellization presents both characteristics of experimental micellization: monomer vs amphiphile concentration with a plateau (a cmc) and a distribution of micelle sizes (polidispersity). Analysis of the model behaviour shows that usual criteria for the definition of the cmc might be contraditory. A normal type distribution of micelle sizes is observed only in the plateau range of concentrations. Sample size and relaxation properties of the simulation have also been analysed. ENACT: AN ARTIFICIAL LIFE WORLD IN A FAMILY OF CELLULAR AUTOMATA Balbi de Oliveira, P.P. Instituto Nacional de Pesquisas Espaciais, Laboratorio Associado de Computacao e Matematica Aplicada, INPE-LAC - Caixa Postal 515 , 12201-970 - Sao Jose' dos Campos, SP. Email: pedrob@dpi.inpe.br Enact is a family of two-dimensional, non- deterministic cellular automata, whose temporal evolution on a periodic background can be described in terms of the metaphor of an artificial-life world where a population of worm-like organisms of arbitrary length undergo a evolutionary process. During their lifetime, the organisms roam around, sexually reproducing, interacting with the environment, and being subjected to a developmental process which includes ageing and death. An organism is formed by a sequence of contiguous cells, so that the cells at each end can be intuitively thought of as its head and tail, whereas the cells in between constitute its body. One single cell of the body is the organism's genotype; the others are phenotype- like cells, since they are subjected to change through environmental interaction. The gene separates the phenotype-like cells into two parts: a single cell between the head and the gene, which we consider the actual organism's phenotype, and the others along the body (towards the tail), which is supposed to be the organism's memetype. Such a distinction comes from the fact that the initial state (during the neonate development) of the phenotypic cell depends on the organism's gene, whereas the state of the memetype does not, being determined through direct parental inheritance. As a consequence, the evolutionary process supported in Enact is in general both genotypic and memetic. The former refers to the evolution of a coordinated movement of the population, while the latter allows to explore the effects of the genotypic evolution on the state of the organism's memetype. From a computational point of view, Enact can be regarded as a programmable, virtual, parallel machine defined by the artificial- life processes it supports, and relying upon six categories of states which represent environment, the organism's terminals, genotype, phenotype, memetype, and an additional category to allow the organisms to move. Its overall qualitative dynamics depends primarily on the ageing rate of the organisms, its tuning being very straightforward so as to prevent extinction of the organisms or deadlocks due to over-population, and guaranteeing the existence of very long transients. In this talk, I will skim over some aspects of Enact just enough to give a flavour about the computational and conceptual issues underlying its use and design. Time permitting, a video may be shown to illustrate it in action. Most of this research has been carried out at the University of Sussex, Brighton, England, thanks to a grant given by CNPq SIMULACAO DA DINAMICA DE POPULACOES DE PLANTAS Figueira, J.E.C.: Bede, L.C.: Araujo, A.M.; Carvalho, L.M. e Fernandes, G.W. Depto. Biologia Geral/ICB/Universidade Federal de Minas Gerais, Belo Horizonte, MG Email: tabarana@brufmg.bitnet Foi desenvolvido um programa para simular a dinamica de populacoes de plantas em linguagem BASIC, para micros da linha IBM-PC. O programa leva em consideracao a influencia do tamanho dos individuos na producao de sementes, nas distancias de dispersao, nas probabilidades de reproducao e sobrevivencia. A estrutura da populacao e sua taxa de crescimento sao mostradas a cada iteracao. Parametros populacionais como taxas de sobrevivencia e fecundidade podem ser facilmente alterados, sendo possivel tambem o uso de equacoes que expressam a variacao destes parametros em funcao da densidade e em resposta a compromissos internos (trade-offs). As curvas de dispersao de sementes e curvas de crescimento das plantas sao expressas por meio de equacoes. Como o algoritmo discrimina cada individuo separadamente, pode projetar graficamente sua posicao, crescimento, morte e reproducao a cada iteracao. Alem disso, diferentes taxas de sobrevivencia e crescimento de sementes e plantas podem ser obtidas em diferentes regioes da tela grafica, simulando micrositios diferenciados no solo. A grande flexibilidade e simplicidade deste programa permite a simulacao da dinamica de plantas com diferentes caracteristicas e historias de vida. Trabalho Financiado pela FAPEMIG, processo 1356/90. UM MODELO PARA O EFEITO DE ANTAGONISTAS DO ESTROGENO NA LIGACAO COOPERATIVA DO ESTRADIOL Porrelli, R.N.1; Munson, P.J.2; Rodbard, D. 1 Nucleo de Informatica Biomedica, UNICAMP e 2 Laboratory of Structural Biology, Division of Computer Research and Technology, National Intitutes of Health, USA Email: porrelli@ccsun.unicamp.br Agonistas parciais tais como estriol e estrona sao capazes de diminuir ou mesmo eliminar a curvatura do grafico Scatchard quando competindo com estradiol marcado na ligacao ao receptor de estrogeno. Alguns autores interpretam este achado como um interferencia dos agonistas no processo de dimerizacao do receptor. Para investigar como um segundo ligante frio poderia provocar tal efeito, criamos um modelo de acao de massas onde receptores univalentes, que se ligam a dois diferentes tipos de ligantes, podem formar dimeros. Focalizamos nossa atencao nas manifestacoes de cooperatividade (tais como curvatura do Scatchard) para determinar como elas poderiam ser modificadas pela competicao com um segundo ligante. Ao inves de discutirmos matematicamente as equacoes do modelo, criamos uma base de dados contendo solucoes do modelo para virtualmente todas as combinacoes dos parametros, de forma a conter os pontos criticos e intervalos de interesse. Tal abordagem computacional permitiu uma nova interpretacao dos achados experimentais, indicando que o efeito dos agonistas parciais na ligacao de estradiol marcado ao receptor nao se explica pela interferencia com a dimerizacao do receptor ou pela diminuicao da cooperatividade. Ela e aplicavel a outros modelos, constituindo-se em alternativa a discussao das equacoes, desde que o numero de parametros, pontos criticos e intervalos de interesse nao exceda a capacidade de armazenagem do computador. --------------------------------------------------- Inteligencia Artificial e Reconhecimento de Padroes REDES NEURAIS E ALGORITMOS GENETICOS EM BIOLOGIA Blinder, P.B. Departamento de Matematica Aplicada, Instituto de Matematica, Estatistica e Ciencia da Computacao (IMECC), e Centro de Logica e Epistemologia (CLE) da Universidade Estadual de Campinas. Email: blinder@ime.unicamp.br As Redes Neurais Artificiais e os Algoritmos Geneticos tem sido utilizados numa infinidade de aplicacoes praticas, desde analise de credito financeiro ate' o controle de fabricas. Este e' um enfoque da metodologia (o pratico). No entanto, pretendemos observar suas aplicacoes cientificas, tais como classificacao atraves de redes neurais e estudo de sistemas evolutivos por meio de AG. Apos abordar os mecanismos basicos de como funcionam tais metodos, e exibir algumas aplicacoes recentes em Biologia (e se possivel em Computacao) pretendemos observar se e' possivel utiliza-los como fator de sintese em Ciencia, e nao apenas de modo analitico, uma vez que tais tecnicas se baseiam em principios realmente basicos das Ciencias Biologicas, como o da Evolucao. Pretende-se tambem realizar uma extensao dos conceitos, atraves de Logica Nebulosa, de como podemos representar a vagueza e o conhecimento incompleto da realidade na modelagem de sistemas (eventualmente biologicos). Feito isto, teremos entao uma visao global de como podemos modelar sistemas complexos com conhecimento parcial da realidade, que e' onde residem os "problemas do mundo real", como e' o caso em Biologia. BEHAVIOR-BASED ACTIVE VISION Pinhanez, C.S. University of Sao Paulo, Institute of Mathematics and Statistics, Dept. of Computer Science, Cx. Postal 20570, Sao Paulo, SP, CEP: 01498-970 E-mail: pinhanez@ime.usp.br A vision system was built using a behavior-based model, the subsumption architecture. This is a new artificial intelligence paradigm especially useful for designing artificial agents (normally robots) able to autonomously exist in the real world, dealing with noise, real-timeness and unpredictable environments. The so called active eye moves the camera's axis through the environment, detecting areas with high concentration of edges, with the help of a kind of saccadic movement. Particular attention is given to the fovea-like sensor structure which enables the active eye to efficiently use local information to control its movements, including an implementation of a kind of saccadic movement. A measure for the eye's behavior is developed, and employed to evaluate the incremental building process and the effects of the saccadic movements on the whole system. A higher level behavior was also implemented, with the purpose of detecting long straight edges in the image, producing pictures similar to humans' hand-drawings. Robustness and efficiency problems are also addressed. CLASSIFICACAO TAXONOMICA DE BACTERIAS ATRAVES DE REDES NEURAIS Oliveira, Y.G.; Senna, A.L.; Meira Junior, W.; Bunte de Carvalho, M.L. Departamento de Ciencias da Computacao da Universidade Federal de Minas Gerais, Belo Horizonte, MG Email: yuri@dcc.ufmg.br, senna@dcc.ufmg.br, meira@dcc.ufmg.br, mlbc@dcc.ufmg.br A identificacao taxonomica de organismos isolados e' feita, em muitos casos, por analises visuais e posterior utilizacao de chaves de classificacao obtidas a partir de testes bioquimicos, entre outros estudos, de exemplares conhecidos. Tais testes podem ser divididos em dois grupos: 1) quanto ao tipo de reacao indicada, que pode ser negativa ou positiva; 2) quanto a natureza dos possiveis valores de resposta, podendo estar contidos em faixas de valores continuos ou discretos. A classificacao abordada neste trabalho se baseia em percentuais de reacoes positivas a um conjunto de testes previamente realizados. A primeira dificuldade para realizar essa classificacao advem do fato de que varios organismos apresentam resultados bastante semelhantes no espectro do conjunto de testes. Outro fato importante e' que nem sempre um determinado organismo responde positivamente a um certo teste. Assim, a classificacao e' feita com base nas probabilidades de resposta positiva de determinada especie de organismo aos diversos testes. Uma implementacao computacional eficiente para a solucao deste problema e' a utilizacao de Redes Neurais Artificiais, visto que elas sao dotadas de uma grande flexibilidade e tolerancia a presenca de ruidos nos dados de caracterizacao, ou mesmo a ausencia de parte destes. Utilizou-se uma rede neural artificial treinada com o algoritmo de aprendizado conhecido por Back Propagation, para identificar um conjunto de vinte e tres especies encontradas mais frequentemente em ambientes clinicos da familia Enterobacteriaceae. Para isso, foram fornecidos como entrada para a rede os percentuais de um conjunto dos vinte e seis testes, considerados os mais uteis na classificacao taxonomica desses exemplares em especifico. Alem disso, foram desenvolvidas algumas ferramentas de tratamento estatistico para analise dos dados antes destes serem fornecidos a rede, objetivando organizar as especies de modo a facilitar seu aprendizado. A rede implementada consegue uma precisao aproximada de 90% no reconhecimento das bacterias. Foram feitos testes preliminares com entradas incompletas e contendo ruidos, que tem apresentado bons resultados, confirmando as expectativas. Como perspectivas futuras pode-se considerar a construcao de arvores taxonomicas e a identificacao dos testes de maior significancia. USO DE REDES NEURAIS EM TAXONOMIA NUMERICA BASEADA EM DADOS HETEROGENEOS Senna, A.L.; Oliveira, Y.G.; Meira Junior, W.; Bunte de Carvalho, M.L. Departamento de Ciencias da Computacao da Universidade Federal de Minas Gerais, Belo Horizonte, MG Email: senna@dcc.ufmg.br, yuri@dcc.ufmg.br, meira@dcc.ufmg.br A diversidade de organismos vivos em nosso planeta torna indispensavel o desenvolvimento de ferramentas matematicas e computacionais capazes de auxiliar o trabalho de biologos e outros especialistas que se dedicam a ardua tarefa de classifica-los. Uma boa ferramenta deve ser capaz nao so de identificar a que grupo pertence um organismo, quando este lhe e' apresentado, mas tambem de dar uma nocao da similaridade de tal organismo com os representantes dos demais grupos. Um dos maiores problemas enfrentados durante a abordagem computacional desse problema e' a forma como os dados - informacoes relativas as diversas especies, obtidas por especialistas, que formarao o conjunto de conhecimento da rede - sao apresentados ao sistema. Foram tratados, neste trabalho, dados cujo formato varia da seguinte forma: 1) faixa continua: entradas tipicamente obtidas pela realizacao de testes onde organismos conhecidos responderam com variados valores dentro da faixa; 2) dados discretos: entradas cujo valor pode variar dentro de um conjunto finito de valores; normalmente sao respostas a analises visuais onde o organismo apresenta uma dentre varias estruturas possiveis; 3) dados binarios: entradas do tipo verdadeiro ou falso; tal tipo de dado e um caso particular do acima citado, seu destaque se deve a simplicidade de sua representacao. As redes neurais artificiais se mostraram uma boa ferramenta na taxonomia alfa - classificacao individual de organismos - devido a sua inerente capacidade de tratar com ruidos nos dados de entrada; uma rede neural artificial do tipo 'backpropagation' foi utilizada para tratar do problema de classificacao de micro-organismos com resultados encorajadores: o metodo se mostrou eficiente e extremamente robusto. Para validar o sistema de classificacao desenvolvido no Departamento de Ciencia da Computacao da UFMG - Neuraltaxon - foram utilizadas duas bases de dados taxonomicas distintas: a primeira contendo caracteristicas de 26 especies de pulgas; a segunda com dados de 20 protozoarios da familia Trypanosomatidae. Foi dimensionada e treinada uma rede neural para cada base. Verificou-se que ambas conseguem classificar representantes com precisao de aproximadamente 95% e sao resistentes a possiveis deficiencias na entrada de dados: se o usuario deseja identificar um organismo mas dispoe de apenas 30% das informacoes padrao sobre o grupo, ainda assim o sistema emite uma resposta com nivel de precisao em torno de 80%. Alem disso, erros experimentais distorcendo 70% das entradas, por exemplo, ainda permitem uma taxa de acerto de aproximadamente 60% . RECONHECIMENTO DE SEQUENCIAS COMPORTAMENTAIS UTILIZANDO REDES NEURAIS ARTIFICIAIS Sabbatini, R.M.E. Nucleo de Informatica Biomedica da Universidade Estadual de Campinas Email: sabbatini@ccvax.unicamp.br A identificacao, isolamento e quantificacao dos padroes e sequencias presentes no comportamento de um animal, sao pontos centrais da metodologia etologica. Diversas tecnicas estatisticas foram desenvolvidas com essa finalidade, tendo como base modelos de Markov, gramaticais, e outros; todos eles bastante trabalhosos quanto a programacao, e de resultados duvidosos quando o fluxo do comportamento tem probabilidades de transicao instaveis. A abordagem apresentada neste trabalho parte de um pressuposto inteiramente diferente. Como o nosso sistema nervoso (e o dos animais que tem que reconhecer padroes comportamentais comunicativos complexos em seus conspecificos) funciona tao bem nessa tarefa ? A resposta esta na emulacao das redes neurais que sao capazes de efetuar os procedimentos fundamentais de reconhecimento e segmentacao de padroes a partir do fluxo continuo do comportamento. Desenvolvemos um simulador de redes neurais artificiais de tipo perceptron, com 3 camadas, capazes de aprender tarefas de reconhecimento de padroes atraves do algoritmo da retropropagacao de erros. Este programa (NEURONET, para microcomputadores de 16 bits), foi treinado a reconhecer padroes (perfis nao sequenciais) e sequencias comportamentais de exemplo, classificadas previamente por um observador humano; ate' atingir o criterio de 98.7 % de acertos. Utilizando perfis e sequencias de teste, a rede neural foi capaz de identificar o padrao correto em cerca de 90 % das mesmas. Outras possibilidades abertas com o uso de redes neurais sao: a) a obtencao de um grafico temporal mostrando as probabilidades de ocorrencia das classes de comportamento ao longo do tempo. Estas curvas podem ser segmentadas (deteccao de gradientes) atraves de uma segunda rede neural, que simula a organizacao da inibicao lateral na retina. b) a quantificacao do grau de estereotipia dos padroes e sequencias comportamentais; c) a deteccao e interpretacao automatica de vocalizacoes e outros sinais continuos emitidos por um animal; d) a implementacao de sistemas de observacao e categorizacao do comportamento totalmente automaticos (sem necessidade de observador humano) atraves da analise de imagens gravadas em filme e video, por redes neurais artificiais. O presente trabalho pode demonstrar de forma definitiva a viabilidade e grande utilidade dos sistemas computacionais neuromorficos em etologia, utilidade esta que devera aumentar com o aparecimento de neurocomputadores hiperparalelos verdadeiros. Aplicacoes Educacionais USO DE PROGRAMAS PARA ENSINO DE GENETICA Matioli, S.R. Depto. de Biologia, Instituto de Biociencias, Universidade de Sao Paulo, Sao Paulo, SP. Email: srmatiol@fox.cce.usp.br O uso de computadores para simulacao de fenomenos geneticos remonta praticamente ao inicio do emprego de computadores digitais em pesquisa cientifica, havendo registros deste emprego desde 1957. A Genetica, embora seja uma area eminentemente biologica, compartilha muitas caracteristica das Ciencias exatas, uma vez que, desde os trabalhos de Mendel, os fenomenos de transmissao hereditaria podem ser, na maioria dos casos, tratados de forma quantitativa. Em 1983, comecamos a utilizar computadores para ensino de Genetica de Populacoes em cursos de graduacao para Ciencias Biologicas, na epoca atraves do emprego de terminal de computador de grande porte. Os programas foram escritos em FORTRAN e simulavam os processos de selecao natural e de deriva genetica. As versoes seguintes foram escritas em linguagem BASIC para microcomputadores da linha Sinclair, Apple e IBM-PC. A ultima versao incorpora alem das simulacoes de deriva genetica, equilibrio para genes ligados ao sexo e migracao entre populacoes. Este programa (GENPOP2) tem sido distribuido para varias Universidades do pais e tem sido utilizado em cursos de graduacao. A partir de 1990, atraves de colaboracao com Dr. Paulo A. Otto, foi desenvolvido o programa POPGEN1, que, atraves de um sistema de coordenadas triangulares homogeneas, permite que as frequencias genicas sejam visualizadas simultaneamente com as frequencias genotipicas, possibilitando que diferentes sistemas de cruzamentos possam ser estudados atraves de interpretacao grafica. Alim do desenvolvimento de programas para o ensino de Genetica de populacoes, tambem foi iniciado o desenvolvimento de programas para o ensino de Genetica basica, por enquanto restrito ao programa HEREDO, que simula quatro tipos de heranca em tres geracoes representadas por heredogramas. O programa HEREDO tem sido utilizado em cursos de graduacao em carater experimental. SIMULACAO DA DERIVA GENETICA EM POPULACOES SUBMETIDAS OU NAO A PROCESSOS DE SELECAO: UM PROGRAMA DE APOIO AO ENSINO DE GENETICA DE POPULACOES Jacchier, S.; Silveira, C.H.; Abrantes, E.F. Laboratorio de Biologia Computacional, Departamento de Bioquimica- Imunologia, ICB/UFMG Email: silveira@dcc.ufmg.br O fenomeno da deriva genetica apresenta um carater probabilistico cujo efeito torna-se mais evidente somente apos a realizacao de um grande numero de simulacoes envolvendo sucessivas geracoes. Em populacoes naturais expostas a processos seletivos, a deriva genetica pode determinar a fixacao de genes com baixo valor adaptativo. O numero de geracoes necessarias para que esta fixacao ocorra depende do tamanho da populacao inicial e de sua dinamica de crescimento. Este programa foi desenvolvido com o objetivo de oferecer uma ferramenta didatica para o estudo dos efeitos da deriva genetica sobre populacoes submetidas ou nao a pressoes seletivas com padroes de crescimento variados. Atraves de uma interface interativa, o aluno tera condicoes de planejar e realizar experimentos, criando suas proprias estruturas populacionais. A apresentacao grafica dos resultados obtidos a partir destes experimentos permitira uma melhor visualizacao das caracteristica do processo de deriva em diferentes populacoes. A estrategia didatica adotada baseia-se no principio de que o aluno devera ser capaz de propor hipoteses, elaborar simulacoes e analisar seus resultados. Este programa pretende ser parte de um futuro projeto a ser implantado no ICB/UFMG destinado ao desenvolvimento de softwares aplicativos orientados para o auxilio do ensino de Biologia em suas mais diversas areas. APOIO: CNPq, FAPEMIG. CASOS CLINICOS SIMULADOS PARA COMPLEMENTACAO DO ESTUDO DAS ABERRACOES CROMOSSOMICAS Masuko, F.K.M.; Hackel, C.; Norato, D.Y.J e Sabbatini, R.M.E. Departamento de Genetica Medica, Faculdade de Ciencias Medicas e Nucleo de Informatica Biomedica da UNICAMP, Campinas. Email: sabbatini@ccvax.unicamp.br Os autores apresentam uma colecao de casos clinicos simulados desenvolvidos com o auxilio do sistema de autoria MEDTEST, para microcomputadores da linha IBM-PC. O conjunto de casos inclui pacientes com as aberracoes cromossomicas mais frequentes na pratica medica, com o objetivo de serem utilizados em exercicios para fixacao da aprendizagem por alunos de graduacao na area de saude. Deste modo, procurou-se elaborar casos tipicos, evitando-se as excecoes, com enfase no quadro clinico, diagnostico diferencial, solicitacao de exames complementares, coleta e interpretacao dos resultados. Tambem constam dos casos as decisoes quanto a conduta em relacao a crianca, a orientacao familiar e o aconselhamento genetico.Foram elaborados seis casos, compreendendo as sindromes de Down, Edwards, Patau, Turner, Klinefelter e do sitio fragil do cromossomo X. Os casos serao testados por alunos de graduacao do curso medico, tendo sido avaliados por 2 residentes em genetica clinica e considerados de facil entendimento. Apoio do Fundo de Apoio ao Ensino e Pesquisa da UNICAMP (FAEP). ----------------- Outras Aplicacoes COMPARACAO DE METODOS DE INFERENCIA FILOGENETICA Meyer, D. Departamento de Biologia, Universidade de Sao Paulo. Email: diogo@volterra.Stanford.EDU Metodos de inferencia filogenetica sao ferramentas construidas para gerar filogenias hipoteticas (arvores). Estas ferramentas sao receitas numericas, que encontram a arvore otima (aquela que minimiza ou maximiza um ou mais parametros). Este parametro varia conforme o metodo usado: numero de mudancas de carater na arvore (minimizado por metodos de parcimonia), variancia residual (minimizada por metodos de least squares), semelhanca global (maximizada por metodos geneticos como UPGMA). Diferentes propriedades de metodos de inferir filogenias podem ser comparadas (Penny et al, 1992. TREE 7:73). 1. Eficiencia. Escolhido o parametro que desejamos maximizar ou minimizar, o desenvolvimento de um algoritmo que o realize em um tempo computacional razoavel e um desafio. Metodos de distancia sao eficientes - o sucesso de encontrar a melhor arvore e virtualmente garantido. Metodos de maxima verosimilhanca encontram arvores otima para poucos taxons, mas se tornam inviaveis para conjuntos maiores. Analises de parcimonia se tornaram mais eficientes com novos algoritmos (por exemplo, metodos de branch-and bound) mas para analises de numeros maiores de taxons sao ineficientes (nao ha garantia de encontrar a melhor arvore). Melhorias na eficiencia de metodos dependem em grande parte da contribuicao de cientistas de computacao. 2. Potencia. A medida que mais dados sao utilizados para realizar uma inferencia, o metodo tende a convergir para uma unica arvore (otima para o algoritmo) e a adicao de mais informacao nao o afasta desta topologia. Detectar a taxa sobre as quais metodos convergem para uma arvore otima a medida que mais dados sao incorporados serve como uma orientacao para decidir que quantidade de informacao deve ser usada para encontrar a arvore otima associada a determinado metodo. Nossos experimentos comparam UPGMA, Neighbour-Joining e maxima verosimilhanca quanto a suas taxas de convergencia. Os resultados indicam que (a) UPGMA converge mais lentamente para uma arvore otima e (b) aumento do numero de taxa leva a taxas de convergencia mais lentas. 3.Consistencia. A melhor arvore encontrada por determinado metodo nao e necessariamente a arvore correta. Para que a filogenia inferida difira da real basta que o criterio utilizado para encontrar a melhor arvore assuma pressupostos do processo evolutivo que sejam violados na natureza. Detectar pressupostos associados a metodos de inferencia filogenetica constitui uma tarefa dificil. A utilizacao de metodos de simulacao por computadores fornece contribuicoes para a deteccao dos pressupostos necessarios para que um metodo seja consistente (encontre a arvore real). Todos os itens acima podem ser explorados de maneira criativa por evolucionistas e cientistas de computacao, com equipamentos acessiveis a Universidades Brasileiras. CONJUNTO DE ROTINAS PARA AVALIACAO DA CAPACIDADE SECRETORA E SENSIBILIDADE PERIFERICA A INSULINA Porrelli, R.N.; Sabbatini, R.M.E.; Wajchenberg, B.L. Nucleo de Informatica Biomedica, UNICAMP e Unidade de Diabetes e Adrenal, Disciplina de Endocrinologia, HCFMUSP Email: porrelli@ccsun.unicamp.br Estudos de metabolismo de glicose e sensibilidade a insulina geralmente envolvem tecnicas tais como uso de radioisotopos, peptideo C recombinante e realizacao de clamp euglicemico hiperinsulinemico. As dificuldades tecnicas, associadas ao alto custo restringem seu uso. Foram criados varios testes alternativos, geralmente envolvendo infusao de hormonios ou drogas (glicose, insulina, glucagon, tolbutamida, arginina) e medidas seriadas de insulina, glicose, e peptideo C. De execucao mais simples, estes metodos permitem a estimativa da sensibilidade a insulina quando nao se dispoe das tecnicas citadas. Criamos uma serie de rotinas, escritas em BASIC, para a interpretacao dos resultados destes testes. Entre eles podemos citar o modelo minimo de Bergman (avaliacao de sensibilidade a insulina), a desconvolucao do peptideo C (taxa de secrecao pre-hepatica de insulina), a desconvolucao de insulina (calculo da oferta periferica), extracao hepatica de insulina e estimativa da massa de receptores perifericos. As rotinas foram utilizadas para avaliacao da eficacia do tratamento com hipoglicemiantes orais em Diabetes tipo II, bem como da sensibilidade a insulina e capacidade secretora em molestia que cursam com disturbios do metabolismo da glicose e/ou acao da insulina. ----////------