Nome do Projeto
Curso: Python para Bioinformática
Ênfase
Ensino
Data inicial - Data final
09/11/2020 - 15/01/2021
Unidade de Origem
Coordenador Atual
Área CNPq
Ciências Biológicas
Resumo
A bioinformática é uma área interdisciplinar que consiste na aplicação de métodos computacionais para o processamento, armazenamento e análise de dados dados biológicos. O presente curso visa fornecer uma introdução ao uso da linguagem Python no contexto da bioinformática, contemplando a apresentação dos principais conceitos da linguagem, como estruturas lógicas, programação orientada a objetos, biblioteca básica e boas práticas de código na linguagem, bem como as principais bibliotecas e frameworks para o desenvolvimento de soluções de bioinformática com a linguagem.

Objetivo Geral

Capacitar estudantes, pesquisadores e professores quem atuam em áreas afins à biotecnologia e biologia molecular na utilização da linguagem de programação Python no contexto da bioinformática.

Justificativa

A bioinformática é uma área interdisciplinar que consiste na aplicação de métodos computacionais para o processamento, armazenamento e análise de dados dados biológicos, sobretudo aqueles derivados de técnicas modernas de bioquímica e biologia molecular, como o sequenciamento de DNA de nova geração (NGS). Neste contexto, diferentes linguagens de programação, como Python, R e Perl vem sendo empregadas para auxiliar no processamento destes dados, muitas vezes acompanhadas de bibliotecas e frameworks específicos para este tipo de aplicação (ex: biopython, bioconductor e bioperl), além de permitirem portabilidade entre diferentes plataformas. Dentre estas linguagem, o Python vem recebendo destaque por conta da sua adoção também nas áreas de aprendizagem de máquina, desenvolvimento web e administração de sistemas / devops, sendo apontada através de diferentes indicadores (ex: TIOBE, Stackoverflow Survey) como uma das 3 linguagens de programação mais populares atualmente. Deste modo, o presente curso visa fornecer uma introdução ao uso da linguagem Python no contexto da bioinformática, contemplando a apresentação dos principais conceitos da linguagem, como estruturas lógicas, programação orientada a objetos, biblioteca básica e boas práticas de código na linguagem, bem como as principais bibliotecas e frameworks para o desenvolvimento de soluções de bioinformática com a linguagem.

Metodologia

O curso ministrado através da plataforma WebConf da Universidade Federal de Pelotas através de encontros assíncronos. Além de aulas expositivas os inscritos deverão também realizar exercícios com uso da plataforma Google Colab, que servirão para consolidar os conhecimentos passados e também complementar o controle de frequência / rendimento durante o curso. Os códigos apresentados durante as aulas serão posteriormente disponibilizados através da plataforma GitHub. Serão abordados os seguintes tópicos:

1.1 - uso da plataforma Google Colab;
1.2. - anotações Markdown;
1.3 - tipos de variáveis (int, float, string, boolean);
1.4 - estruturas de dados (listas, dicionários, sets, tuplas);
1.5 - comentários;
1.6 - operações entre variáveis;

2.1 - desvio condicional (if, else, elif);
2.2 - estruturas de repetição (for, while);

3.1 - escrita e leitura de arquivos;

4.1 - biblioteca padrão;
4.2 - executando chamadas de sistema;

5.1 - programação orientada a objetivos;

6.1 - programação funcional;

7.1 - instalação de pacotes com o PIP;
7.2 - biopython: leitura de arquivos de sequências biológicas;
7.3 - biopython: processamento de sequências;
7.4 - biopython: análise de anotações presentes em records de sequências;

8.1 - biopython: uso da ferramenta BLAST através do Python;
8.2 - biopython: anotando um genoma microbiano usando Python;
8.3 - biopython: alinhamentos múltiplos de construção de árvores filogenéticas;
8.4 - biopython: baixando dados do NCBI;
8.5 - bioservices: acessando bancos de dados biológicos com o bioservices;

9.1 - bioservices: realizando anotação funcional de genes;

10.1 - pandas, sklearn e xgboost: criando um preditor de proteínas de membrana;

Indicadores, Metas e Resultados

A entrega de exercícios será considerada para fins de controle de frequência / rendimento. As notas obtidas durante os exercícios não serão critério para a obtenção do certificado, mas em caso de respostas total ou parcialmente incorretas serão repassadas correções e comentários através das funcionalidades do Google Colab. É esperado que haja frequência de 70% considerando da entrega dos exercícios.

Equipe do Projeto

NomeCH SemanalData inicialData final
AIRTON SINOTT CARVALHO
ALAN SOUZA DOS SANTOS
ALESSANDRA NEIS
AMANDA MUNARI GUIMARÃES
ANDREI BORGES LA ROSA
ANDREI LUCAS PADILHA PEREIRA
ARIANE NORONHA DE MELO
AUGUSTO GARCIA SCHMIDT
BRUNO CASCAES ALVES
CAMILA RIOS PIECHA
CLÁUDIA DE JESUS AZAMBUJA
Davi Barwaldt Dutra
ERICMAR AVILA DOS SANTOS
FELIX LEONEL VASCONCELOS DA SILVA
FERNANDO RIBEIRO OLLE
FREDERICO SCHMITT KREMER2
GEOVANA SILVA DA SILVEIRA
GIANLUCCA DE MENDONCA BUZO
GIULI ARGOU MARQUES
GUILHERME FEIJÓ DE SOUSA
HADASSA GABRIELA ORTIZ
HEITOR FELIPE MATOZO DOS SANTOS
ISABELA FERNANDES GOMES DIAS
ISADORA LEITZKE GUIDOTTI
JOÃO CARLOS RODRIGUES JUNIOR
KAUÊ RODRIGUEZ MARTINS
KETHLIN DE QUADROS FERREIRA
LUCAS SEIDY RIBEIRO DOS SANTOS IKENOUE
LUCIANO DA SILVA PINTO1
MATHAUS CAMELATTO KRÜGER
MAURÍCIO DORNELES CALDEIRA BALBONI
NATALI LIMA DIAS
PABLO DA ROSA BATISTA
PEDRO LOPES REISSER
RAFAEL DOS SANTOS WOLOSKI
RENATA NOBRE DA FONSECA
RONALDO PEREIRA DE OLIVEIRA JUNIOR

Página gerada em 07/08/2022 22:10:12 (consulta levou 0.154824s)