Nome do Projeto
Curso: Python para Bioinformática
Ênfase
Ensino
Data inicial - Data final
09/11/2020 - 15/01/2021
Unidade de Origem
Coordenador Atual
Área CNPq
Ciências Biológicas
Resumo
A bioinformática é uma área interdisciplinar que consiste na aplicação de métodos computacionais para o processamento, armazenamento e análise de dados dados biológicos. O presente curso visa fornecer uma introdução ao uso da linguagem Python no contexto da bioinformática, contemplando a apresentação dos principais conceitos da linguagem, como estruturas lógicas, programação orientada a objetos, biblioteca básica e boas práticas de código na linguagem, bem como as principais bibliotecas e frameworks para o desenvolvimento de soluções de bioinformática com a linguagem.
Objetivo Geral
Capacitar estudantes, pesquisadores e professores quem atuam em áreas afins à biotecnologia e biologia molecular na utilização da linguagem de programação Python no contexto da bioinformática.
Justificativa
A bioinformática é uma área interdisciplinar que consiste na aplicação de métodos computacionais para o processamento, armazenamento e análise de dados dados biológicos, sobretudo aqueles derivados de técnicas modernas de bioquímica e biologia molecular, como o sequenciamento de DNA de nova geração (NGS). Neste contexto, diferentes linguagens de programação, como Python, R e Perl vem sendo empregadas para auxiliar no processamento destes dados, muitas vezes acompanhadas de bibliotecas e frameworks específicos para este tipo de aplicação (ex: biopython, bioconductor e bioperl), além de permitirem portabilidade entre diferentes plataformas. Dentre estas linguagem, o Python vem recebendo destaque por conta da sua adoção também nas áreas de aprendizagem de máquina, desenvolvimento web e administração de sistemas / devops, sendo apontada através de diferentes indicadores (ex: TIOBE, Stackoverflow Survey) como uma das 3 linguagens de programação mais populares atualmente. Deste modo, o presente curso visa fornecer uma introdução ao uso da linguagem Python no contexto da bioinformática, contemplando a apresentação dos principais conceitos da linguagem, como estruturas lógicas, programação orientada a objetos, biblioteca básica e boas práticas de código na linguagem, bem como as principais bibliotecas e frameworks para o desenvolvimento de soluções de bioinformática com a linguagem.
Metodologia
O curso ministrado através da plataforma WebConf da Universidade Federal de Pelotas através de encontros assíncronos. Além de aulas expositivas os inscritos deverão também realizar exercícios com uso da plataforma Google Colab, que servirão para consolidar os conhecimentos passados e também complementar o controle de frequência / rendimento durante o curso. Os códigos apresentados durante as aulas serão posteriormente disponibilizados através da plataforma GitHub. Serão abordados os seguintes tópicos:
1.1 - uso da plataforma Google Colab;
1.2. - anotações Markdown;
1.3 - tipos de variáveis (int, float, string, boolean);
1.4 - estruturas de dados (listas, dicionários, sets, tuplas);
1.5 - comentários;
1.6 - operações entre variáveis;
2.1 - desvio condicional (if, else, elif);
2.2 - estruturas de repetição (for, while);
3.1 - escrita e leitura de arquivos;
4.1 - biblioteca padrão;
4.2 - executando chamadas de sistema;
5.1 - programação orientada a objetivos;
6.1 - programação funcional;
7.1 - instalação de pacotes com o PIP;
7.2 - biopython: leitura de arquivos de sequências biológicas;
7.3 - biopython: processamento de sequências;
7.4 - biopython: análise de anotações presentes em records de sequências;
8.1 - biopython: uso da ferramenta BLAST através do Python;
8.2 - biopython: anotando um genoma microbiano usando Python;
8.3 - biopython: alinhamentos múltiplos de construção de árvores filogenéticas;
8.4 - biopython: baixando dados do NCBI;
8.5 - bioservices: acessando bancos de dados biológicos com o bioservices;
9.1 - bioservices: realizando anotação funcional de genes;
10.1 - pandas, sklearn e xgboost: criando um preditor de proteínas de membrana;
1.1 - uso da plataforma Google Colab;
1.2. - anotações Markdown;
1.3 - tipos de variáveis (int, float, string, boolean);
1.4 - estruturas de dados (listas, dicionários, sets, tuplas);
1.5 - comentários;
1.6 - operações entre variáveis;
2.1 - desvio condicional (if, else, elif);
2.2 - estruturas de repetição (for, while);
3.1 - escrita e leitura de arquivos;
4.1 - biblioteca padrão;
4.2 - executando chamadas de sistema;
5.1 - programação orientada a objetivos;
6.1 - programação funcional;
7.1 - instalação de pacotes com o PIP;
7.2 - biopython: leitura de arquivos de sequências biológicas;
7.3 - biopython: processamento de sequências;
7.4 - biopython: análise de anotações presentes em records de sequências;
8.1 - biopython: uso da ferramenta BLAST através do Python;
8.2 - biopython: anotando um genoma microbiano usando Python;
8.3 - biopython: alinhamentos múltiplos de construção de árvores filogenéticas;
8.4 - biopython: baixando dados do NCBI;
8.5 - bioservices: acessando bancos de dados biológicos com o bioservices;
9.1 - bioservices: realizando anotação funcional de genes;
10.1 - pandas, sklearn e xgboost: criando um preditor de proteínas de membrana;
Indicadores, Metas e Resultados
A entrega de exercícios será considerada para fins de controle de frequência / rendimento. As notas obtidas durante os exercícios não serão critério para a obtenção do certificado, mas em caso de respostas total ou parcialmente incorretas serão repassadas correções e comentários através das funcionalidades do Google Colab. É esperado que haja frequência de 70% considerando da entrega dos exercícios.
Equipe do Projeto
Nome | CH Semanal | Data inicial | Data final |
---|---|---|---|
AIRTON SINOTT CARVALHO | |||
ALAN SOUZA DOS SANTOS | |||
ALESSANDRA NEIS | |||
AMANDA MUNARI GUIMARÃES | |||
ANDREI BORGES GALLO LA ROSA | |||
ANDREI LUCAS PADILHA PEREIRA | |||
ARIANE NORONHA DE MELO | |||
AUGUSTO GARCIA SCHMIDT | |||
BRUNO CASCAES ALVES | |||
CAMILA RIOS PIECHA | |||
Claudia de Jesus Azambuja | |||
DAVI BÄRWALDT DUTRA | |||
ERICMAR AVILA DOS SANTOS | |||
FELIX LEONEL VASCONCELOS DA SILVA | |||
FERNANDO RIBEIRO OLLE | |||
FREDERICO SCHMITT KREMER | 2 | ||
GEOVANA SILVA DA SILVEIRA | |||
GIANLUCCA DE MENDONCA BUZO | |||
GIULI ARGOU MARQUES | |||
GUILHERME FEIJÓ DE SOUSA | |||
HADASSA GABRIELA ORTIZ | |||
HEITOR FELIPE MATOZO DOS SANTOS | |||
ISABELA FERNANDES GOMES DIAS | |||
ISADORA LEITZKE GUIDOTTI | |||
JOÃO CARLOS RODRIGUES JUNIOR | |||
KAUÊ RODRIGUEZ MARTINS | |||
KETHLIN DE QUADROS FERREIRA | |||
LUCAS SEIDY RIBEIRO DOS SANTOS IKENOUE | |||
LUCIANO DA SILVA PINTO | 1 | ||
MATHAUS CAMELATTO KRÜGER | |||
MAURÍCIO DORNELES CALDEIRA BALBONI | |||
NATALI LIMA DIAS | |||
PABLO DA ROSA BATISTA | |||
PEDRO LOPES REISSER | |||
RAFAEL DOS SANTOS WOLOSKI | |||
RENATA NOBRE DA FONSECA | |||
RONALDO PEREIRA DE OLIVEIRA JUNIOR |