Nome da Atividade
APRENDIZAGEM DE MÁQUINA E BIG DATA PARA BIOTECNOLOGIA
CÓDIGO
22000495
Carga Horária
45 horas
Tipo de Atividade
DISCIPLINA
Periodicidade
Semestral
Modalidade
PRESENCIAL
Unidade responsável
CARGA HORÁRIA OBRIGATÓRIA
3
CARGA HORÁRIA EXTENSÃO
1
CARGA HORÁRIA TEÓRICA
2
CRÉDITOS
3
FREQUÊNCIA APROVAÇÃO
75%
NOTA MÉDIA APROVAÇÃO
7
Ementa
Será promovido o estudo de diferentes abordagens de aprendizagem de máquina (supervisionada, não-supervisionada e por reforço), bem como de big data, com foco na aquisição de conhecimentos pertinentes na moderna bioinformática, como produção e validação de modelos preditivos, processamento e visualização de dados de grande dimensionalidade, e criação de pipelines de dados nativas na nuvem.
As ações de extensão desta disciplina serão relacionadas às ações previstas no “Programa G-Biotec na comunidade: ações extensionistas”, cadastrado com o código 269 no Cobalto.
As ações de extensão desta disciplina serão relacionadas às ações previstas no “Programa G-Biotec na comunidade: ações extensionistas”, cadastrado com o código 269 no Cobalto.
Objectives
Objetivo Geral:
Gerais:Apresentar os principais conceitos e metodologias referentes à utilização de métodos de aprendizagem de máquina supervisionada, não-supervisionada e por reforço no contexto da biotecnologia e bioinformática, bem como à utilização de ferramentas para armazenamento, gerenciamento, processamento e análise de grandes volumes de dados estruturados e não estruturados.
Específicos:
Apresentar os principais algoritmos de aprendizagem de máquina supervisionada e não supervisionada. Apresentar as principais metodologias para criação, validação e provisionamento de modelos preditivos. Apresentação as principais metodologias para gerenciamento de grandes volumes de dado no contexto de biotecnologia.
Conteúdo Programático
Bibliografia
Bibliografia Básica:
- Wickham, H. R for Data Science. Disponível online em: https://r4ds.had.co.nz/. Data do Acesso: 17 de Novembro de 2021.
- Goodfellow, I. Deep Learning. Disponível online em: https://www.deeplearningbook.org/. Data do Acesso: 17 de Novembro de 2021.
- James, G. An Introduction do Statistical Learning. Disponível online em: https://www.statlearning.com/. Data do Acesso: 17 de Novembro de 2021.
Bibliografia Complementar:
- Artigos disponíveis no PubMed. https://www.ncbi.nlm.nih.gov/
- Artigos (preprints) disponíveis no Arxiv. https://arxiv.org/
- Artigos (preprints) disponíveis no Biorxiv. https://www.biorxiv.org/
- Documentação Scikit-learn: https://scikit-learn.org/stable/
- Documentação Hadoop: https://hadoop.apache.org/