Sistemas Distribuídos
Descrição da Oportunidade
Responsabilidades no âmbito da bolsa: - Desenho de um sistema de controlo de consumo energético de GPUs no contexto de aprendizagem profunda sobre ambientes distribuídos. - Implementação e otimização de um protótipo do desenho anterior. - Avaliação experimental do protótipo desenvolvido recorrendo a diferentes modelos de aprendizagem profunda e diferentes tipos de hardware (p.ex., diferentes dispositivos de processamento e armazenamento). As tarefas descritas neste plano de trabalhos requerem a aplicação e o desenvolvimento de conceitos e técnicas da área da Engenharia de Informática tipicamente lecionados em unidades curriculares que compõem o núcleo do plano de estudos do Mestrados Integrados em Engenharia Informática ou de Mestrado em Engenharia Informática.
Habilitações Académicas
Licenciatura em Ciências de Engenharia Informática.
Requisitos Mínimos
- Conhecimentos sobre ferramentas de monitorização e controlo energético (i.e., Intel RAPL , PowerJoular, EnergAt, NVML, DVFS);- Conhecimentos em ferramentas e modelos de aprendizagem profunda (i.e., PyTorch, ResNet18, AlexNet, Cifar-10), bem como cargas de trabalho heterogéneas (p.ex., cargas de trabalho na nuvem e supercomputadores);- Conhecimentos sólidos em sistemas operativos;- Conhecimentos so´lidos em sistemas distribuídos.
Fatores de Preferência
- Experiência no desenvolvimento de sistemas de controlo energético de GPU (i.e., NVML, nvidia-smi); - Conhecimento sólido sobre o estado da arte em soluções de controlo energético para aprendizagem profunda; - Experiência na linguagem de programação C++.
Período de candidatura
Desde 19 Dec 2024 a 03 Jan 2025
Centro
Laboratório de Software Confiável