- Implementação do K-Means CPU
- Implementação do K-Means GPU
- Realização de testes de corretude do K-means CPU
- Realização de testes de comparação de tempo de execução entre K-means CPU e GPU
- Escolher um outro algoritmo de agrupamento mais complexo e muito utilizado em grandes datasets para ser estudado e usado de exemplo → Hierarchical Clustering
- Rever introdução teórica
- Mudar o tempo verbal do TCC! Futuro → passado, ou seja, "Esta pesquisa irá focar em […]" → "Esta pesquisa focou em […]"
- Mudar "clusterização" para "agrupamento". Esse termo portugês oficial é melhor
- Escrever parte teórica explicando funcionamento do k-means
- Escrever parte teórica explicando funcionamento outro algoritmo de agrupamento
- Descrever implementação do K-Means GPU
- Descrever experimentos de comparação de tempo de execução entre K-means CPU e GPU
- Implementar outro algoritmo (CPU)
- Implementar outro algoritmo (GPU)
- Descrever implementação do outro algoritmo (GPU)
- Realizar experimentos de comparação de tempo de execução entre outro algoritmo CPU e GPU
- Descrever experimentos de "
- Descrever "receita geral de paralelização"
- Escrever conclusão
- Entrega máxima ideal da parte escrita: 15 de abril de 2024
- Capítulos mais fáceis de fazer por hora: capítulo 2 (Fundamentação Teórica) e capítulo 4 (Metodologia de Desenvolvimento e Pesquisa)
- Discutir no capítulo 4 como foram identificadas quais partes podiam ser paralelizáveis, e como seria feito isso em outros algoritmos
- Dá pra citar brevemente um exemplo do Algoritmo Hierárquico mostrando por similaridade como seria feita essa identificação nele
- Júlia Tannús de Souza ([email protected])
- Anderson Rodrigues dos Santos ([email protected])
- Marcelo de Almeida Maia ([email protected])
- Wendel Alexandre Xavier de Melo ([email protected])
- Luiz Gustavo Almeida Martins ([email protected])
- Rivalino Matias Júnior ([email protected])
- Pedro Frosi Rosa ([email protected])
- Explicar na conclusão os fatores que impactaram mais as dificuldades de alcançar os speed-ups
- Um ótimo exemplo seria a última otimização que foi feita ao implementar o K-means GPU v3.0, onde parar de usar uma list comprehension de Python e passar a usar uma sintaxe do Numpy para filtrar elementos de um array causou um speed-up de mais de 20 vezes ao rodar o algoritmo no dataset 5!
- Trabalhos de Conclusão de Curso feitos por alunos da FACOM
- Datasets open-source que podem ser usados para testes e experimentos (DSs daqui foram usados até no doutorado do Daniel Abdala!)
Essas me pegam desprevinido sempre! Bom manter salvo aqui pra referência rápida (e offline!).
POR QUE separado é o porquê de perguntas (diretas ou indiretas), o porquê que equivale a "por qual razão", e também tem o mesmo sentido de "pelo qual" e suas flexões.
- Por que eu tenho que aprender isto?
- Gostaria de saber por que eu tenho que aprender isto.
- Por que sobra sempre para mim?
- (Por qual razão sobra sempre para mim?)
- A razão por que sobra sempre para mim, eu não sei.
- (A razão pela qual sobra sempre para mim, eu não sei)
PORQUE junto é o porquê de respostas.
- Não preciso de mais exemplos porque já entendi.
PORQUÊ junto e com acento é o porquê que representa um substantivo (o porquê, o motivo).
- Acho que você já entendeu o porquê de aprender isto.
POR QUÊ separado e com acento é o o porquê do fim das frases (com ponto de interrogação, de exclamação ou com ponto final).
- Você entendeu, sabe por quê? Eu sei por quê!
Fonte: Toda Matéria
Sugestão de outro algoritmo para estudarmos à fundo no trabalho: Hierarchical Clustering
Sub-capítulos Necessários:
- Agrupamento de Dados
- Programação Vetorial
- Cuda
- K-Means
- Hierarchical Clustering (?)