Skip to content

Latest commit

 

History

History
116 lines (70 loc) · 4.72 KB

notes.md

File metadata and controls

116 lines (70 loc) · 4.72 KB

Overview do progresso

O que foi feito

  • Implementação do K-Means CPU
  • Implementação do K-Means GPU
  • Realização de testes de corretude do K-means CPU
  • Realização de testes de comparação de tempo de execução entre K-means CPU e GPU
  • Escolher um outro algoritmo de agrupamento mais complexo e muito utilizado em grandes datasets para ser estudado e usado de exemplo → Hierarchical Clustering

O que ainda tem que ser feito

  • Rever introdução teórica
  • Mudar o tempo verbal do TCC! Futuro → passado, ou seja, "Esta pesquisa irá focar em […]" → "Esta pesquisa focou em […]"
  • Mudar "clusterização" para "agrupamento". Esse termo portugês oficial é melhor
  • Escrever parte teórica explicando funcionamento do k-means
  • Escrever parte teórica explicando funcionamento outro algoritmo de agrupamento
  • Descrever implementação do K-Means GPU
  • Descrever experimentos de comparação de tempo de execução entre K-means CPU e GPU
  • Implementar outro algoritmo (CPU)
  • Implementar outro algoritmo (GPU)
  • Descrever implementação do outro algoritmo (GPU)
  • Realizar experimentos de comparação de tempo de execução entre outro algoritmo CPU e GPU
  • Descrever experimentos de "
  • Descrever "receita geral de paralelização"
  • Escrever conclusão

Notas Misc.

Reunião com Professor (18/01/24)

  • Entrega máxima ideal da parte escrita: 15 de abril de 2024
  • Capítulos mais fáceis de fazer por hora: capítulo 2 (Fundamentação Teórica) e capítulo 4 (Metodologia de Desenvolvimento e Pesquisa)

Reunião com Professor (10/04/24)

  • Discutir no capítulo 4 como foram identificadas quais partes podiam ser paralelizáveis, e como seria feito isso em outros algoritmos
    • Dá pra citar brevemente um exemplo do Algoritmo Hierárquico mostrando por similaridade como seria feita essa identificação nele

Professores que estou considerando para formar a banca

Reunião com Professor (15/04/24)

  • Explicar na conclusão os fatores que impactaram mais as dificuldades de alcançar os speed-ups
    • Um ótimo exemplo seria a última otimização que foi feita ao implementar o K-means GPU v3.0, onde parar de usar uma list comprehension de Python e passar a usar uma sintaxe do Numpy para filtrar elementos de um array causou um speed-up de mais de 20 vezes ao rodar o algoritmo no dataset 5!

Links úteis

LaTeX

Sanando Dúvidas de Português Muito Comuns

Essas me pegam desprevinido sempre! Bom manter salvo aqui pra referência rápida (e offline!).

Os Quatro Porquês

POR QUE separado é o porquê de perguntas (diretas ou indiretas), o porquê que equivale a "por qual razão", e também tem o mesmo sentido de "pelo qual" e suas flexões.

  • Por que eu tenho que aprender isto?
  • Gostaria de saber por que eu tenho que aprender isto.
  • Por que sobra sempre para mim?
    • (Por qual razão sobra sempre para mim?)
  • A razão por que sobra sempre para mim, eu não sei.
    • (A razão pela qual sobra sempre para mim, eu não sei)

PORQUE junto é o porquê de respostas.

  • Não preciso de mais exemplos porque já entendi.

PORQUÊ junto e com acento é o porquê que representa um substantivo (o porquê, o motivo).

  • Acho que você já entendeu o porquê de aprender isto.

POR QUÊ separado e com acento é o o porquê do fim das frases (com ponto de interrogação, de exclamação ou com ponto final).

  • Você entendeu, sabe por quê? Eu sei por quê!

Fonte: Toda Matéria

Capítulo 2 — Fundamentação Teórica → O que deve conter?

Sugestão de outro algoritmo para estudarmos à fundo no trabalho: Hierarchical Clustering

Sub-capítulos Necessários:

  • Agrupamento de Dados
  • Programação Vetorial
  • Cuda
  • K-Means
  • Hierarchical Clustering (?)