Giter Club home page Giter Club logo

tcc's People

Contributors

codacy-badger avatar mazzoleni-gabriel avatar

Watchers

 avatar

tcc's Issues

Estrutura TCC2

-> Ter um relatório csv com todas métricas

Proposta vira um capitulo sobre a execução do projeto

  • Ajustar o que mudou no projeto
  • Falar sobre limitações (bots, tempo)

Avaliação da ferramenta vira um novo capitulo

Colocar todos dados no esquema de banco
Adicionar numero de PRs, arestas e tempo de extração e métricas separados na tabela
Relacionar estrutura extraída com o tempo de execução
Explicar fomulário enviado para testes
Adicionar tabelas de testes na integra
Pesquisar com usuários que critérios foram utilizados para avaliação
Analisar se é possível relacionar métrica com a nota da avaliação
Enviar email com sql me metricas

Ajustes na apresentação

  • Acho que a fonte usada nas figuras dos slides 6 e 7 estão mto pequenas...
  • "Força" é uma medida (como vc deixa isso claro no slide 8). No entanto, vc representa força por arestas sem valores associados na figura do slide 7. Não vejo "força" nessa figura... Ou vc muda de "força" para "potencial de colaboração futura" ou vc coloca valores. Deixar assim não dá.
  • Slide 8: aquela frase longa colocar em tópicos (como requisitos). Vc fala ali em diminuir o espaço de busca.... daí tens que explicar diminuir comparado a que?
  • Slide 21: deveria listar exemplos de cada uma dos 3 tipos. Além disto, vc precisa explicar em linhas gerais cada um dos 3 tipos
  • Slide 23 é desnecessário. Vc pode apenas falar isso....
  • Depois das tabelas de trabalhos relacionados, era bom ter um slide para sintetizar as considerações e análise geral (já tinha te falado isso)
  • Slides 28 ao 33 - fonte das figuras mto pequenas
  • Que módulos vc se refere quanto aos exemplos dos slides 31 e 32? Nos slides anteriores vc mencionou os módulos, nesses não.
  • Em vários slides vc está fazendo menção números de figuras, mas as figuras não tem numeração !!!
  • Slide 37 - eu pensei que vc já tinha definido um espaço de busca viável (a partir de um desenvolvedor)????

Revisão final

  • Lista de Abreviaturas. Incluir: SCM, SCI, todas as métricas que tem siglas apresentadas no cap. 3 ou citadas no cap. 4.
  • Dúvidas sobre a figura 2.4
  • Dúvida último parágrafo da Seção 2.3.1 (GitHub)
  • Seção 2.3 - mtas notas de rodapé...
  • Seção 3.4 - métricas de avaliação: vc usou o trabalho do Marcelo para dar a mesma ênfase em predição de arestas e avaliação de modelos preditivos. Este não é o foco do seu trabalho. Releia a introdução do TCC para lembrar o que estamos fazendo.... (comentários ao longo de toda esta seção e tb na 3.5)
  • Tabela 4.1. - issues
  • Seção 4.2. dúvida
  • Figura 4.3 Tirar da imagem "Table 1 develor historical behavior rating criteria"
  • Figura 4.5: Não ficou claro o que representa o valor alpha que está na matrix
  • Rever Figura 4.6 e texto acima dela... não dá para entender...
  • Reler primeiro parágrafo da seção 4.5, arrumar pois não está fazendo sentido...
  • Rever última frase antes da Figura 4.7
  • Rever confusão no número de projetos da seção 4.6 mais o comentário sobre o crawler
  • Arrumar Figura 5.1
  • Arrumar texto da seção 5.2 conforme meu comentário (pull requests)
  • Abaixo da Figura 5.2, rever limite de requisições + faltou falar da entidade métricas na hora de explicar a figura...
  • Percebi pela Seção 5.3 que vc está fazendo uma confusão entre métricas e arestas. Métricas deveriam ser valores (propriedades que vc apresenta no Cap. 3) e não arestas de um grafo! Métricas não estabelecem conexões ou formam redes.... elas são (ou deveriam ser) valores que qualificam uma aresta no grafo. Daí a Figura 5.4 representam "métricas" como arestas... não pode ser.... vc não vai quantificar nada? Pra que todas aquelas propriedades/métricas que vc apresenta no Capítulo 3? E pq a entidade métrica do BD tem valor? Cara, rever teu texto todo da proposta para não falar esta besteira. E a Figura 5.4 está completamente errada!!! Cadê as métricas dessa figura?
  • Seção 5.4 - explicar melhor!!
  • Seção 5.5. vai ficar sem texto??? - Não sei se vou conseguir fazer essa agora, apaguei da proposta.
  • A Conclusão não está boa.... tem vários comentários lá....

Revisões Latex

  • Ajustar tamanho das imagens (muito grandes)
  • Ajustar imagens/gráficosl no quebrando parágrafos (tirar [hbdp])
  • Ajustar plural de citações et al
  • Verificar caption em tabellas

Ressalvas da banca

Isabela:

  • Ajustar título do tcc (adicionar "colaboração")
  • Ajustes no resumo
  • Adicionar lista de tabelas, figuras e abreviaturas antes do sumário
  • Ajustes "a partir" na página 12
  • Ajustes "todos os nós presentes na rede" na página 12
  • Ajuste Figura 1.1
  • Ajuste "invitáveis" página 16
  • Ajuste referência página 16
  • Explicar correções menores e maiores pg 17,18
  • Referência pg 18
  • "A como uma baseline do projeto, um desenvolvedor faz um fork" não está na figura
  • Referência sobreposição de vizinhos
  • Aumentar fonte FIgura 3.6
  • Detalhar propriedade semântica
  • Tantas propriedades temporais de batista? É pq foi justo Batista que propôs estas propriedades.
  • Explicar melhor GPC
  • Métricas para avaliação, referências e o que vai medir.
  • Finalizar seção de métricas para avaliação
  • Finalizar seção Gousios (2013)
  • Explicar pq o final de Matek e Zebec (2016)
  • Ajuste texto Zhang et al.
  • Como fizeram precision e recall em Zhang et al.?
  • figura e tablea -> Figura e Tabela
  • batista 2017b nas tabelas
  • Detalhar melhor avaliação da ferramenta

Débora:

  • plataformas de repositório remoto
  • Tabela 4.2 na página 42 (Acabou que o espaço em branco saiu com os outros ajustes ao longo do trabalho)
  • Espaço sobrando na página da Tabela 4.7

Anotações da banca:

  • Rever avaliação Será feito no TCC2
  • Não ficou claro o que o primeiro módulo irá extrair.
  • Rever título
  • Rever o uso de "ferramenta"
  • Conectar melhor as coisas da fundamentação
  • Esclarecer o que é repositório, pois hora vc chama de projeto hora de repositório.

Escrever sobre redes de colaboração

  • Redes de Colaboração (definição, como são formadas, exemplificar para o contexto - redes de colaboração de projetos de software)
  • Propriedades Topológicas/Estruturais
  • Propriedades Semânticas
  • Propriedades Temporais

5. Proposta

  • Adicionar gerador de grafo na proposta 2
  • Mostrar esquema da base de dados
  • Proposta de avaliação com janelas temporais
  • Experimentos de viabilidade
  • Caso de uso com grafo exemplo
  • Introdução
  • Utilizar precisão e revocação na avaliação
  • Escrever sobre precisão e revocação nos fundamentos

Revisão 17/9/19 - até Cap. 2

Corrigi o Resumo, Abstract e Capítulo 2. Utilizei a mesma notação para as correções + comentários no overleaf. Algumas comentários adicionais:

  • Suas figuras estão mto grandes...diminua a escala.
  • Tens que se esforçar mais para o texto ter uma sequência lógica e clara.
  • Cuidado com expressões coloquiais que vc coloca entre aspas... em textos técnicos como este isto não é aceito.

Revisão

  • Coluna machine learning na tabela
  • Posicionar este trabalho nas tabelas
  • Fazer paragrafo de zhang 2018 explicando q foi relevante para identificar propriedades do github. trata-se de um trabalho iniciar com extração de dados e formação da rede como desafio.
  • Fechamento dos trabalhos relacionados posicionando o meu trabalho
  • Adicionar Parágrafos concluindo todas sections

Rodar para casos de teste

  • nataliaspeck
  • rartner
  • arthurtuio (Não possui PRs)
  • ViniciusMRosa (Rede muito pequena [2 usuários])
  • regiseduardogregol
  • leonardotdleal
  • richardborgescc(Rede muito pequena [2 usuários])
  • epiresdasilva
  • Matheusqz (extraída, porém mt grande para calcular as métricas)
  • luanelioliveira
  • brunog3
  • jefferson-amorim (Não possui PRs)
  • diogoantelo
  • fsblemos
  • rfschroeder
  • muriloignacio
  • davidalves1
  • brunoprudencio (muito pequena)
  • jhonmike

Buscar usuários para testes

nataliaspeck
rartner
arthurtuio (Não possui PRs)
ViniciusMRosa (Rede muito pequena [2 usuários])
regiseduardogregol
leonardotdleal
richardborgescc
epiresdasilva
Matheusqz
luanelioliveira
brunog3
jefferson-amorim (Não possui PRs)
diogoantelo
fsblemos
rfschroeder
muriloignacio

Tabela de artigos relacionados

Trabalho | Objetivo | Redes de Colaboração | Propriedades Topológicas| Propriedades Semânticas |Propriedades Temporais | Avaliação de Recomendação

Trabalho X | blabla | Sim , Nós  , Arestas  | Quais?                        | Quais?                          | Quais?                          | Sim/Não Quais métricas?

Reorganizar Estrutura do TCC

1.3 Estrutura do trabalho está desatualizado!!

  1. Gerenciamento de Configuração de Software
    2.1. Principais conceitos (os subitens que hj estão abaixo do 2.1)
    2.2. Sistemas de Controle de Versão

    • Fazer uma subseção para cada conceito: repositórios, branches, fork, commits, merge, pull requests
    • Fazer uma subseção para explicar os principais sistemas: Git, Mercurial e SVN
      2.3. Plataformas de Repositórios Remotos
      Explicar peculiaridades do GitHub (exemplo atributos sociais, repositórios abertos e privados)
    • mencionar o BitBucket tb e outros repositórios se houver
    • terminar essa subseção justificando pq o GitHub foi o escolhido para o teu trabalho.
  2. Fundamentos de Análise de Redes de Colaboração
    3.1. Redes de Colaboração (definição, como são formadas, exemplificar para o teu contexto - redes de colaboração de projetos de software)
    3.2. Propriedades Topológicas/Estruturais
    3.3. Propriedades Semânticas
    3.4. Propriedades Temporais

  3. Trabalhos Relacionados

  • Uma subseção para cada trabalho
  • A subseção final uma tabela comparativa de todos os trabalhos e uma análise sobre ela.
    O será relacionado na tabela:

    Trabalho | Objetivo | Redes de Colaboração | Propriedades Topológicas| Propriedades Semânticas |Propriedades Temporais | Avaliação de Recomendação

Trabalho X | | Sim - Nós ? - Arestas ? | Quais? | Quais? | Quais? | Sim/Não - Quais métricas?

  1. Proposta
    5.1. Arquitetura da solução (figura e explicação de como funcionará)
    5.2. Extrator de Dados (De onde será extraído, Api, quais dados, como será extraído (a partir de um desenvolvedor e etc))
    5.3. Formação e Armazenamento das (Redes?) Colaborações
    5.4. Computar Propriedades (Quais?)
    5.5. Como vamos recomendar???? MUITO IMPORTANTE!!! (Dar uma olhada em algoritmos usadas por Sistemas de Recomendação)
    5.6. Como vamos avaliar a recomendação?
    5.7. Experimentos de Viabilidade do Extrator.

Trocar entidate GItHub quando alcançar o limite de requisições

Aparentemente é possível trocar o token durante a busca de issues mudando o github_requester
image

Exception quando estoura o limite
web_1 | github.GithubException.RateLimitExceededException: 403 {"message": "API rate limit exceeded for user ID 59837599.", "documentation_url": "https://developer.github.com/v3/#rate-limiting"}

É possível acompanhar o rate limit a cada request, então podemos trocar o token antes de exceder o limite:

web_1  | rate limit: (98, 5000)
web_1  | rate limit: (93, 5000)
web_1  | rate limit: (89, 5000)
web_1  | rate limit: (85, 5000)
web_1  | rate limit: (80, 5000)
web_1  | rate limit: (76, 5000)
web_1  | rate limit: (72, 5000)
web_1  | rate limit: (68, 5000)
web_1  | rate limit: (29, 30)
web_1  | rate limit: (58, 5000)
web_1  | rate limit: (54, 5000)
web_1  | rate limit: (50, 5000)
web_1  | rate limit: (45, 5000)
web_1  | rate limit: (41, 5000)
web_1  | rate limit: (36, 5000)
web_1  | rate limit: (31, 5000)
web_1  | rate limit: (27, 5000)
web_1  | rate limit: (23, 5000)
web_1  | rate limit: (19, 5000)
web_1  | rate limit: (15, 5000)
web_1  | rate limit: (11, 5000)
web_1  | rate limit: (7, 5000)
web_1  | rate limit: (2, 5000)

Conclusão

  • Cronograma
  • Resumo de tudo
  • Falar do que já foi feito do cronograma

Criar índices no banco

CREATE INDEX idx_users ON metrics USING btree(user_id_1, user_id_2);

create index idx_user_login on github_user using hash(login);

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.