Giter Club home page Giter Club logo

datamining's People

Contributors

zegildo avatar ljr84 avatar edinadja avatar jessicalmacedo avatar matheuslopes1 avatar andersonvalentim avatar arlanmds avatar elizeus avatar gabrielggui avatar aldeci123 avatar matheusk500 avatar raage01 avatar redlich avatar jcarllos avatar hugoyago avatar alesciafernandes avatar martinsmayko avatar pierre-freire avatar anderssonfalcao avatar frankjonh avatar aldecial avatar victorbezerra avatar

Stargazers

Hasheem Akbar avatar

Watchers

 avatar  avatar

datamining's Issues

MT9 - Lerinaldo

@lerinaldojr ,

csv_file.to_csv('BBC-Results-Lerinaldo.csv', **sep='\t'**, encoding='utf-8')
Você gosta do TSV.

Por favor deixe apenas 2 arquivos no seu MT9. O seu arquivo de manipulação .py e o seu arquivo final. Nada além.

MT9 - John

@Redlich - Não é possível saber como se chegou ao arquivo para poder repetir o processo. O arquivo não está limpo. Exemplo:
08/12/2013 10:17;0;104;80. O valor 104 não poderia aparecer dado que o valor máximo possível para esta coluna é 100.

MT9 - Frank

@FrankJonh - O formato da pasta está errado. 'pasta MT9' quando deveria ser 'MT9'. Dentro do MT9 não há o código que gerou o arquivo final. Como saberei de onde surgiu esse arquivo?. O arquivo não está limpo: "05/02/2013;19:41:48;9;104;84"O valor 104 não poderia existir.

Revisão José Carlos

Olá @Jcarllos,

Todas as perguntas do seu trabalho são do número 1? Apresente diferenças entre Markdown e Código do Python.

  1. Qual o dia do mês mais provável?
  2. Hipertensão ou alcoolismo é a doença mais propensa a falta?

MT8 - Jéssica

@JessicaLMacedo,

  1. Jéssica minha sugestão é que ao invés de enviar o .py você poderia enviar diretamente o arquivo do jupyter que inclusive já é renderizado pelo github;

  2. Observe também que para simplificar o trabalho de salvar em arquivo você poderia utilizar a própria API de Dataframe do pandas. Seu código ficaria mais simples, resolveria o problema com apenas 1 linha.

  3. Não há necessidade nem é o padrão uma pasta MT8-Jessica se o MT8 já está dentro da pasta Jéssica.

Revisão Cleyton

Olá @raage01 ,

Seu arquivo está bastante mal formatado;

  1. A questão segue uma abordagem granular interessante, porém, a resposta não responde o que foi perguntado.

  2. Não foi respondido.

MT8 - John

@Redlich - seu .csv possui índice sem necessidade. As únicas colunas necessárias são título e link.

MT8 - HugoYago

@Hugoyago - Seu arquivo csv não possui colunas. Seu arquivo possui índice quando não é solicitado. A separação do CSV é por ',' e não por ';'.

MT8 - Frank

@FrankJonh - CSV deve ser separado por ','. Seu arquivo não é renderizado corretamente pelo github. Observe o trabalho dos colegas.

MT9 - Aldecir

@aldeci123 - Arquivo não encontra-se limpo: Exemplos de inconsistências:
2013/1/30 20:52:38 7 0.62 0.66
2013/1/31 17:59:29 7 104 86

Não há informações ou código de como se chegou a essa configuração. A pasta não possui o código gerador ou informações de como o processo foi realizado. Há um problema conceitual. Em uma escala que vai de 0 a 100 há valores de 0.62.

MT8 - Lerinaldo

@lerinaldojr - A pasta possui 2 arquivos CSV quando deveria existir apenas 1. Há uma coluna extra chamada index que não há necessidade. As colunas não aparecem dispostas na ordem solicitada.

MT8- Aldecir

@aldecial,
Você não me enviou seu código apenas o arquivo final com problemas de formatação das notícias. Como resolver?

Correção P1 Anderson Cirilo

Principais problemas:
@Vectro26

  1. Há inúmeros problemas relacionados à escrita. português sem cuidado. Coloque os acentos, escreva as palavras de forma correta, diferencie o que é célula Markdown de célula de código. É péssimo para a estrutura colocar todas as coisas juntas em um mesmo amontoado de trabalho.

  2. A resposta do item 2 precisa ser objetiva. Com um gráfico, por exemplo.

  3. Como você sabe que é de 0 à 1 ano e não de 0 à 2 ou de 0 à 3? Essa informação, em essência não fica clara no histograma;

  4. A 4ª questão não é compreensível;

  5. Basta contabilizar a cidade com o maior número de faltas ao invés de listar todas.

  6. As mensagens que deveriam aparecer em markdown aparecem junto dos códigos. O dia com mais faltas é independente do mês.

  7. Conclusão imprecisa. O que o cliente pode fazer com a conclusão do seu trabalho? Como ele pode minimizar o problema da falta ao atendimento médico?

MT8 - Ednadja

@edinadjamacedo - Há problemas na organização de sua pasta: MT8.2 quando deveria ser MT8.

Melhoria do código

@Jcarllos olhei o teu trabalho. Em primeiro lugar gostaria de te dar os parabéns pelo esforço e pela tentativa em ir além. Minhas considerações são:

Sobre o código em python:
Para um trabalho excelente é muito importante seguir as recomendações de estilo sugeridas pelo google para que seu código fique limpo e elegante.

Sobre a solução:
Observe a tua função get_card e as inúmeras sequências que você criou. Perceba que todas as classes contém windowbg . Será que daria para resolver tudo com um único xpath?

Meus parabéns por utilizar o método .extend um detalhe que geralmente passa despercebido diante dos programadores.

Sobre o print:
Ao inves de imprimir: print(subjects +', ' + authors +', ' + replies.strip() +', ' + views.strip()) é mais elegante e útil utilizar o .format.

Um abraço,
José.

MT8 - Arlan

@ArlanMDs,
Há uma forma de refatorar seu código por meio da API do dataframe do pandas. Como converter um dataframe para csv? Por fim, seu arquivo possui problemas de formatação das notícias, como resolver?.

MT9 - Jessica

@JessicaLMacedo - O arquivo não encontra-se limpo. Exemplo:
21/07/2013 09:23:07,7.0,104.0,64.0. O valor 104 não deveria aparecer uma vez que o maior valor para essa coluna é 100.

MT9 - Lerinaldo

@lerinaldojr - Arquivo possui problemas de estrutura nas colunas e o valor do índice não é necessário. Dentro da pasta deveria existir apenas 2 arquivos. O código que produziu o arquivo ou uma explicação em .txt de como se chegou ao resultado e o resultado final. Por fim, há ainda pequenos detalhes da limpeza: "12333 21/06/2013 05:23:05,8,**104,**84" não deveria existir, dado que o maior valor para esta coluna é o 100.

MT8 - Lerinaldo

@lerinaldojr ,
csv_file.to_csv('globo_csv', sep='\t', encoding='utf-8')
Corrija o separador do arquivo e a codificação do arquivo final.

MT9 - Hugo

@Hugoyago - Não é possível saber como o arquivo foi gerado para poder repetir o processo. O arquivo não está limpo. O valor 104, por exemplo, não deveria aparecer dado que o limite é 100 para a coluna recognition_score.

Revisão Gabriel

Olá @gabrielgui19 ,

Você poderia o seu documento no google drive, submeter o link via github e não obrigar o usuário a ter um excel instalado na máquina para poder usufruir da tua análise.

MT9 - Arlan

@ArlanMDs,

Em sua pasta MT9 há 3 arquivos, por favor, deixe apenas:

  1. O .csv final ;
  2. código que utilizou para chegar a esta configuração final. Se fez no excel, o arquivo excel, se fez na mão o procedimento em um .txt, se fez em .c ou .java ou .py o código utilizado.

MT8 - Ednadja

@edinadjamacedo,
Seu código apresenta dois problemas:

titulos_links = {"---------------Títulos das notícias--------------":titulo, 
                             "----------------------Links----------------------":link}

Cada linha do arquivo csv deve ter link, noticia ou noticia,link. Da forma como você está fazendo primeiro são impressos todos os links, depois todas as notícias. Ao invés de imprimir salve o arquivo como .csv. Uma forma fácil de fazer isso é observar a API pandas para o Dataframe conforme @lerinaldojr fez no trabalho dele.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.