Calculadora do Índice de Gini.
Calculadora de Índice de Gini que permite a decomposição do mesmo em grupos ou estratos presentes no conjunto de dados. O método de cálculo utilizado foi visto na disciplina optativa Análise de Dados Socioeconômicos, oferecida pelo Departamento de Economia da Unesp Araraquara.
Para o conjunto inteiro, a fórmula utilizada é:
onde:: número de indivíduos no conjunto de dados;
: proporção de renda acumulada pelo i-ésimo indivíduo da população
Para dados agrupados, a fórmula é:
onde:: proporção da população apropriada pelo h-ésimo grupo;
: proporção da renda acumulada pelo h-ésimo grupo;
: Gini intragrupos (índice de gini de cada grupo);
: Índice de Gini de sobreposição.
Além de calcular e decompor o índice, o script dá também a possibilidade de plotar a Curva de Lorenz do conjunto de dados passado como argumento para a função.
→n(dados)
: Retorna o tamanho do conjunto de dados passado como argumento.
→renda(dados)
: Retorna uma série ordenada da renda dos indivíduos do conjunto de dados;
→renda_total(dados)
: Retorna a soma das rendas de todos os indivíduos;
→renda_acumulada(dados)
: Retorna uma série ordenada da proporção de renda acumulada pelos indivíduos do conjunto;
→gini(dados)
: Calcula o índice de gini do conjunto de dados passado como argumento;
→decomp(grupos, dados)
: Realiza a decomposição do índice de gini para cada subconjunto passado como argumento (grupos
). Retorna uma tupla cujos elementos são, respectivamente:
- Lista ordenada contendo o índice de gini de cada grupo;
- Gini intergrupos ();
- Ponderação Gini intragrupos ;
- Gini de sobreposição.
→lorenz(dados)
: Plota a Curva de Lorenz do conjunto passado como argumento.
As funções recebem um pd.DataFrame
ou uma lista de DataFrames (função decomp()
).
Considerando uma população muito desigual onde uma pessoa concentra toda a renda, espera-se um índice de gini próximo à um. Já em uma amostra com igualdade perfeita (todos indivíduos com a mesma renda), espera-se um índice de gini de zero
Para exemplificar a função decomp()
utilizei o conjunto de dados wage1, presente no pacote wooldridge
. Este pacote contém todos os conjuntos de dados utilizados no livro Introdução à Econometria - Jeffrey M. Wooldridge.
Realizei a decomposição do índice de gini para homens e mulheres.
Para exemplificar a função lorenz()
plotei a Curva de Lorenz para a amostra das mulheres.