Usando a Estatística para Resumir Dados
1. Introdução 2. Saúde 3. Exercícios
1. Introdução Os dados disponíveis na Internet podem ser representados graficamente ou serem resumidos por estatísticas.
É importante ser capaz de coletar ou compilar dados e calcular as estatísticas-resumo apropriadas.
Por outro lado, se lhe for apresentado um conjunto de estatísticas-resumo, você deverá ser capaz de interpretar, analisar e mesmo criticar a informação contida nas estatísticas.
Neste projeto, você visitará um conjunto de sites que apresentarão dados para serem representados graficamente e analisados por meio de estatísticas-resumo.
2. Saúde O Data and Story Library (http://lib.stat.cmu.edu/DASL) é um site mantido por estatísticos da Carnegie Mellon University. Contém conjuntos de dados e o suporte correspondente em uma variedade de áreas.
Visite o site e na ferramenta de busca Search Data by Text digite Nutrition.
Acessar os dados sobre cereais (Cereals) selecionando o link Download .TXT file.
O arquivo pode ser um pouco difícil de ser lido, uma vez que os cabeçalhos das colunas não se alinham com os dados.
Alguns pontos de dados amostrais incluem a seguinte informação:
- Frosted Mini-Wheat (Minitrigo com cobertura) é um produto da Kellogg e contém 3 gramas de carboidratos complexos em uma única porção. - 100% Natural Bran (Farelo 100% Natural) da Nabisco contém 120 gramas de açúcar por porção.120 - Lucky Charms da General Foods contém 180 miligramas de sódio por porção.
O conjunto de dados é particularmente interessante porque viola a maioria dos pressupostos exigidos de um modelo de regressão. Quando os dados são transformados usando uma transformação de log natural, as violações são corrigidas. Os intervalos de predição também podem ser usados produtivamente para fornecer uma visão sobre as limitações práticas da precisão preditiva do modelo final.
3. Exercícios a) Analise o problema e calcule as medidas de tendência central, medidas separatrizes, medias de variabilidade e medidas de forma. Categorize os conjuntos de dados por meio das técnicas de grupos extremos em relação às gramas (g) de carboidratos dos cereais das marcas Kellogg (K) e General Mills (G).
Construa o histograma e o boxplot.
Elabore um texto descritivo-argumentativo sobre as estatísticas encontradas, bem como sobre os gráficos. b) Transforme os dados originais para inverso, log natural, raíz quadrada e potência de dois, e recalcule as s medidas de tendência central, medidas separatrizes, medias de variabilidade e medidas de forma em relação às grama (G) de carboidratos dos posição dos cereais das marcas Kellogg (K) e General Mills (G). Reconstrua o histograma e o boxplot. Elabore um texto descritivo-argumentativo sobre as estatísticas encontradas, bem como sobre os gráficos.
|