Wednesday 27 December 2017

Informática movendo média com excel


Análise de negócios: Microsoft Excel 2018 RESPONDA ÀS PRINCIPAIS PERGUNTAS DE NEGÓCIOS CONTROLAR AS FINANÇAS DA COMPANHIA PREPARAR CASOS DE NEGÓCIO FAZER UMA MELHOR DECISÃO DE INVESTIMENTO UTILIZAR EXCEL 2018 PARA OBTER DIREITOS DE INSPIRAÇÃO, TOMAR DECISÕES MAIS INTELIGENTES E GANHAR MAIS GANHOS Usando exemplos do mundo real, o Carlberg ajuda você a colocar os recursos e funções do Excelrsquos. Para trabalhar e obter o poder da análise quantitativa por trás das suas decisões de gerenciamento. O especialista do Excel, Conrad Carlberg, mostra como usar o Excel 2018 para realizar as principais tarefas financeiras que cada gerente e empreendedor devem dominar: analisar declarações, planejar e controlar as finanças das empresas, tomar decisões de investimento e gerenciar vendas e marketing. Usando exemplos do mundo real, o Carlberg ajuda você a tirar o máximo proveito dos recursos e funções mais recentes do Excel 2018rsquos. Ao longo do caminho, yourquoll descobrir as melhores e mais rápidas formas de lidar com tarefas essenciais que vão desde importar dados empresariais para analisar os índices de rentabilidade. Tornar-se um especialista em Excel nunca foi tão fácil, a Yoursquoll encontra instruções cristalinas, insider insights, projetos passo-a-passo completos e muito mais. Itrsquos, todos complementados por um extraordinário conjunto de recursos baseados na web, desde periódicos de amostra e livros de contabilidade até ferramentas de previsão de negócios. Bull Use ferramentas de análise do Excel para resolver problemas ao longo do negócio Bull Construa e trabalhe com demonstrações de resultados e balanços Bull Valor de inventários e ativos circulantes, e sintetizar transações Bull Calcular capital de giro e analisar fluxos de caixa Bull Mover de proformas para orçamentos operacionais que ajudam a orientar Suas decisões de gestão Bull Preparar casos de negócios incorporando tudo, desde taxas de desconto até análise de margem e contribuição Sobre a Biblioteca MrExcel: Todo livro na Biblioteca MrExcel identifica um conjunto específico de habilidades cruciais do Excel e apresenta tarefas e exemplos focados para realizá-los de forma rápida e eficaz. Selecionada por Bill Jelen, Microsoft Excel MVP e mastermind atrás do site líder de soluções do Excel MrExcel, esses livros irão: bull Aumentar dramaticamente a sua produtividade, deixando você 50 horas por ano, ou mais Bull. Experimente estratégias criativas e comprovadas para resolver problemas do mundo real. Como obter excelentes resultados, não importa quantos dados você tenha touro Ajude-o a evitar erros críticos que até mesmo os usuários experientes fazem o Centro de Consultoria em Bioestatística de Eva Goldwater Escola de Saúde Pública da Universidade de Massachusetts atualizada em fevereiro de 2007 Em um relance Utilizamos o Excel para fazer algumas análises básicas de dados Tarefas para ver se é uma alternativa razoável ao uso de um pacote estatístico para as mesmas tarefas. Concluímos que o Excel é uma escolha fraca para análise estatística além de exemplos de livros didáticos, as estatísticas descritivas mais simples ou para mais do que algumas colunas. Os problemas que encontramos que levaram a esta conclusão estão em quatro áreas gerais: os valores perdidos são tratados de forma inconsistente e às vezes incorretamente. A organização de dados difere de acordo com a análise, obrigando você a reorganizar seus dados de várias maneiras, se desejar fazer muitas análises diferentes. Muitas análises só podem ser feitas em uma coluna por vez, o que torna inconveniente fazer a mesma análise em muitas colunas. O produto está mal organizado, às vezes rotulado de forma inadequada, e não há registro de como uma análise foi realizada. O Excel é conveniente para a entrada de dados e para manipulação rápida de linhas e colunas antes da análise estatística. No entanto, quando você está pronto para fazer a análise estatística, recomendamos o uso de um pacote estatístico, como SAS, SPSS, Stata, Systat ou Minitab. Introdução O Excel é provavelmente a planilha mais comumente usada para PCs. Os computadores recentemente adquiridos geralmente chegam com o Excel já carregado. É facilmente usado para fazer uma variedade de cálculos, inclui uma coleção de funções estatísticas e um Data Analysis ToolPak. Como resultado, se de repente achar que você precisa fazer alguma análise estatística, você pode recorrer a ela como a escolha óbvia. Nós decidimos fazer alguns testes para ver o quão bem o Excel serviria como um aplicativo de análise de dados. Para apresentar os resultados, usaremos um pequeno exemplo. Os dados para este exemplo são fictícios. Foi escolhido ter duas variáveis ​​categóricas e duas contínuas, para que possamos testar uma variedade de técnicas estatísticas básicas. Uma vez que quase todos os conjuntos de dados reais têm pelo menos alguns pontos de dados perdidos, e uma vez que a capacidade de lidar com os dados ausentes corretamente é uma das características que consideramos garantidas em um pacote de análise estatística, introduzimos duas células vazias nos dados: Cada linha da planilha representa um assunto. O primeiro assunto recebeu o Tratamento 1, e teve resultados 1. X e Y são os valores de duas medidas em cada assunto. Não foi possível obter uma medida para Y no segundo assunto, ou em X para o último assunto, então essas células estão em branco. Os assuntos são inseridos na ordem em que os dados ficaram disponíveis, de modo que os dados não são ordenados de forma particular. Utilizamos esses dados para fazer algumas análises simples e comparamos os resultados com um pacote estatístico padrão. A comparação considerou a precisão dos resultados, bem como a facilidade com que a interface poderia ser usada para conjuntos de dados maiores - ou seja, mais colunas. Utilizamos o SPSS como o padrão, embora qualquer um dos pacotes estatísticos que a OIT apoie faria o mesmo bem para este propósito. Neste artigo, quando dizemos o pacote estatístico de cota, queremos dizer SPSS, SAS, STATA, SYSTAT ou Minitab. A maioria dos procedimentos estatísticos de Excels fazem parte do pacote de ferramentas Análise de dados, que está no menu Ferramentas. Inclui uma variedade de escolhas, incluindo estatísticas descritivas simples, t-testes, correlações, análise de variância ou regressão de 1 ou 2 vias, etc. Se você não possui um item de Análise de Dados no menu Ferramentas, você precisa instalar os Dados Ferramenta de análise de ferramentas. Procure na Ajuda para quotData Analysis Toolsquot para obter instruções sobre como carregar o ToolPak. Dois outros recursos do Excel são úteis para certas análises, mas a ferramenta de análise de dados é a única que fornece testes razoavelmente completos de significância estatística. A tabela dinâmica no menu Dados pode ser usada para gerar tabelas sumárias de meios, desvios padrão, contagens, etc. Além disso, você pode usar funções para gerar algumas medidas estatísticas, como um coeficiente de correlação. As funções geram um único número, então, usando as funções, você provavelmente terá que combinar bits e peças para obter o que deseja. Mesmo assim, talvez você não consiga gerar todas as peças necessárias para uma análise completa. Salvo indicação em contrário, todos os testes estatísticos usando o Excel foram feitos com o Data Analysis ToolPak. Para verificar uma variedade de testes estatísticos, escolhemos as seguintes tarefas: Obter meios e desvios padrão de X e Y para todo o grupo e para cada grupo de tratamento. Obtenha a correlação entre X e Y. Faça uma prova t de duas amostras para testar se os dois grupos de tratamento diferem em X e Y. Faça uma prova t pareada para testar se X e Y são estatisticamente diferentes uns dos outros. Compare o número de indivíduos com cada resultado por grupo de tratamento, usando um teste de qui-quadrado. Todas essas tarefas são rotineiras para um conjunto de dados dessa natureza, e todos eles podem ser feitos facilmente usando qualquer um dos pacotes estatísticos listados aobve. Problemas gerais Ativar o ToolPak de análise O DataPlay Tool não está instalado com a configuração padrão do Excel. Procure no menu Ferramentas. Se você não possui um item de Análise de Dados, você precisará instalar as ferramentas de Análise de Dados. Procure Ajuda para quotData Analysis Toolsquot para obter instruções. Valores faltantes Uma célula em branco é o único caminho para o Excel lidar com dados faltantes. Se você tiver outros códigos de valores em falta, você precisará alterá-los para espaços em branco. Arranjo de dados Diferentes análises exigem que os dados sejam organizados de várias maneiras. Se você planeja uma variedade de testes diferentes, pode não haver um único arranjo que funcione. Você provavelmente precisará reorganizar os dados de várias maneiras de obter tudo o que você precisa. Caixas de diálogo Escolha Ferramentas Análise de dados e selecione o tipo de análise que deseja fazer. A caixa de diálogo típica terá os seguintes itens: Intervalo de entrada: Digite as células do canto superior esquerdo e inferior direito. por exemplo. A1: B100. Você só pode escolher linhas e colunas adjacentes. A menos que haja uma caixa de seleção para agrupar dados por linhas ou colunas (e geralmente não existe), todos os dados são considerados como um glop. Etiquetas - Às vezes, há uma caixa que você pode verificar para indicar que a primeira linha da sua folha contém rótulos. Se você tiver rótulos na primeira linha, marque esta caixa, e sua saída pode ser rotulada com seu rótulo. Então, novamente, não pode. Local de saída - Nova folha é o padrão. Ou, digite o endereço celular do canto superior esquerdo onde você deseja colocar a saída na folha atual. Nova planilha é outra opção, que não tentei. As ramificações desta escolha são discutidas abaixo. Outros itens, dependendo da análise. Local de saída O resultado de cada análise pode ir para uma nova folha no seu arquivo Excel atual (este é o padrão), ou você pode colocá-lo dentro da folha atual, especificando a célula do canto superior esquerdo onde deseja que ele seja colocado. De qualquer forma é um pouco incômodo. Se cada saída estiver em uma nova folha, você termina com muitas folhas, cada uma com um pequeno bit de saída. Se você colocá-los na folha atual, você deve colocá-los adequadamente deixar espaço para adicionar comentários e as alterações de rótulos que você precisa fazer para formatar uma saída corretamente podem afetar um outro resultado negativamente. Exemplo: Output from Descriptives tem uma coluna de rótulos como desvio padrão, erro padrão, etc. Você quer fazer essa coluna ampla para poder ler os rótulos. Mas se uma saída de Frequência simples estiver bem embaixo, a coluna que exibe os valores contados, que podem conter apenas números inteiros pequenos, também será ampla. Resultados das análises estatísticas descritivas A maneira mais rápida de obter médias e desvios padrão para um grupo inteiro está usando Descriptivos nas ferramentas de análise de dados. Você pode escolher várias colunas adjacentes para o intervalo de entrada (neste caso as colunas X e Y), e cada coluna é analisada separadamente. Os rótulos na primeira linha são usados ​​para rotular a saída e as células vazias são ignoradas. Se você tiver mais colunas não adjacentes que você precisa analisar, você terá que repetir o processo para cada grupo de colunas contíguas. O procedimento é direto, pode gerenciar muitas colunas de forma razoavelmente eficiente e as células vazias são tratadas corretamente. Para obter os meios e os desvios-padrão de X e Y para cada grupo de tratamento requer o uso de Tabelas Pivot (a menos que você deseja reorganizar a folha de dados para separar os dois grupos). Depois de selecionar o intervalo de dados (contíguos), na opção Layout Pivot Table Wizards, arraste o Tratamento para a área variável da Linha e X para a área de Dados. Clique duas vezes em ldquoCount do Xrdquo na área de dados e altere-o para Média. Arraste X para dentro da caixa de Dados novamente, e essa vez muda Contagem para StdDev. Finalmente, arraste X em mais uma vez, deixando-o como Conde de X. Isso nos dará a Média, desvio padrão e número de observações em cada grupo de tratamento para X. Faça o mesmo para Y, então obteremos a média, o padrão Desvio e número de observações para Y também. Isso colocará um total de seis itens na caixa de dados (três para X e três para Y). Como você pode ver, se você deseja obter uma variedade de estatísticas descritivas para várias variáveis, o processo ficará tedioso. Um pacote estatístico permite que você escolha tantas variáveis ​​como você deseja para estatísticas descritivas, sejam ou não contíguas. Você pode obter as estatísticas descritivas para todos os assuntos juntos, ou discriminados por uma variável categórica, como o tratamento. Você pode selecionar as estatísticas que deseja ver uma vez, e ela se aplicará a todas as variáveis ​​escolhidas. Correlações Usando as ferramentas de Análise de Dados, o diálogo para correlações é muito parecido com o de descritivos - você pode escolher várias colunas contíguas e obter uma matriz de saída de todos os pares de correlações. As células vazias são ignoradas adequadamente. A saída NÃO inclui o número de pares de pontos de dados utilizados para calcular cada correlação (que pode variar, dependendo de onde você tem dados faltantes) e não indica se nenhuma das correlações é estatisticamente significativa. Se desejar correlações em colunas não contíguas, você deve incluir as colunas intermediárias ou copiar as colunas desejadas para uma localização contígua. Um pacote estatístico permitirá que você escolha colunas não contíguas para suas correlações. A saída indicaria quantos pares de pontos de dados foram usados ​​para calcular cada correlação e quais as correlações são estatisticamente significativas. Teste T de duas amostras Este teste pode ser usado para verificar se os dois grupos de tratamento diferem nos valores de X ou Y. Para fazer o teste, você precisa inserir um intervalo de células para cada grupo. Como os dados não foram inseridos pelo grupo de tratamento, primeiro precisamos classificar as linhas por tratamento. Certifique-se de levar todas as outras colunas juntamente com o tratamento, de modo que os dados para cada assunto permaneçam intactos. Após a classificação dos dados, você pode inserir o intervalo de células contendo as medidas X para cada tratamento. Não inclua a linha com os rótulos, porque o segundo grupo não possui uma linha de rótulos. Portanto, sua saída não será rotulada para indicar que essa saída é para X. Se você quiser que a saída seja marcada, você deve copiar as células correspondentes ao segundo grupo para uma coluna separada e inserir uma linha com uma etiqueta para o segundo grupo . Se você também quer fazer o teste t para as medições Y, você precisará repetir o processo. As células vazias são ignoradas e, além dos problemas com a rotulagem da saída, os resultados estão corretos. Um pacote estatístico faria essa tarefa sem necessidade de classificar os dados ou copiá-lo para outra coluna e a saída sempre seria devidamente rotulada na medida em que você fornece rótulos para suas variáveis ​​e grupos de tratamento. Também permitiria que você escolha mais de uma variável de cada vez para o teste t (por exemplo, X e Y). Teste t pareado O teste t pareado é um método para testar se a diferença entre duas medidas no mesmo assunto é significativamente diferente de 0. Neste exemplo, desejamos testar a diferença entre X e Y medida no mesmo assunto. A característica importante deste teste é que ele compara as medidas dentro de cada assunto. Se você digitalizar as colunas X e Y separadamente, elas não se parecerão obviamente diferentes. Mas se você olhar para cada par X-Y, você notará que, em todos os casos, X é maior do que Y. O teste t pareado deve ser sensível a essa diferença. Nos dois casos em que X ou Y estão faltando, não é possível comparar as duas medidas em um assunto. Portanto, apenas 8 linhas são utilizáveis ​​para o teste t pareado. Quando você executa o teste t pareado nesses dados, você obtém uma estatística t de 0,09, com uma probabilidade de 2 trincas de 0,93. O teste não encontra diferença significativa entre X e Y. Olhando para a saída com mais cuidado, percebemos que ela diz que existem 9 observações. Conforme mencionado acima, deve haver apenas 8. Parece que o Excel não conseguiu excluir as observações que não possuíam as medições X e Y. Para obter os resultados corretos, copie X e Y para duas novas colunas e remova os dados nas células que não possuem valor para a outra medida. Agora, execute novamente o teste t pareado. Desta vez, a estatística t é 6.14817 com uma probabilidade de 2 caudas de 0,000468. A conclusão é completamente diferente. Claro, este é um exemplo extremo. Mas o ponto é que o Excel não calcula o teste t pareado corretamente quando algumas observações possuem uma das medidas, mas não a outra. Embora seja possível obter o resultado correto, você não teria motivos para suspeitar dos resultados obtidos, a menos que esteja suficientemente alerta para observar que o número de observações está errado. Não há nada em ajuda online que o avise sobre esta questão. Curiosamente, há também uma função TTEST, que dá os resultados corretos para este exemplo. Aparentemente, as funções e as ferramentas de Análise de Dados não são consistentes na forma como lidam com células perdidas. No entanto, não posso recomendar o uso de funções de preferência às ferramentas de Análise de Dados, porque o resultado da utilização de uma função é um número único - neste caso, a probabilidade de 2 colunas da estatística t. A função não lhe dá a própria estatística t, os graus de liberdade ou qualquer número de outros itens que você gostaria de ver se você estivesse fazendo um teste estatístico. Um pacote estatístico irá excluir corretamente os casos com uma das medidas em falta e fornecerá todas as estatísticas de suporte que você precisa para interpretar a saída. Crosstabulation e Chi-Squared Test of Independence Nossa tarefa final é contar os dois resultados em cada grupo de tratamento e usar um teste de independência do qui-quadrado para testar uma relação entre o tratamento eo resultado. Para contar os resultados por grupo de tratamento, você precisa usar as Tabelas Pivot. Na opção Pivot Table Wizards Layout, arraste o Tratamento para Row, Outcome to Column e também para Data. A área de dados deve dizer quotCount of Outcomequot ndash se não, clique duas vezes nele e selecione quotCountquot. Se desejar por cento, clique duas vezes em QuotCount of Resultcomequot e clique em Options na caixa ldquoShow Data Asrdquo que aparece, selecione quot de rowquot. Se quiser tanto contagens como por cento, você pode arrastar a mesma variável para a área de Dados duas vezes e usá-la uma vez para contagens e uma vez por porcentagem. Obter o teste do qui-quadrado não é tão simples, no entanto. Só está disponível como função e a entrada necessária para a função é a contagem observada em cada combinação de tratamento e resultado (que você tem em sua tabela dinâmica) e as contagens esperadas em cada combinação. Contagens esperadas O que são? Como você obtê-los Se você tiver um histórico estatístico suficiente para saber como calcular as contagens esperadas e pode fazer cálculos do Excel usando endereços celulares relativos e absolutos, você deve poder navegar por isso. Se não, você está fora de sorte. Supondo que você superou o problema das contagens esperadas, você pode usar a função Chitest para obter a probabilidade de observar um valor qui-quadrado maior do que aquele para esta tabela. Novamente, uma vez que estamos usando funções, você não obtém muitas outras peças necessárias do cálculo, notadamente o valor da estatística do qui-quadrado ou seus graus de liberdade. Nenhum pacote estatístico exigiria que você forneça os valores esperados antes de calcular um teste qui-quadrado de independência. Além disso, os resultados sempre incluirão a estatística do qui-quadrado e seus graus de liberdade, bem como a sua probabilidade. Muitas vezes você também obterá algumas estatísticas adicionais. Análises adicionais As análises restantes não foram feitas neste conjunto de dados, mas alguns comentários sobre eles estão incluídos para completude. Freqüências simples Você pode usar tabelas dinâmicas para obter frequências simples. (Veja Crosstabulations para obter mais informações sobre como obter tabelas dinâmicas.) Usando tabelas dinâmicas, cada coluna é considerada uma variável separada e os rótulos na linha 1 aparecerão na saída. Você só pode fazer uma variável por vez. Outra possibilidade é usar a função Frequências. A principal vantagem deste método é que, uma vez que você definiu a função de frequência para uma coluna, você pode usar o CopyPaste para obtê-lo para outras colunas. Primeiro, você precisará inserir uma coluna com os valores desejados contados (caixas). Se você pretende fazer as frequências para muitas colunas, certifique-se de inserir valores para a coluna com a maioria das categorias. por exemplo. Se 3 colunas tiverem valores de 1 ou 2, e o quarto tenha valores de 1,2,3,4, você precisará inserir os valores da caixa como 1,2,3,4. Agora selecione células vazias suficientes em uma coluna para armazenar os resultados - 4 neste exemplo, mesmo que a coluna atual tenha apenas 2 valores. Em seguida, escolha InsertFunctionStatisticalFrequences no menu. Preencha o intervalo de entrada para a primeira coluna que deseja contar usando endereços relativos (por exemplo A1: A100). Preencha o Bin Range usando os endereços absolutos dos locais onde você inseriu os valores a serem contados (por exemplo, M1: M4). Clique em Concluir. Observe a caixa acima dos cabeçalhos das colunas da folha, onde a fórmula é exibida. Começa com quot FREQUENCIES (coloque o cursor à esquerda do sinal na fórmula e pressione Ctrl-Shift-Enter. As contagens de freqüência agora aparecem nas células selecionadas. Para obter as contagens de freqüência de outras colunas, selecione As células com as frequências nelas e escolha EditCopy no menu. Se a próxima coluna que deseja contar é uma coluna à direita do anterior, selecione a célula à direita da primeira célula de freqüência e escolha EditPaste ( Ctrl-V). Continue movendo-se para a direita e colando para cada coluna que você deseja contar. Cada vez que você move uma coluna à direita das células de freqüência originais, a coluna a contar é deslocada diretamente da primeira coluna que você contou. Se você quer por cento também, yourquoll tem que usar a função Sum para calcular a soma das freqüências e definir a fórmula para obter a porcentagem de uma célula. Selecione a célula para armazenar a primeira porcentagem e digite a fórmula na fórmula Caixa na parte superior da folha - por exemplo, N1100N 5 - onde N1 é a célula com a frequência para a primeira categoria, e N5 é a célula com a soma das frequências. Use CopyPaste para obter a fórmula para as células restantes da primeira coluna. Depois de ter os percentuais para uma coluna, você pode CopyPaste para as outras colunas. Yoursquoll precisa ter cuidado com o uso de endereços relativos e absolutos No exemplo acima, usamos N5 para o denominador, então, quando copiamos a fórmula para a próxima freqüência na mesma coluna, ela ainda procurará a soma na linha 5, mas quando copiamos a fórmula diretamente para outra coluna, ela mudará para as freqüências na próxima coluna. Finalmente, você pode usar histograma no menu Análise de dados. Você só pode fazer uma variável por vez. Tal como acontece com a função Frequências, você deve inserir uma coluna com limites quotbinquot. Para contar o número de ocorrências de 1 e 2, você precisa inserir 0,1,2 em três células adjacentes e fornecer o intervalo dessas três células como as caixas na caixa de diálogo. A saída não está rotulada com os rótulos que você pode ter na linha 1, nem mesmo com a letra da coluna. Se você faz freqüências em muitas variáveis, você terá dificuldade em saber qual a frequência que pertence a qual coluna de dados. Regressão linear Uma vez que a regressão é uma das análises estatísticas mais utilizadas, tentamos fazê-lo, embora não fizemos uma análise de regressão para este exemplo. O procedimento de Regressão nas ferramentas de análise de dados permite escolher uma coluna como variável dependente e um conjunto de colunas contíguas para os independentes. No entanto, não tolera células vazias em qualquer lugar nas faixas de entrada, e você está limitado a 16 variáveis ​​independentes. Portanto, se você tiver células vazias, você precisará copiar todas as colunas envolvidas na regressão para novas colunas e excluir todas as linhas que contenham células vazias. Grandes modelos, com mais de 16 preditores, não podem ser feitos. Análise de Variância Em geral, as características de ANOVA de Excels são limitadas a alguns casos especiais raramente encontrados em livros de texto externos e exigem muitos re-arranjos de dados. ANOVA unidirecional Os dados devem ser organizados em colunas (ou linhas) separadas e adjacentes para cada grupo. Claramente, isso não é propício para fazer 1-way em mais de um agrupamento. Se você tiver rótulos na linha 1, a saída usará os rótulos. ANOVA de dois fatores sem replicação Isso apenas faz o caso com uma observação por célula (ou seja, não dentro do termo de erro de célula). O intervalo de entrada é um arranjo retangular de células, com linhas representando níveis de um fator, colunas os níveis do outro fator e os conteúdos celulares do valor dessa célula. ANOVA de dois fatos com réplicas Isso faz uma ANOVA de dois sentidos com tamanhos de células iguais. A entrada deve ser uma região retangular com colunas que representam os níveis de um fator e as linhas que representam repetições dentro dos níveis do outro fator. O intervalo de entrada DEVE também incluir uma linha adicional na parte superior e coluna à esquerda, com rótulos indicando os fatores. No entanto, esses rótulos não são usados ​​para rotular a tabela ANOVA resultante. Clique em Ajuda na caixa de diálogo ANOVA para uma imagem de como deve ser o intervalo de entrada. Solicitando muitas análises Se você tivesse uma variedade de procedimentos estatísticos diferentes que você queria executar em seus dados, você quase certamente se encontrará fazendo muita classificação, rearranjando, copiando e colando seus dados. Isso ocorre porque cada procedimento requer que os dados sejam organizados de uma maneira particular, muitas vezes diferente do modo como outro procedimento deseja que os dados sejam organizados. Em nosso pequeno teste, tivemos que classificar as linhas para fazer o teste t e copiar algumas células para obter rótulos para a saída. Tínhamos que limpar o conteúdo de algumas células para obter o teste t pareado correto, mas não queria que essas células fossem limpas para algum outro teste. E nós só fazíamos cinco tarefas. Não é melhor quando você tenta fazer mais. Não há um único arranjo dos dados que permitiria que você fizesse muitas análises diferentes sem fazer muitas cópias diferentes dos dados. A necessidade de manipular os dados de muitas maneiras aumenta consideravelmente a chance de apresentar erros. Usando um programa estatístico, os dados normalmente seriam organizados com as linhas que representam os assuntos e as colunas que representam as variáveis ​​(como estão em nossos dados de amostra). Com este arranjo, você pode fazer qualquer uma das análises discutidas aqui, e muitos outros também, sem ter que classificar ou reorganizar seus dados de forma alguma. Apenas análises muito mais complexas, além das capacidades do Excel e o escopo deste artigo exigiriam o rearranjo de dados. Trabalhando com muitas colunas. Se seus dados não tiveram 4, mas 40 colunas, com uma combinação de medidas categóricas e contínuas. Com que facilidade, os procedimentos acima se escalam para um problema maior. Na melhor das hipóteses, alguns procedimentos estatísticos podem aceitar várias colunas contíguas para entrada , E interpretar cada coluna como uma medida diferente. Os procedimentos descritivos e de correlações são deste tipo, portanto, você pode solicitar estatísticas descritivas ou correlações para um grande número de variáveis ​​contínuas, desde que sejam inseridas em colunas adjacentes. Se eles não são adjacentes, você precisa reorganizar colunas ou usar copiar e colar para torná-las adjacentes. Muitos procedimentos, no entanto, só podem ser aplicados em uma coluna por vez. T-testes (independentes ou emparelhados), contagem de freqüência simples, teste de qui-quadrado de independência e muitos outros procedimentos estão nesta classe. Isso se tornaria uma séria desvantagem se você tivesse mais de um punhado de colunas, mesmo se você usar cortar e colar ou macros para reduzir o trabalho. Além de ter que repetir o pedido muitas vezes, você deve decidir onde armazenar os resultados de cada um e verifique se ele está devidamente rotulado para que você possa facilmente localizar e identificar cada saída. Finalmente, o Excel não lhe dá um registro ou outro registro para rastrear o que você fez. Isso pode ser um inconveniente grave se você quiser repetir a mesma análise (ou similar) no futuro, ou mesmo se você simplesmente esqueceu o que já fez. Usando um pacote estatístico, você pode solicitar um teste para tantas variáveis ​​como você precisa ao mesmo tempo. Cada um será devidamente rotulado e organizado na saída, então não há confusão quanto ao que é o que. Você também pode esperar para obter um registro e, muitas vezes, um conjunto de comandos, que pode ser usado para documentar seu trabalho ou para repetir uma análise sem ter que passar por todos os passos novamente. Embora o Excel seja uma planilha fina, não é um pacote de análise de dados estatísticos. De forma justa, nunca foi concebido para ser um. Tenha em mente que o Data Analysis ToolPak é um quotadd-inquot - um recurso extra que permite que você faça alguns cálculos rápidos. Portanto, não deve surpreender que seja exatamente o que é bom - alguns cálculos rápidos. Se você tentar usá-lo para análises mais extensas, você encontrará dificuldades devido a qualquer ou a todas as seguintes limitações: Problemas potenciais com análises envolvendo dados faltantes. Estes podem ser insidiosos, na medida em que o usuário incausto não consegue perceber que qualquer coisa está errada. Falta de flexibilidade nas análises que podem ser feitas devido às suas expectativas em relação ao arranjo dos dados. Isso resulta na necessidade de cortar e corrigir de outra forma a folha de dados de várias maneiras, aumentando a probabilidade de erros. Saída espalhada em muitas planilhas diferentes, ou em toda uma planilha, que você deve assumir a responsabilidade de organizar de forma sensata. A saída pode estar incompleta ou pode não ser devidamente rotulada, aumentando a possibilidade de identificar erroneamente a saída. Precisa repetir as solicitações de algumas análises várias vezes para executá-la para várias variáveis ​​ou para solicitar múltiplas opções. Precisa fazer algumas coisas definindo suas próprias funções, com o seu risco de erros. Não há registro do que você fez para gerar seus resultados, tornando difícil documentar sua análise ou repetindo-a mais tarde, caso isso seja necessário. Se você tem mais de 10 ou 12 colunas, ou deseja fazer qualquer coisa além das estatísticas descritivas e talvez correlações, você deve usar um pacote estatístico. Existem várias opções disponíveis pela licença do site através da OIT, ou você pode usá-las em qualquer laboratório PC da OIT. Se você possui o Excel no seu PC e não quer pagar por um programa estatístico, use o Excel para inserir os dados (com linhas que representam os assuntos e colunas para as variáveis). Todos os pacotes estatísticos mencionados podem ler arquivos do Excel, para que você possa fazer a entrada de dados (demorado) em casa e ir aos laboratórios para fazer a análise. Uma discussão muito mais extensa das armadilhas do uso do Excel, com muitos links adicionais, está disponível em burns-stat Clique em Tutoriais e, em seguida, em Vício de planilha. Para obter assistência ou mais informações sobre software estatístico, entre em contato com o Centro de Consultoria em Bioestatística. Telefone 545-2949

No comments:

Post a Comment