Tuesday 17 October 2017

Moving Media Dati Analisi Excel


Media mobile Questo esempio vi insegna come calcolare la media mobile di una serie storica in Excel. Una media mobile viene utilizzata per appianare le irregolarità (picchi e valli) di riconoscere facilmente le tendenze. 1. In primo luogo, consente di dare un'occhiata alla nostra serie temporali. 2. Nella scheda dati fare clic su Analisi dati. Nota: non riesci a trovare il pulsante Data Analysis Clicca qui per caricare il componente aggiuntivo Strumenti di analisi. 3. Selezionare media mobile e fare clic su OK. 4. Fare clic nella casella intervallo di input e selezionare l'intervallo B2: M2. 5. Fare clic nella casella Intervallo e digitare 6. 6. Fare clic nella casella Intervallo di output e selezionare cella B3. 8. Tracciare la curva di questi valori. Spiegazione: perché abbiamo impostato l'intervallo di 6, la media mobile è la media degli ultimi 5 punti di dati e il punto di dati corrente. Come risultato, i picchi e le valli si distendono. Il grafico mostra una tendenza all'aumento. Excel non può calcolare la media mobile per i primi 5 punti di dati, perché non ci sono abbastanza punti dati precedenti. 9. Ripetere i passaggi 2-8 per l'intervallo 2 e l'intervallo 4. Conclusione: Il più grande l'intervallo, più i picchi e le valli si distendono. Minore è l'intervallo, più le medie mobili sono i dati effettivi points. Eva Goldwater Biostatistica Consulting Center dell'Università del Massachusetts School of Public Health aggiornato febbraio 2007 A colpo d'occhio Abbiamo utilizzato Excel per fare alcuni compiti di analisi dei dati fondamentali per vedere se si tratta di una ragionevole alternativa all'utilizzo di un pacchetto statistico per gli stessi compiti. Abbiamo concluso che Excel è una buona scelta per l'analisi statistica di là di esempi di libri di testo, il più semplice statistiche descrittive, o per più di poche colonne. I problemi che abbiamo incontrato che hanno portato a questa conclusione sono in quattro aree generali: I valori mancanti vengono gestiti in modo incoerente, e talvolta in modo non corretto. organizzazione dei dati differisce a seconda analisi, costringendo di riorganizzare i dati in molti modi, se si vuole fare molte analisi differenti. Molte analisi possono essere effettuate soltanto su una colonna alla volta, il che rende scomodo per fare la stessa analisi su molte colonne. L'uscita è mal organizzato, a volte etichettati in modo inadeguato, e non vi è alcuna traccia di come l'analisi è stata compiuta. Excel è conveniente per l'immissione di dati, e per manipolare rapidamente righe e colonne prima dell'analisi statistica. Tuttavia quando si è pronti a fare l'analisi statistica, si consiglia l'uso di un pacchetto statistico come SAS, SPSS, Stata, Systat o Minitab. Introduzione Excel è probabilmente il foglio di calcolo più comunemente usato per i PC. i computer appena acquistato spesso arrivano con Excel già caricato. E 'facilmente usato per fare una serie di calcoli, comprende un insieme di funzioni statistiche, e di analisi dei dati. Di conseguenza, se improvvisamente scopre che è necessario fare qualche analisi statistiche, si può girare ad esso come la scelta più ovvia. Abbiamo deciso di fare qualche prova per vedere come Excel servirebbe come applicazione di analisi dei dati. Per presentare i risultati, useremo un piccolo esempio. I dati per questo esempio è fittizio. Si è scelto di avere due categorica e due variabili continue, così potuto testare una varietà di tecniche statistiche di base. Dal momento che quasi tutti i veri insiemi di dati hanno almeno un paio di punti dati mancanti, e dal momento che la capacità di trattare con i dati mancanti è correttamente una delle caratteristiche che noi diamo per scontato in un pacchetto di analisi statistiche, abbiamo introdotto due celle vuote nei dati: ogni riga del foglio di calcolo rappresenta un soggetto. Il primo soggetto ha ricevuto un trattamento 1, e ha avuto esito 1. X e Y sono i valori di due misurazioni su ciascun soggetto. Non siamo riusciti a ottenere una misura per Y sul secondo soggetto, o su X per l'ultimo soggetto, quindi queste cellule sono vuote. I soggetti sono inseriti nell'ordine in cui i dati si sono resi disponibili, in modo che i dati non è ordinato in alcun modo particolare. Abbiamo utilizzato questi dati per fare alcune analisi semplici e confrontato i risultati con un pacchetto statistico standard. Il confronto considerato l'accuratezza dei risultati e la facilità con cui l'interfaccia potrebbe essere utilizzata per grandi insiemi di dati - cioè più colonne. Abbiamo usato SPSS come standard, anche se nessuno dei pacchetti supporti OIT statistici farebbe altrettanto bene per questo scopo. In questo articolo quando diciamo pacchetto statistico delle quote, quot intendiamo SPSS, SAS, STATA, SYSTAT o Minitab. La maggior parte delle procedure statistiche eccelle fanno parte dello strumento pacchetto di analisi dei dati, che si trova nel menu Strumenti. Esso comprende una varietà di scelte tra cui semplici statistiche descrittive, t-test, le correlazioni, 1 o 2 l'analisi della varianza, la regressione, ecc Se non si dispone di una voce di Analisi dati dal menu Strumenti, è necessario installare i dati Strumenti di analisi. Cerca nella Guida per quotData analisi Toolsquot per istruzioni sul caricamento del ToolPak. Altre due caratteristiche di Excel sono utili per certe analisi, ma lo strumento pacchetto di analisi dei dati è l'unico che fornisce le prove ragionevolmente completo di significatività statistica. Tabella pivot nel menu dei dati può essere utilizzato per generare tabelle riassuntive degli medie, deviazioni standard, i conteggi, ecc Inoltre, è possibile utilizzare le funzioni per generare alcune misure statistiche, come ad esempio un coefficiente di correlazione. Funzioni generano un singolo numero, in modo da utilizzare le funzioni si dovrà probabilmente per combinare i pezzi per ottenere quello che vuoi. Anche così, non si può essere in grado di generare tutte le parti necessarie per un'analisi completa. Se non diversamente indicato, tutti i test statistici utilizzando Excel sono stati fatti con dei dati di analisi. Al fine di verificare una serie di test statistici, abbiamo scelto le seguenti operazioni: Come medie e deviazioni standard di X e Y per l'intero gruppo, e per ogni gruppo di trattamento. Ottenere la correlazione tra X e Y. Fare due campioni t-test per verificare se i due gruppi di trattamento differiscono su X e Y. fare un t-test accoppiato per verificare se X e Y sono statisticamente diversi tra loro. Confrontare il numero di soggetti con ogni risultato per gruppo di trattamento, utilizzando un test chi-quadro. Tutti questi compiti sono di routine per un set di dati di questa natura, e tutti potrebbero essere facilmente effettuata utilizzando uno qualsiasi dei aobve elencato pacchetti statistici. Problemi generali Attiva gli strumenti di analisi I dati di analisi non è installato con la configurazione standard di Excel. Guardate nel menu Strumenti. Se non si dispone di un elemento di analisi dei dati, è necessario installare gli strumenti di analisi dei dati. Ricerca Aiuto per quotData analisi Toolsquot per le istruzioni. Valori mancanti una cella vuota è l'unico modo per Excel a che fare con dati mancanti. Se avete altri codici valore mancante, è necessario cambiarli a spazi vuoti. Composizione dati differenti analisi richiedono i dati organizzati in vari modi. Se hai intenzione di una serie di test differenti, non ci può essere un unico accordo che funzionerà. Probabilmente avrete bisogno di riorganizzare i dati in diversi modi per ottenere tutto ciò che serve. Finestre di dialogo Scegliere Analisi ToolsData, e selezionare il tipo di analisi che si vuole fare. La finestra di dialogo tipico avrà le seguenti voci: Gamma di ingresso: immettere in alto a sinistra e inferiore cellule destra. per esempio. A1: B100. È possibile scegliere solo le righe e le colonne adiacenti. A meno che non vi è una casella di controllo per raggruppare i dati per righe o colonne (e di solito non lo è), tutti i dati è considerato come uno Glop. Etichette - C'è a volte un dialogo è possibile spuntare per indicare che la prima riga del foglio contiene etichette. Se si dispone di etichette nella prima riga, selezionare questa casella, e l'output possono essere etichettati con la vostra etichetta. Poi di nuovo, non può. posizione di uscita - Nuovo foglio è l'impostazione predefinita. Oppure, digitare l'indirizzo della cella dell'angolo superiore sinistro in cui si desidera inserire l'output nel foglio corrente. Nuovo foglio di lavoro è un'altra opzione, che non ho provato. Conseguenze di questa scelta sono discussi di seguito. Altri oggetti, funzione dell'analisi. posizione Output L'output di ogni analisi può andare a un nuovo foglio all'interno del file di Excel corrente (questo è il default), oppure è possibile posizionarlo all'interno del foglio corrente specificando la cella in alto a sinistra dove si desidera posto. In entrambi i casi è un po 'una seccatura. Se ogni uscita è in un nuovo foglio, si finisce con un sacco di fogli, ognuna con un piccolo pezzo di uscita. Se si inseriscono nel foglio corrente, è necessario inserire in modo appropriato lasciare spazio per l'aggiunta di commenti ed etichette modifiche è necessario apportare per formattare una uscita potrebbe ripercuotersi negativamente un'altra uscita negativamente. Esempio: Uscita da Descrittive ha una colonna di etichette come deviazione standard, errore standard, ecc Si vuole fare questa colonna ampia al fine di essere in grado di leggere le etichette. Ma se una semplice uscita in frequenza è proprio sotto, poi la colonna visualizzazione dei valori viene contato, che può solo contengono interi piccoli, sarà anche ampio. I risultati di analisi Statistiche descrittive Il modo più rapido per ottenere medie e deviazioni standard per un intero gruppo sta usando Descrittive negli strumenti di analisi dei dati. È possibile scegliere diverse colonne adiacenti per la gamma di ingresso (in questo caso la X e Y colonne), e ogni colonna viene analizzato separatamente. Le etichette nella prima riga sono utilizzati per etichettare l'uscita, e le celle vuote vengono ignorati. Se si dispone di più colonne, non adiacenti è necessario analizzare, si dovrà ripetere il processo per ogni gruppo di colonne contigue. La procedura è semplice, in grado di gestire molte colonne ragionevolmente efficiente, e le celle vuote sono trattati correttamente. Per ottenere i mezzi e le deviazioni standard di X e Y per ciascun gruppo di trattamento richiede l'utilizzo di tabelle pivot (a meno che non si vuole riorganizzare la scheda tecnica per separare i due gruppi). Dopo aver selezionato la (contigua) intervallo di dati, l'opzione di layout Wizards tabelle pivot, trascinare il trattamento per l'area variabile di riga, e X per la zona di dati. Fare doppio clic su ldquoCount del Xrdquo nell'area Dati, e modificarlo in media. Trascinare X nella casella di dati di nuovo, e questa volta il cambiamento conte di StdDev. Infine, trascinare X in una volta di più, lasciando come Conte di X. Questo ci darà la media, la deviazione standard e il numero di osservazioni in ciascun gruppo di trattamento per X. Fare lo stesso per Y, quindi dovremo ottenere la media, di serie la deviazione e il numero di osservazioni per Y anche. Questo metterà un totale di sei elementi nella casella di dati (tre per X e tre per Y). Come si può vedere, se si vuole ottenere una serie di statistiche descrittive per diverse variabili, il processo otterrà noioso. Un pacchetto di statistica permette di scegliere quante variabili si desidera per statistiche descrittive, anche se non sono contigue. È possibile ottenere le statistiche descrittive per tutti i soggetti insieme, o ripartito per una variabile categoriale come il trattamento. È possibile selezionare le statistiche che si desidera vedere una volta, e si applicherà a tutte le variabili selezionate. Le correlazioni Utilizzando gli strumenti di analisi dei dati, la finestra di dialogo per le correlazioni è molto simile a quella per Descrittive - è possibile scegliere diverse colonne contigue, e ottenere una matrice di uscita di tutte le coppie di correlazioni. Le celle vuote vengono ignorate in modo appropriato. L'uscita non include il numero di coppie di punti di dati utilizzati per calcolare ogni correlazione (che può variare, a seconda di dove si dispone di dati mancanti), e non indica se una qualsiasi delle correlazioni sono statisticamente significative. Se si desidera che le correlazioni su colonne non contigue, si dovrebbe attuare una politica includere le colonne che intervengono, o copiare le colonne desiderate in una posizione contigua. Un pacchetto di statistica avrebbe permesso di scegliere le colonne non contigue per le correlazioni. L'uscita sarebbe dirà quante coppie di punti dati sono stati utilizzati per calcolare ogni correlazione e che le correlazioni sono statisticamente significative. T-test Two-Sample Questo test può essere utilizzato per verificare se i due gruppi di trattamento si differenziano dai valori di X o Y. Per fare il test è necessario immettere un intervallo di celle per ogni gruppo. Dal momento che i dati non sono stati inseriti per gruppo di trattamento, abbiamo prima bisogno di ordinare le righe dal trattamento. Essere sicuri di prendere tutte le altre colonne con il trattamento, in modo che i dati per ogni soggetto rimane intatto. Dopo che i dati sono ordinati, è possibile inserire l'intervallo di celle che contengono le misure X per ogni trattamento. Non includere la riga con le etichette, perché il secondo gruppo non ha una riga etichetta. Pertanto l'output non sarà etichettato per indicare che questa uscita è per X. Se si desidera che l'uscita etichetta, è necessario copiare le celle corrispondenti al secondo gruppo di una colonna separata, e inserire una riga con un'etichetta per il secondo gruppo . Se anche voi volete fare la t-test per la misura Y, youll necessità di ripetere il processo. Le celle vuote vengono ignorate, e diversi dai problemi etichettare l'output, i risultati sono corretti. Un pacchetto statistico farebbe questo compito senza alcun bisogno di ordinare i dati o copiarlo un'altra colonna, e l'uscita dovrebbe essere sempre adeguatamente etichettati nella misura in cui si forniscono le etichette per le variabili e gruppi di trattamento. Sarebbe inoltre consentire di scegliere più di una variabile alla volta per il t-test (ad esempio, X e Y). Paired t-test Il t-test accoppiato è un metodo per testare se la differenza tra le due misurazioni sullo stesso soggetto è significativamente diverso da 0. In questo esempio, si vuole verificare la differenza tra X e Y misurata sullo stesso argomento. La caratteristica importante di questo test è che confronta le misurazioni all'interno di ciascun soggetto. Se si esegue la scansione delle colonne X e Y separatamente, non sembrano ovviamente diversa. Ma se si guarda a ogni coppia X-Y, si noterà che in ogni caso, X è maggiore di Y. Il paired t-test dovrebbe essere sensibile a questa differenza. Nei due casi in cui X o Y è mancante, non è possibile comparare le due misure su un soggetto. Quindi, solo 8 righe sono utilizzabili per il t-test per dati appaiati. Quando si esegue il t-test accoppiato a questi dati, si ottiene una t-statistica di 0,09, con una probabilità 2-coda di 0,93. Il test non trova alcuna differenza significativa tra X e Y. Guardando l'output più attentamente, ci accorgiamo che dice che ci sono 9 osservazioni. Come notato sopra, ci dovrebbe essere solo 8. Risulta che Excel non ha escluso le osservazioni che non avevano X e Y misurazioni. Per ottenere i risultati corretti copia di X e Y a due nuove colonne e rimuovere i dati nelle celle che non hanno alcun valore per l'altra misura. Ora eseguire nuovamente il t-test accoppiato. Questa volta la statistica t è 6,14,817 mila con una probabilità 2-coda di 0,000,468 mila. La conclusione è completamente diversa Naturalmente, questo è un esempio estremo. Ma il punto è che Excel non calcolare il t-test accoppiato correttamente quando alcune osservazioni hanno una delle misurazioni ma non l'altro. Anche se è possibile ottenere il risultato corretto, non avreste alcun motivo di sospettare i risultati che si ottengono se non si è sufficientemente attento a notare che il numero di osservazioni è sbagliato. Non c'è nulla in guida in linea che in guardia su questo problema. È interessante notare, vi è anche una funzione TTEST, che dà i risultati corretti per questo esempio. A quanto pare le funzioni e gli strumenti di analisi dei dati non sono coerenti nel modo in cui affrontare le cellule mancanti. Tuttavia, non posso consigliare l'uso delle funzioni di preferenza agli strumenti di analisi dei dati, in quanto il risultato dell'utilizzo di una funzione è un singolo numero - in questo caso, la probabilità 2-coda della statistica t. La funzione non ti dà la statistica t per sé, i gradi di libertà, o un qualsiasi numero di altri elementi che si vorrebbe vedere se stavi facendo un test statistico. A pacchetti statistici saranno correttamente escludere casi con una delle misurazioni mancanti, e forniranno tutte le statistiche di supporto necessarie per interpretare l'output. Tavola di contingenza e Chi-Squared test di indipendenza Il nostro compito finale è quello di contare i due risultati in ciascun gruppo di trattamento, e utilizzare un test chi-quadrato di indipendenza di prova per un rapporto tra il trattamento e il risultato. Al fine di contare i risultati di gruppo di trattamento, è necessario utilizzare tabelle pivot. Nell'opzione layout Wizards tabelle pivot, trascinare il trattamento a remare, esito Colonna e anche ai dati. L'area di dati dovrebbe dire quotCount di Outcomequot ndash in caso contrario, fare doppio clic su di esso e selezionare quotCountquot. Se si desidera percentuali, fare doppio clic su quotCount di Outcomequot, e fare clic su Opzioni nella casella ldquoShow dati Asrdquo che appare, selezionare quot di rowquot. Se si desidera che entrambi i fronti e percentuali, è possibile trascinare la stessa variabile nella zona di dati due volte, e usarlo una volta per i conteggi e una volta per percentuali. Ottenere il test del chi-quadrato non è così semplice, però. E 'disponibile solo in funzione, e l'input necessario per la funzione è i conteggi osservati in ogni combinazione di trattamento e dei risultati (che avete nella vostra tabella pivot), e la conta previsti per ciascuna combinazione. conteggi attesi cosa sono Come si fa a farli Se hai sfondo statistico sufficiente per sapere come calcolare i conteggi attesi, e in grado di fare calcoli di Excel utilizzando gli indirizzi di cella relativi e assoluti, si dovrebbe essere in grado di navigare attraverso questo. Se no, sei fuori di fortuna. Supponendo che si sormontata il problema dei conteggi attesi, è possibile utilizzare la funzione di TEST. CHI per ottenere la probabilità di osservare un valore di chi-quadrato più grande di quello per questa tabella. Anche in questo caso, dal momento che stiamo usando le funzioni, non si ottiene molti altri pezzi necessari al calcolo, in particolare il valore della statistica chi-quadrato o dei suoi gradi di libertà. Nessun pacchetto statistico richiederebbe di fornire i valori attesi prima di calcolare un test chi-quadrato di indepencence. Inoltre, i risultati sarebbero sempre includere la statistica chi-quadrato e le sue gradi di libertà, così come la sua probabilità. Spesso si otterrà alcune statistiche supplementari pure. Ulteriori analisi Le analisi rimanenti non sono stati fatti su questo insieme di dati, ma alcuni commenti su di loro sono inclusi per completezza. Semplici frequenze È possibile utilizzare tabelle pivot per ottenere frequenze semplici. (Vedi tavole di contingenza per di più su come ottenere tabelle pivot.) Utilizzando tabelle pivot, ogni colonna è considerato una variabile indipendente, e le etichette in riga 1 apparirà sull'uscita. Si può fare solo una variabile alla volta. Un'altra possibilità è quella di utilizzare la funzione di frequenze. Il principale vantaggio di questo metodo è che una volta che avete definito la funzione di frequenze per una colonna, è possibile utilizzare CopyPaste di farlo per altre colonne. In primo luogo, è necessario inserire una colonna con i valori desiderati contate (bin). Se avete intenzione di fare le frequenze per molte colonne, assicurarsi di immettere i valori per la colonna con il maggior numero di categorie. per esempio. se 3 colonne avere valori di 1 o 2, e la quarta ha valori di 1,2,3,4, è necessario inserire i valori bin come 1,2,3,4. Ora selezionate abbastanza cellule vuote in una colonna per memorizzare i risultati - 4 in questo esempio, anche se la colonna corrente ha solo 2 valori. Avanti scegliere InsertFunctionStatisticalFrequencies sul menu. Compilare il campo di ingresso per la prima colonna si desidera contare utilizzando indirizzi relativi (ad esempio, A1: A100). Compilare il Gamma Bin utilizzando gli indirizzi assoluti dei luoghi in cui hai inserito i valori da contare (ad esempio M1: M4). Fare clic su Fine. Si noti la casella sopra le intestazioni delle colonne del foglio, in cui viene visualizzata la formula. Si inizia con le frequenze quot (quot. Posizionare il cursore a sinistra del segno nella formula, e premere Ctrl-Shift-Invio. I conteggi di frequenza appaiono ora nelle celle selezionate. Per ottenere i conteggi di frequenza delle altre colonne, selezionare le cellule con le frequenze in loro, e scegliere EditCopy nel menu. Se la colonna successiva si desidera contare è una colonna a destra di quello precedente, selezionare la cella a destra della prima cella di frequenza, e scegliete EditPaste ( Ctrl-V). Continuare a spostare verso destra e incolla per ogni colonna che si desidera contare. ogni volta che si sposta una colonna a destra delle celle frequenza originale, la colonna da contare è spostato a destra della prima colonna si contano. Se si desidera percentuali pure, yoursquoll necessario utilizzare la funzione somma per calcolare la somma delle frequenze, e definire la formula per ottenere il cento per una cella. Selezionare la cella per memorizzare il primo cento, e digitare la formula nella formula casella nella parte superiore del foglio - es N1100N5 - dove N1 è la cella con la frequenza per la prima categoria, e N5 è la cella con la somma delle frequenze. Utilizzare CopyPaste per ottenere la formula per le rimanenti celle della prima colonna. Una volta che si hanno le percentuali di una colonna, è possibile CopyPaste alle altre colonne. Yoursquoll bisogno di essere attenti circa l'uso di indirizzi relativi e assoluti Nell'esempio precedente, abbiamo usato N5 per il denominatore, in modo che quando copiamo la formula fino alla frequenza successiva sulla stessa colonna, sarà ancora guardare per la somma in fila 5 ma quando copiamo il diritto formula ad un'altra colonna, si sposterà alle frequenze nella colonna successiva. Infine, è possibile utilizzare Istogramma nel menu Data Analysis. Si può fare solo una variabile alla volta. Come per la funzione di frequenze, è necessario inserire una colonna con i confini quotbinquot. Per contare il numero di occorrenze di 1 e 2, è necessario immettere 0,1,2 in tre celle adiacenti, e dare la gamma di questi tre celle, come i bidoni della finestra di dialogo. L'uscita non è etichettato con tutte le etichette si possono avere nella riga 1, e nemmeno con la lettera della colonna. Se fate frequenze su un sacco di variabili, si avrà difficoltà a sapere quale frequenza appartiene a quale colonna di dati. Regressione lineare Dato che la regressione è una delle analisi statistiche utilizzate più di frequente, abbiamo deciso di provarlo, anche se non abbiamo fatto un'analisi di regressione per questo esempio. La procedura di regressione negli strumenti di analisi dei dati permette di scegliere una colonna come variabile dipendente, e una serie di colonne contigue per gli indipendenti. Tuttavia, non tollera tutte le celle vuote ovunque nelle gamme di ingresso, e si sono limitati a 16 variabili indipendenti. Pertanto, se si dispone di tutte le celle vuote, è necessario copiare tutte le colonne coinvolte nella regressione di nuove colonne, ed eliminare le righe che contengono celle vuote. Grandi modelli, con più di 16 predittori, non possono essere fatte affatto. Analisi della Varianza In generale, le caratteristiche Eccelle ANOVA sono limitati a pochi casi particolari che raramente si trova al di fuori libri di testo, e richiedono un sacco di dati ri-arrangiamenti. One-way ANOVA dati devono essere disposti in colonne separate e adiacenti (o righe) per ogni gruppo. Chiaramente, questo non è favorevole a fare 1 vie su più di un raggruppamento. Se si dispone di etichette in riga 1, l'uscita sarà utilizzare le etichette. Due fattori ANOVA Senza replica Questo fa solo il caso con un'osservazione per cella (cioè senza Entro termine di errore cellulare). L'intervallo di input è una disposizione rettangolare di celle, con le righe che rappresentano i livelli di un fattore, colonne i livelli degli altri fattori, e il contenuto della cella quello valore in quella cella. Due fattori ANOVA con replica questo fa un ANOVA a due vie con dimensioni uguali cellulari. Ingresso deve essere una regione rettangolare con colonne che rappresentano i livelli di un fattore, e righe rappresentano repliche entro livelli dell'altro fattore. La gamma di ingresso deve anche includere una riga aggiuntiva in alto, e la colonna a sinistra, con etichette che indicano i fattori. Tuttavia, queste etichette non sono usati per etichettare la tabella ANOVA risultante. Fare clic su Guida nella finestra di dialogo ANOVA per un quadro di ciò che il campo di ingresso deve essere simile. Richiesta Molte analisi Se si ha una varietà di differenti procedure statistiche che si voleva eseguire sui dati, si sarebbe quasi certamente trovare se stessi facendo un sacco di smistamento, riordinare, copia e incolla dei dati. Questo perché ogni procedura richiede che i dati siano disposti in modo particolare, spesso diversa da come un'altra procedura vuole i dati organizzati. Nel nostro piccolo test, abbiamo dovuto ordinare le righe per fare il t-test, e copiare alcune cellule al fine di ottenere le etichette per l'uscita. Abbiamo dovuto cancellare il contenuto di alcune cellule al fine di ottenere il t-test corretto associato, ma non volevamo queste cellule eliminato per qualche altro test. E siamo rimasti solo facendo cinque attività. Non c'è niente di meglio quando si tenta di fare di più. Non esiste un unico arrangiamento dei dati che ti permettono di fare molte analisi differenti senza fare molte copie diverse di dati. La necessità di manipolare i dati in molti modi aumenta notevolmente la possibilità di introdurre errori. Utilizzando un programma statistico, i dati normalmente essere organizzati con le righe che rappresentano i soggetti, e le colonne rappresentano le variabili (come sono in nostri dati del campione). Con questa disposizione è possibile eseguire una delle analisi qui discussi, e molti altri, nonché, senza dover ordinare o riorganizzare i dati in qualsiasi modo. Solo molto analisi più complesse, al di là delle capacità di Excel e la portata di questo articolo richiederebbe riassetto dei dati. Lavorare con molte colonne Che cosa succede se i dati non erano 4, ma 40 colonne, con un mix di misure categoriche e continue Come facilmente fare le procedure di cui sopra scalabili in un problema più ampio Nella migliore delle ipotesi, alcune delle procedure statistiche possono accettare più colonne contigue per l'ingresso e interpretare ogni colonna come una misura diversa. Le descrittive e le procedure correlazioni sono di questo tipo, in modo da poter richiedere statistiche descrittive o correlazioni per un gran numero di variabili continue, fintanto che sono inseriti nelle colonne adiacenti. Se non sono adiacenti, è necessario riorganizzare le colonne o utilizzare copia e incolla per farli adiacente. Molte procedure, tuttavia, possono essere applicati solo a una colonna alla volta. T-test (sia indipendenti o appaiati), conteggi di frequenza semplici, il test chi-quadrato di indipendenza, e molte altre procedure sono in questa classe. Questo sarebbe diventato un inconveniente grave se si ha più di una manciata di colonne, anche se si utilizza tagliare e incollare o macro per ridurre il lavoro. Oltre a dover ripetere la richiesta più volte, si deve decidere dove memorizzare i risultati di ogni, e assicurarsi che sia adeguatamente etichettati in modo da poter facilmente individuare e identificare ogni uscita. Infine, Excel non ti dà un registro o di altre registrazioni per monitorare quello che hai fatto. Questo può essere un inconveniente grave se si vuole essere in grado di ripetere lo stesso (o simile) analisi in futuro, o anche se youve semplicemente dimenticato che youve già fatto. Usando un pacchetto statistico, è possibile richiedere un test per il maggior numero di variabili di cui hai bisogno in una sola volta. Ognuno sarà correttamente etichettati e disposti in uscita, quindi non c'è confusione su che cosa è che cosa. Si può anche aspettare di ottenere un registro, e spesso una serie di comandi pure, che può essere usato per documentare il vostro lavoro o per ripetere l'analisi senza dover passare attraverso tutti i passaggi di nuovo. Anche se Excel è un bel foglio di calcolo, non è un pacchetto di analisi statistica dei dati. In tutta onestà, non è mai stato destinato ad essere uno. Tenete a mente che i Dati di analisi è un quotadd-inquot - una caratteristica in più che consente di fare un paio di rapidi calcoli. Quindi non dovrebbe sorprendere che questo è proprio quello che è buono per - un paio di rapidi calcoli. Se si tenta di utilizzare per analisi più approfondite, si incontrano difficoltà a causa di una o tutte le seguenti limitazioni: Potenziali problemi con le analisi che coinvolgono i dati mancanti. Questi possono essere insidioso, in quanto l'utente incauti difficilmente conto che qualcosa è sbagliato. La mancanza di flessibilità nelle analisi che può essere fatto per le sue aspettative per quanto riguarda la disposizione dei dati. Ciò comporta la necessità di cutpastesort e altrimenti riorganizzare il foglio di dati in vari modi, aumentando la probabilità di errori. Uscita sparsi in molti fogli di lavoro diversi, o in tutto un foglio di lavoro, che si deve prendere la responsabilità di organizzare in modo sensato. Uscita possono essere incomplete o non può essere adeguatamente etichettati, aumentando la possibilità di misidentifying di uscita. Necessario ripetere le richieste per l'analisi di alcuni più volte al fine di eseguire per variabili multiple, o per richiedere più opzioni. Necessità di fare alcune cose definendo il proprio functionsformulae, con la sua conseguente rischio di errori. Nessun record di quello che hai fatto per generare i risultati, il che rende difficile per documentare l'analisi, o per ripeterla in un secondo momento, se mai fosse necessario. Se si dispone di più di circa 10 o 12 colonne, Andor voler fare qualcosa al di là della statistica descrittiva e forse correlazioni, si dovrebbe utilizzare un pacchetto statistico. Ci sono diversi quelli adatti disponibili con licenza di sito tramite OIT, oppure è possibile utilizzare in qualsiasi dei laboratori di PC OIT. Se si dispone di Excel sul proprio PC, e non lo vuole pagare per un programma statistico, con tutti i mezzi utilizzare Excel per immettere i dati (con le righe che rappresentano i soggetti, e le colonne per le variabili). Tutti i pacchetti statistici menzionati possono leggere i file di Excel, in modo da poter fare l'immissione dei dati (in termini di tempo) a casa, e andare ai laboratori per fare l'analisi. Una discussione molto più ampia delle pecche di utilizzo di Excel, con molti collegamenti aggiuntivi, è disponibile presso brucia-stat clic su Tutorial, quindi Foglio di calcolo delle tossicodipendenze. Per assistenza o ulteriori informazioni sul software statistico, contattare il Biostatistica Consulting Center. Telefono 545-2949How per calcolare medie mobili in Excel analisi dei dati Excel For Dummies, 2nd Edition Il comando di analisi dei dati fornisce uno strumento per il calcolo in movimento e in modo esponenziale lisciato medie in Excel. Supponiamo, per l'amor di illustrazione, che ha raccolto informazioni you8217ve temperatura giornaliera. Si vuole calcolare la tre giorni di media mobile 8212 la media degli ultimi tre giorni 8212 come parte di alcune semplici previsioni meteo. Per calcolare medie mobili per questo insieme di dati, eseguire le seguenti operazioni. Per calcolare una media mobile, in primo luogo fare clic sul pulsante di comando dati tab8217s Data Analysis. Quando Excel visualizza la finestra di dialogo Analisi dati, selezionare il Moving Average item dall'elenco e fare clic su OK. Excel visualizza la finestra di dialogo Media mobile. Identificare i dati che si desidera utilizzare per calcolare la media mobile. Fare clic nella casella di testo Intervallo di input della finestra di dialogo Media. Quindi individuare il campo di ingresso, sia digitando un indirizzo di intervallo di prospetto oppure utilizzando il mouse per selezionare l'intervallo di prospetto. Il vostro riferimento gamma dovrebbe utilizzare indirizzi di cella assoluti. Un indirizzo di cella assoluto precede la lettera della colonna e numero di riga con i segni, come in A1: A10. Se la prima cellula del vostro range di ingresso include un'etichetta di testo per identificare o descrivere i dati, selezionare la casella di controllo etichette prima riga. Nella casella di testo Intervallo, dire Excel quanti valori da includere nel calcolo della media mobile. È possibile calcolare una media mobile di utilizzare qualsiasi numero di valori. Per impostazione predefinita, Excel utilizza le più recenti tre valori per calcolare la media mobile. Per specificare che qualche altro numero di valori da utilizzare per il calcolo della media mobile, inserire il valore nella casella di testo Intervallo. Dillo Excel dove collocare i dati medi in movimento. Utilizzare la casella di testo Intervallo di output per identificare l'intervallo di prospetto in cui si desidera inserire i dati medi in movimento. Nell'esempio foglio di lavoro, i dati media mobile è stato posizionato nella gamma del foglio di lavoro B2: B10. (Opzionale) Specificare se si desidera un grafico. Se si desidera un grafico che traccia le informazioni media mobile, selezionare la casella di controllo Grafico in output. (Opzionale) Indicare se si desidera informazioni errore standard calcolato. Se si desidera calcolare errori standard per i dati, selezionare la casella di controllo gli errori standard. Excel inserisce i valori di errore standard, accanto ai valori medi in movimento. (Le informazioni di errore standard va in C2:. C10) Una volta specificato quali lo spostamento delle informazioni media che si desidera calcolato e dove vuoi collocato, fare clic su OK. Excel calcola lo spostamento delle informazioni media. Nota: Se Excel doesn8217t hanno abbastanza informazioni per calcolare una media mobile per un errore standard, pone il messaggio di errore nella cella. È possibile vedere diverse cellule che mostrano questo messaggio di errore come un valore.

No comments:

Post a Comment