Tuesday 6 June 2017

Wie Zu Interpretieren Summary Statistics In Stata Forex


HINWEIS: Die IDRE Statistical Consulting Group wird die Migration der Website auf das WordPress CMS im Februar, um die Wartung und Erstellung neuer Inhalte zu erleichtern. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, die Weiterleitungen so zu halten, dass die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group durch ein Geschenk Stata FAQ Wie bekomme ich deskriptive Statistiken und die Fünf-Zahlen-Zusammenfassung auf einer Zeile Stata bietet den zusammenfassenden Befehl, der Ihnen erlaubt, den Mittelwert und die Standardabweichung zu sehen , Aber es bietet nicht die Fünf-Nummer Zusammenfassung (min, q25, median, q75, max). Sie können die Detail-Option, aber dann erhalten Sie eine Seite der Ausgabe für jede Variable. Wenn Sie den Mittelwert, die Standardabweichung und die Fünf-Zahlen-Zusammenfassung auf einer Zeile erhalten möchten, dann möchten Sie den Befehl univar erhalten. Der univar Befehl wurde von John R. Gleason geschrieben und erscheint im Stata Technical Bulletin 51. Sie können univar von innerhalb von Stata downloaden, indem Sie findit univar eingeben (sehen Sie, wie ich den findit Befehl benutzte, um nach Programmen zu suchen und zusätzliche Hilfe zu mehr Information zu erhalten Über die Verwendung von findit). Lets illustrieren die Verwendung der Univar-Befehl mit der High School und jenseits der Daten-Datei verwenden wir in unseren Stata-Klassen. Hier sehen Sie die Ausgabe, die Sie zusammenfassen. Hier ist die Ausgabe, die Sie von univar erhalten können. Wenn Sie die Option vlabel einschließen, enthält sie auch die Variablenbeschriftungen in der Tabelle. Die boxplot-Option zeigt eine Mini-Boxplot über jeder Variable. Hier verwenden wir die Option (weiblich), um Tabellen getrennt für Männer und Frauen anzuzeigen. Wir können die by (female) und onehdr Optionen verwenden, um eine Tabelle mit einem Header zu erhalten, der ein bisschen leichter zu lesen ist. Hier verlangen wir für die Variable write ein Boxplot und bitten, dass die Boxplots mit der gleichen Skala (über onescal) geplottet werden, so dass wir das Boxplot der Männchen und Weibchen sinnvoll vergleichen konnten. Sie sehen, dass der Median der Boxplot höher ist für die Weibchen. (Wenn wir die onecal-Option ausgelassen hätten, wäre jede Boxplot auf ihrer eigenen Skala). Weitere Informationen Weitere Informationen finden Sie in der Hilfe oder im Referenzhandbuch. Der Inhalt dieser Website sollte nicht als eine Anerkennung für eine bestimmte Website, ein Buch oder ein Softwareprodukt von der Universität von Kalifornien ausgelegt werden. Zusammenfassung Statistiken in Stata Sobald Sie ein Datensatz bereit zum Analysieren1 haben. Sollte der erste Schritt eines guten empirischen Projekts sein, um zusammenfassende Statistiken zu erstellen. Zusammenfassungsstatistiken sind eine Möglichkeit, Ihren Datensatz zu erkunden, Muster zu finden und vielleicht sogar Ihre Frage von Interesse zu verfeinern. In diesem Workshop lernen Sie, Stata zu verwenden, um grundlegende Übersichtsstatistiken, Kreuztabellen und zunehmend reichhaltige Tabellen der Zusammenfassungsstatistiken zu erstellen. Dieser Workshop ist so konzipiert, dass Sie Syntax, anstatt Punkt und klicken Sie auf Befehle zu lehren. Der Hauptvorteil des Schreibens einer do-Datei ist, dass Sie immer wieder verwenden können die meisten von ihnen auf verschiedenen Projekten, mit nur ein paar Tweaks, wenn Sie mit Stata by Point und klicken Sie auf Befehle, werden Sie verurteilt, um von Grund auf neu beginnen. Wir verwenden einen Datensatz aus der kanadischen Community Health Survey (CCHS). Sie finden es im Ordner-Einfügepfad hier, der Dataset ist U: STAFFJLStatasummarystatsprojectsummstats. dta, eine Untermenge von CCHS, die ich erstellt und gereinigt habe (recode, um binär 0-1 zu bilden). Bevor wir anfangen, sehen wir uns die Beschreibung der einzelnen Variablen2 an: Eine einfache Tabulierung sollte immer der erste Stoß zu deinen Daten sein. Der Befehl tabulate gibt eine Frequenz - und eine kumulative Verteilungstabelle im Stata-Viewer zurück. Nehmen wir an, Sie möchten den Anteil der Befragten in der Stichprobe kennen, die jemals eine Grippeimpfung erhalten haben: Beachten Sie, dass Sie den Befehl tabulate mit dem by (oder bysort) Präfix kombinieren können, um die Tabulierung für Untergruppen in Ihrem Dataset zu betrachten. Das Präfix bysort ist eine Kombination von by und sort, die Sie äquivalent in zwei Befehle aufteilen könnten, aber es ist im Allgemeinen einfacher, bysort zu verwenden. Stata sortiert zuerst die Daten und gibt dann die Informationen nach Kategorie zurück. Zum Beispiel können wir hier sehen, ob die Muster der Grippe-Aufnahmen für jede Provinz unterschiedlich aussehen: Wenn Sie an nur einer Untergruppe interessiert sind, können Sie auch das if-Qualifikationsmerkmal mit dem Befehl tabulate verwenden. Hier wollen wir sagen, wir wollen die Häufigkeit von Grippe-Aufnahmen in der Stichprobe für Ontario kennen: Schließlich können Sie mit dem Befehl tabulate eine einfache Kreuztabelle mit kategorischen Variablen durchführen. Sagen Sie, Sie wollen wissen, wie viele der Frauen in der Stichprobe über 100 Zigaretten in ihrem Leben geraucht haben: Sobald Sie Ihre Daten tabelliert haben, können Sie anfangen, die Zusammenfassung Statistiken anders als Frequenz zu betrachten. Der zusammengefasste Befehl gibt Mittelwert, Standardabweichung, Minimum, Maximum und Häufigkeit zurück. Das Beispiel ist genauso aufgebaut wie das tabellarische Beispiel. Zuerst betrachten wir die Zusammenfassungsstatistik für die gesamte Stichprobe, und dann schauen wir uns die Statistiken für Teilproben (jede Provinz) an. Mit dem if-Qualifier werden die Summary-Statistiken für eine bestimmte Untergruppe zurückgegeben. In diesen Beispielen haben wir uns auf die Aufteilung der Stichprobe nach Provinz konzentriert, aber jede kategorische Variable kann verwendet werden. In nachfolgenden Beispielen werden Männer und Frauen, Raucher und Nichtraucher, körperlich aktiv oder nicht betrachtet. Die Art und Weise, wie Sie Ihre Daten betrachten, hängt von der Art der Fragen ab, die Sie fragen möchten, je klarer Ihre Frage ist, desto genauer kann Ihre Analyse sein. Mit dieser Kombination von Befehlen können Sie einfache statistische und statistische Tabellen in Stata erstellen. Der erste Teil des Befehls (tabellarisch) wird Ihre Daten nach einer kategorischen Variable (hier werden wir Sex verwenden) aufgeteilt. Der zweite Teil liefert zusammenfassende Statistiken für eine andere Variable (vorzugsweise quantitativ). Lassen Sie uns sagen, Sie wollen wissen, wie (ob) Männer und Frauen unterscheiden sich in ihrer täglichen Verzehr von Obst und Gemüse: Diese Tabelle gibt uns die mittlere, Standardabweichung und Häufigkeit des täglichen Verzehr von Obst und Gemüse für Männer und Frauen in der Probe : Wenn Sie wissen wollen, ob Männer und Frauen aus verschiedenen Provinzen unterschiedliche Muster in ihrem durchschnittlichen täglichen Verzehr von Obst und Gemüse haben, können Sie den Befehl bysort erneut verwenden, um dieselbe Abfrageprovinz nach Provinz durchzuführen: Beachten Sie, dass Sie auch das if verwenden können (Wie wir es in der tabellarischen und zusammenfassen Befehle), um zu sehen, sagen wir, eine Provinz nur 3. Sie können auch den Befehl tabulate, summarize () verwenden, um eine schnelle tabellarische Übersichtstabelle zu erstellen. Wenn Sie zum Beispiel Mustern des täglichen Obst - und Gemüseverbrauchs für Männer und Frauen mit unterschiedlichen Rauchgewohnheiten betrachten möchten, können Sie eine Tabelle dafür erstellen: Das Ergebnis scheint ein bestimmtes Muster zu zeigen: Raucher sehen aus, als würden sie weniger Obst essen Gemüse als Nichtraucher, und Frauen scheinen mehr Obst und Gemüse als Männer zu essen, im Durchschnitt4. Der Befehl tabstat zeigt eine zusammenfassende Statistik für eine Reihe von numerischen Variablen in einer Tabelle an, die möglicherweise auf eine andere Variable (von einer Bedingung bedingt) aufgeteilt wird. Ohne die Option by () ist tabstat eine nützliche Alternative zur Zusammenfassung, da Sie die Liste der anzuzeigenden Statistiken angeben können. Mit der Option by () ähnelt tabstat tabulate der tabelle mit der Option summarize (), dass sowohl Reportstatistiken von varlist für die verschiedenen Werte von varname verwendet wird. Der Befehl tabstat ermöglicht mehr Flexibilität in Bezug auf die dargestellte Statistik und das Format der Tabelle. Die erste Zeile liefert die Statistik (Mittelwert, Standardabweichung und Frequenz) für 4 Variablen (HWTGHTM HWTGWTK HWTGBMI PACFD) für die gesamte Stichprobe. Das Ergebnisfenster sieht folgendermaßen aus: Die zweite Zeile sagt Stata, dasselbe zu tun, aber die Probe zwischen Mann und Frau aufzuteilen. Dies ist das Ergebnis: Beachten Sie, wie wir auch die Summe erhalten, also wenn Sie sich für die Split-Samples und die Summe interessieren, brauchen Sie nicht beide getrennt zu tun. Schließlich wird die dritte Befehlszeile mit dem Bysort-Präfix für jede Provinz das gleiche tun und jede Teilprobe in männlich und weiblich aufteilen. Die Ergebnisse sind im selben Format, jedoch ergibt sich für die Gesamtprofile für Männer und Frauen eine Summe (d. h. provinziell), aber nicht die Gesamtsumme für alle Provinzen: Beachten Sie, dass Sie die Statistiken auswählen, die in der Tabelle angegeben sind. Die Statistiken sind in der Hilfe tabstat aufgelistet: Der Tabellenbefehl berechnet und zeigt Statistiktabellen an. Genau wie in tabstat können Sie die Statistiken auswählen, die Sie gemeldet haben möchten, aber Sie wählen auch aus, für welche Variablen die Statistiken gemeldet werden sollen und welche Variablen die Informationen haben, mit denen die Informationen tabellarisch dargestellt werden sollen. Die Struktur der Syntax ist einfach, trägt jedoch einen genaueren Blick: Dies macht eine Tabelle mit PACFD als Zeilenvariable (aber nur, wenn der Wert für PACFD nicht. d5 ist), DHHSEX als die Variable superrow und der Inhalt jeder Zelle Wird Mittelwert, Standardabweichung und Frequenz der Variablen FVCDTOT: Können wir besser Ja, können wir. Bis zu vier Variablen können in der by () angegeben werden, so dass mit den drei Zeilen-, Spalten - und Superspaltenvariablen sieben-Wege-Tabellen angezeigt werden können. Wir werden nicht tun, eine Sieben-Wege-Tabelle heute, sondern lässt sich auf eine Vier-Wege-Tabelle mit Superrow (eine Fünf-Wege-Tabelle, wenn youd wie): Die Syntax ist die gleiche, es sieht nur komplizierter. Tabelle rowvar colvar supercolvar wenn in Gewicht, options6 In unserem Beispiel ist die Zeilenvariable wieder PACDFD, die Spaltenvariable ist SMK01B. Wir verwenden den if-Qualifier, um auf die Beobachtung zu beschränken, für die die Werte der Zeilen - und Spaltenvariablen entweder 0 oder 1 sind, der Inhalt der Zellen wiederum Mittelwert, Standardabweichung und Frequenz der Variablen FVCDTOT ist, und wir haben DHHSEX als a Superrow variabel. Der Weg, um diese Tabelle zu lesen ist einfach: eine weibliche Befragte, die nicht in mehr als 15 Minuten täglicher Aktivität und hat noch nie eine ganze Zigarette gegessen hat durchschnittlich 5,1 Einheiten Obst und Gemüse täglich. Nun ist eine endgültige Flourish Eine Vier-Wege-Tabelle mit Superspalte und Superrow Hier ist der Befehl: Tabelle PACFD SMK01B FLU160 wenn ((PACFD. d) amp (SMK01B0SMK01B1) Verstärker (FLU1600FLU1601)), c (mittlere FVCDTOT sd FVCDTOT n FVCDTOT) von (DHHSEX) Nun können Sie sich fragen, muss ich wirklich alles tun, nur um auf die Statistik Statistik Die Antwort variiert je nach Ihrem Niveau der Raffinesse, Ihre Forschungsfrage oder Ihre Supervisor Research Agenda Für einige, tabellarische, zusammenfassen Und vielleicht tabellieren, zusammenfassen () wird mehr als genug sein. Für andere, tabstat und Tabelle können sehr nützliche Werkzeuge in der Tat. Wir ermutigen Sie, mit Daten zu spielen, und eine intime Kenntnis Ihrer Datenmenge zu erhalten, bevor Sie mehr formale statistische Analyse durchführen. Es gibt viele gute interenet Quellen für ergänzende Lesungen auf das Erstellen von Statistik Statistik in Stata. Seien Sie spezifisch, wenn Sie eine Abfrage in einer Suchmaschine eingeben und Sie sollten viel Benutzer-schriftliche Beratung finden. 1 Lesen Sie hierzu die Anleitung zum Abrufen von Daten von ltodesigt, Reinigungsdaten auf Stata 2 Sie werden einige administrative Kommandos vor dem Beschreibungsbefehl beachten (hier gekürzt auf des) 3 Die Syntax wäre einfach: Tab DHHSEX wenn GEOGPRV35, Summe (FVCDTOT) 4 Wir können nicht Ziehen Sie die Schlussfolgerung von der Betrachtung von Mitteln, die wir testen müssten, ob eines dieser Mittel statistisch von den anderen verschieden ist. Allerdings ist ein Blick auf diese Zusammenfassung Statistiken ein guter Anfang Untersuchung von Mustern in den Daten. 5 In diesem Datensatz. D ist ein fehlender Datencode 6 Geben Sie help table im Befehlsfenster von Stata für eine detaillierte Darstellung der Funktionen dieses Befehls ein.

No comments:

Post a Comment