Wednesday, 29 March 2017

Ändern Des Speichertyps In Stata Forex


HINWEIS: Die IDRE Statistical Consulting Group wird die Migration der Website auf das WordPress CMS im Februar, um die Wartung und Erstellung neuer Inhalte zu erleichtern. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, die Weiterleitungen so zu halten, dass die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group, indem Sie ein Geschenk geben Stata Class Notes Zählen von n bis N Einführung Stata hat zwei eingebaute Variablen namens n und N. N ist die Stata-Notation für die aktuelle Beobachtungsnummer. N in der ersten Beobachtung 1, 2 im zweiten, 3 im dritten und so weiter. N ist die Stata-Notation für die Gesamtzahl der Beobachtungen. Wir können sehen, wie n und N arbeiten. Wie Sie sehen können, enthält die Variable id die Beobachtungsnummer, die von 1 bis 7 läuft, und nt die Gesamtzahl der Beobachtungen, die 7 ist. Mit dem Verwenden von n und N in Verbindung mit dem Befehl by können Sie einige sehr nützliche Ergebnisse erzielen. Natürlich müssen wir, um den by-Befehl zu verwenden, zuerst unsere Daten auf der by-Variablen sortieren. Nun ist n1 die Beobachtungsnummer innerhalb jeder Gruppe und n2 die Gesamtzahl der Beobachtungen für jede Gruppe. Um die niedrigste Punktzahl für jede Gruppe aufzulisten, verwenden Sie folgendes: Um die höchste Punktzahl für jede Gruppe zu verwenden, verwenden Sie Folgendes: Eine weitere Verwendung von n Verwenden Sie n, um herauszufinden, ob es doppelte ID-Nummern in den folgenden Daten gibt: Die Beobachtungen 6 und 7 haben die gleichen ID-Nummern und unterschiedliche Werte. Duplikate finden Mit N können Sie nun doppelte Beobachtungen finden. In diesem Beispiel sortieren wir die Beobachtungen durch alle Variablen. Dann verwenden wir alle Variablen in der by-Anweisung und set set n gleich der Gesamtzahl der identischen Beobachtungen. Schließlich führen wir die Beobachtungen auf, für die N größer als 1 ist, wodurch die doppelten Beobachtungen identifiziert werden. Wenn Sie eine Menge von Variablen in der Datenmenge haben, könnte es lange dauern, bis sie alle zweimal eingeben. Wir können die Wildcard verwenden, um anzuzeigen, dass wir alle Variablen verwenden möchten. Weiterhin können wir in den letzten Versionen von Stata sortieren und in einer einzigen Aussage zusammenfassen. Unten ist eine vereinfachte Version des Codes, die genau die gleichen Ergebnisse wie oben ergeben wird. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, Buch oder Software-Produkt von der Universität von Kalifornien ausgelegt werden. NOTICE: Die IDRE Statistical Consulting-Gruppe wird die Migration der Website, um die WordPress CMS im Februar zu erleichtern Wartung und Erstellung neuer Inhalte. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, die Weiterleitungen so zu halten, dass die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group mit einem Geschenk Stata FAQ Wie kann ich schnell viele Zeichenfolgenvariablen in numerische Variablen umwandeln Es kann vorkommen, dass Sie eine Datei mit vielen (oder allen) der Variablen erhalten Definiert als Strings. Also Zeichenvariablen. Die Variablen können numerische Werte enthalten, aber wenn sie als Typstring definiert sind. Es gibt sehr wenige Dinge, die Sie tun können, um die Daten zu analysieren. Sie können keine Mittel erhalten, Sie können keine Regression durchführen, Sie können keine ANOVA ausführen usw. Manchmal enthält der Dataset numerische Werte, die als Strings gespeichert werden. Wir werden dieses Szenario zuerst ansprechen. Dann werden wir den Fall ansprechen, in dem die String-Variablen tatsächlich Strings enthalten, und das Ziel ist, jedem Wert zuzuordnen, den die Zeichenfolge auf einen numerischen Wert anwendet. Alle Beispiele auf dieser Seite verwenden den gleichen Dataset, so können wir durch die Prüfung der Daten zu starten. Der Beispieldatensatz, hsbs. Ist eine Teilmenge der High School und Beyond-Datendatei mit allen Variablen als String-Variablen. Wie Sie aus dem folgenden Befehl sehen, sind die Variablen alle als String-Variablen definiert (z. B. Wissenschaft ist str2, ein String der Länge 2). Nachdem wir nun wissen, dass die Variablen String-Variablen sind, können wir mit dem list-Befehl sehen, wie die in diesen Variablen gespeicherten Strings aussehen. Obwohl die Variablenwissenschaft als str2 definiert ist, können Sie aus der folgenden Liste sehen, dass sie nur numerische Werte enthält. Dennoch kann Stata, da die Variable als str2 definiert ist, keine numerische Analyse der variablen Wissenschaft durchführen. Das gleiche gilt für die Variable lesen. Konvertieren von Zeichenfolgenvariablen mit numerischen Werten Eine Methode zum Konvertieren von Zahlen, die als Zeichenfolgen in numerische Variablen gespeichert sind, besteht darin, eine Zeichenfolgefunktion namens real zu verwenden, die numerische Werte, die als Zeichenfolgen gespeichert sind, in numerische Werte umwandelt, die Stata als solche erkennen kann. Die erste Zeile der Syntax liest sich in dem oben gezeigten Datensatz. Die zweite erzeugt eine neue Variable readn, die gleich dem Wert der Zahl ist, die in der gelesenen Stringvariable gespeichert ist. Die real (s) ist die Funktion, die die als Strings gehaltenen Werte übersetzt, wobei s die Variable mit Strings ist. Ein zweites Verfahren, um dasselbe Ergebnis zu erzielen, ist die Befehlszerstörung. Versuchen Sie es mit dem Befehl destring und sehen, wie es funktioniert. Die erste Syntax-Zeile lädt den Dataset erneut, so dass wir mit einem Dataset beginnen, das nur String-Variablen enthält. Die zweite Syntaxzeile führt den Befehl destring aus. Wie Sie im folgenden Befehl sehen können, hat der destring-Befehl alle Variablen auf Numerik umgestellt, mit Ausnahme des Rennens. Geschlecht und schtyp. Da diese Variablen Zeichen in ihnen hatten, ließ der destringende Befehl diese Variablen alleine. Wenn es im Dataset numerische Variablen gegeben hätte, würden sie unverändert bleiben. Beide der oben beschriebenen Techniken haben Attribute, die in einigen Situationen Vorteile sind und in anderen Situationen Nachteile sein können. Der Befehl destring kann in einem Schritt auf einem gesamten Dataset ausgeführt werden, die Methode, die die Funktion real verwendet, erfordert die Ausgabe eines Befehls für jede Variable, die umgewandelt werden soll (dies kann jedoch mit einer Schleife geschehen, anstatt die Syntax für jede Variable zu tippen). Ein möglicher Vorteil für die Verwendung der Funktion real (die erste Methode) besteht darin, dass die Variable, wenn die Funktion real auf einen nicht-numerischen Wert trifft, die Variable fehlt und dann weiterfährt. In gewissem Maße kann entsetzt werden, um sich ähnlich zu verhalten, aber nicht identisch. Um eine Stringvariable, die einen nicht-numerischen Wert enthält, mit destring zu konvertieren, muss man die Zeichen, die ignoriert werden sollen (z. B. oder.), Auflisten. Zudem entfernt destring die angegebenen nicht-numerischen Zeichen, anstatt die Werte für jene Fälle festzulegen, die nicht-numerische Werte enthalten (was die Funktion real macht). Destring wird die spezifizierten Zeichenfolgen extrahieren und dann umwandeln, was bedeutet, dass a4 in 4 umgewandelt werden kann. Das Verhalten von destring ist sehr gut, wenn man numerische Werte als Strings gespeichert hat, die gelegentlich Dinge wie Kommas (zB 4.354) enthalten, aber es kann Situationen geben, in denen Dieses Verhalten ist unerwünscht. Konvertieren von String-Variablen mit nicht-numerischen Werten in numerische Werte Wie konvertieren wir Gender und Schtyp in numerische Werte Wir können den Encoding-Befehl wie unten gezeigt verwenden. Diese Befehle erzeugen gender2 und schtyp2. Beachten Sie in dem Beschreibungsbefehl unten, dass gender2 und schtyp2 numerische Variablen sind und sie mit ihnen verknüpft sind (gender2 und schtyp2 genannt). Wenn wir die Daten auflisten, scheint es, dass gender2 und schtyp2 identisch mit Geschlecht und schtyp sind. Aber sie sind wirklich numerisch und was Sie sehen, sind die mit den Variablen verknüpften Wertelabels. Unten verwenden wir die nolabel-Option und Sie sehen, dass gender2 und schtyp2 sind wirklich numerisch. Was ist mit dem variablen Rennen. Es ist immer noch eine Zeichenvariable, weil unser vorheriger Destringing-Befehl das X in den Daten sah und nicht versucht, es zu konvertieren, da es nicht-numerische Werte hatte. Unten können wir es in numerische umwandeln, indem ich die Option ignore (X), die destring, um die Variable zu numerischen konvertiert und wenn es auf X, um es zu einem fehlenden Wert konvertiert erzählt. Sie können die Ergebnisse in der Liste unten sehen. Wie Sie gesehen haben, können wir mit destring Variablen, die Zahlen enthalten, in numerische Variablen umwandeln und Situationen behandeln, in denen einige Werte als Zeichen gespeichert werden (wie das X, das wir mit Rasse sahen). Wenn Sie eine Zeichenvariable haben, die als alle Zeichen gespeichert ist, können Sie codieren, um die Zeichenvariable in numerisch zu konvertieren, und es werden Wertebeschriftungen erstellt, die die Werte haben, die mit der Zeichenvariablen gespeichert wurden. Weitere Informationen finden Sie im Hilfs - oder Referenzhandbuch zu den Befehlszeilen - und Encodierungsbefehlen. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, ein Buch oder ein Softwareprodukt der Universität von Kalifornien verstanden werden.

No comments:

Post a Comment