Tecnología

Inicio

Cómo escribir expresiones booleanas y variables ficticias

En ciencias de la computación y la lógica, una expresión booleana es una declaración que puede ser evaluada como verdadera o falsa.

En estadística, una variable ficticia es un método de codificación de una variable categórica que tiene tres o más niveles, en una serie de variables que cada uno son verdaderas o falsas. Por ejemplo, en una encuesta de los hogares estadounidenses, la variable "raza / origen étnico" a menudo se codifica como Blanco, Negro, Asiático / Islas del Pacífico, nativos americanos / nativos de Alaska e hispanos. Maniquí codificar esta consiste en elegir un nivel como nivel de referencia y la creación de variables dicotómicas para los otros niveles.

El método exacto de la creación de expresiones booleanas y códigos ficticias variará dependiendo de lo que el software que está utilizando, pero la estrategia es la misma.

Instrucciones

1 Abra Excel y entrar en los encabezados de columna. Por ejemplo, es posible tener una identificación en la celda A1, la raza / origen étnico en la celda B1.

2 Introducir datos. Por ejemplo, es posible que tenga números enteros 1, 2, 3 ... en la columna A2, A3, A4 ... y Negro, Negro, Asiático, Hispano .... en las celdas B2, B3, B4 y así sucesivamente.

3 Elija un nivel de referencia. Un método para hacer esto es elegir el nivel más común como su referencia. En el ejemplo de la raza / origen étnico en los hogares estadounidenses, esto sería blanco. Este método es aplicable en general y es especialmente útil si la variable que se está codificando es la variable dependiente en una regresión.

Si la variable que se está codificando es una variable independiente, a continuación, otro método es escoger el nivel que es más alto o más bajo en esa variable dependiente. Por ejemplo, si estuviera usando la raza / origen étnico como factor predictivo de ingreso, usted podría encontrar primero el ingreso medio en cada grupo y luego elegir el más alto como su nivel de referencia.

Si está utilizando Excel, introducir encabezados de las columnas para todos los demás niveles. En el ejemplo, esto podría ser Negro, asiáticos, nativos e hispanos en las células C1, D1, E1 y F1

4 Hacer códigos simulados utilizando las instrucciones IF. En Excel, en el ejemplo, introduzca = SI (b2 = "Negro", 1, 0) en la celda C2 y copiar esta abajo de la columna. A continuación, introduzca = SI (b2 = "asiático", 1, 0) en la celda D2 y copia que hacia abajo la columna D. En la celda E2 introducir = SI (b2 = "nativo", 1, 0) y en la celda F2 entrar SI = ( b2 = "hispano", 1, 0). Copiar los largo de las columnas también.

A continuación, los datos de las columnas C a F son códigos ficticias.

Consejos y advertencias

  • Muchos paquetes de software estadístico se automatizar la creación de códigos ficticias para usted.