Ben Ogorek MEDIUM https://medium.com/@baogorek/supply-and-demand-simultaneous-equations-not-simultaneous-causation-5252cf44fb29
Las ecuaciones adicionales añaden restricciones que pueden verse a través de la lente del sesgo de selección.
Resumen
Los gráficos causales típicos, es decir, los gráficos acíclicos dirigidos (DAG), no permiten ciclos, ya que esto permitiría que una variable fuera la causa de sí misma. No está claro si tal cosa es posible y cae dentro del ámbito de la investigación metafísica conocida como “causalidad simultánea”. Sin embargo, existen ecuaciones simultáneas en las que las variables son causa y efecto, siendo el ejemplo canónico la oferta y la demanda, y esto a menudo se interpreta en el sentido de que los DAG son una descripción inadecuada de la realidad. En este artículo muestro que el modelo clásico de oferta y demanda, aunque ciertamente es un ejemplo de ecuaciones simultáneas, difícilmente lo es de causalidad simultánea y, además, que las propiedades estadísticas del sistema pueden explicarse mediante un sesgo de selección (no un sesgo de endogeneidad). ).
Sobre una variable como causa de sí misma.
Una y otra vez surge la confusión sobre si dos variables pueden provocarse mutuamente al mismo tiempo. No se trata de dos variables en el momento t que se causan entre sí en el momento t+1 . Se trata de dos variables que se provocan simultáneamente entre sí al mismo tiempo .
Un ejemplo de esto surgió en X (también conocido como Twitter), donde la conversación se centró en un autor que había publicado artículos separados concluyendo que la creatividad causa deshonestidad y la deshonestidad causa creatividad. Se produjo el siguiente intercambio (se proporcionan enlaces a publicaciones para respetar el derecho de eliminación de los usuarios):
R: «¡Por eso necesitamos DAG (Directed Acyclic Graph!)» enlace
B: “Sin embargo, la estructura causal del mundo no es realmente acíclica, así que esto parece estar bien” enlace
R: «¿Entonces estás diciendo que una variable puede, en última instancia, ser una causa de sí misma?» enlace
D: “¿No es este el caso del precio y la cantidad en un marco estándar de oferta y demanda?” enlace
Yo: Siempre hay una forma reducida en la que los resultados se determinan simultáneamente [sic] a partir de insumos comunes”. enlace
R: Enlace “Pero una forma reducida no es estructural”
D: “De hecho, recuerdo en “El libro del por qué” un diagrama cíclico de la forma: p < → q. [continúa]” enlace
R: “Los axiomas de los modelos causales estructurales son compatibles con los modelos de equilibrio cíclico. [ enlace , enlace en papel] ”
Existe un acuerdo implícito en que existen modelos cíclicos de causalidad, pero que una variable aún no puede ser la causa en sí. ¿Qué significa?
En mi respuesta, sugerí que estos modelos cíclicos eran simplemente representaciones estilizadas de formas reducidas, que es lo que realmente importa. Pero A, que no estaba de acuerdo con la premisa de causalidad simultánea, también estaba en desacuerdo con esa afirmación.
¿Qué dicen estos modelos sobre el mundo? En las siguientes secciones, investigaremos utilizando el ejemplo canónico de oferta y demanda.
Las ecuaciones simultáneas de oferta y demanda
Considere un conjunto simple de ecuaciones simultáneas para la oferta y la demanda, donde S es la cantidad ofrecida, D es la cantidad demandada y P es el precio:
S = alfa_0 + alfa_p * P + épsilon_S,
D = beta_0 + beta_p * P + espilon_D,
S = D. (1)
La ecuación S=D representa la condición de compensación del mercado , que Wikipedia explica como: “suponiendo que todos los compradores y vendedores tienen acceso a la información y que no hay ‘fricción’ que impida los cambios de precios, los precios se ajustan constantemente hacia arriba o hacia abajo para garantizar la compensación del mercado. «
Bajo la condición de equilibrio del mercado, la oferta satisface la demanda y la demanda satisface la oferta. Aunque no puedo encontrar esta representación exacta en línea, me dibujaron el siguiente gráfico en persona:

Sin S=D, estaríamos viendo regresiones no relacionadas de la cantidad ofrecida (S) y la cantidad demandada (D) sobre el precio (P). La condición de compensación del mercado establece que el precio está cambiando, es decir, es endógeno al sistema. Para ver esto, primero piense en el caso en el que no hay shocks de oferta o demanda, es decir, épsilon_S = épsilon_D = 0. Entonces el sistema (1) se convierte en
S = alfa_0 + alfa_p * P,
D = beta_0 + beta_p * P,
S = D. (2)
Hay un punto, (P, S), o equivalentemente (P, D), que resuelve este conjunto de ecuaciones. Para simplificar aún más, llamémoslo (P, Q) donde “Q” es simplemente “cantidad” (ya sea ofrecida o demandada). Usando un conjunto de coeficientes de juguetes tomados de un video instructivo de YouTube ,
alfa_0 = -40,
alfa_p = 30,
beta_0 = 180,
beta_p = -25,
la combinación de precio y cantidad de equilibrio del mercado es P = 4 y Q = 80, como se ve en el siguiente gráfico:
Ahora considere un shock de demanda de épsilon_D = 1 y ningún shock de oferta:
S = alfa_0 + alfa_p * P,
D = beta_0 + beta_p * P + 25. (3)
Por definición, D ha aumentado debido al shock, pero D = S, por lo que S también ha cambiado y ya no puede ser igual a alpha_0 + alpha_p * P. Los shocks ya se han realizado, por lo que la única forma de que se cumpla la condición de equilibrio del mercado mantener es que P cambie a P*. Usando D = S,
alfa_0 + alfa_p * P* = beta_0 + beta_p * P* + 25
y
P* = (beta_0 — alfa_0 + 25) / (alfa_p — beta_p).
Pero tanto la Cantidad Ofrecida como la Cantidad Demandada son funciones de P, por lo que el nuevo punto que resuelve las ecuaciones simultáneas es (P*, Q*).
Si piensa en los signos y las posiciones relativas de los coeficientes, se dará cuenta de que P* > P, como se esperaría de un aumento de la demanda. Con nuestros coeficientes de juguete, P* = 4,45 > 4.
Por intuitiva que sea esta explicación secuencial, no puede ser precisa porque entramos en un estado inconsistente después de aplicar el shock de demanda pero antes de cambiar el precio. Lo que sea que esté sucediendo no está sucediendo de manera secuencial, al menos no según este modelo.
Las limitaciones de la forma reducida
Podemos reformular el sistema simultáneo (1) de oferta y demanda en un sistema impulsado enteramente por variación exógena. Esto se hace en dos pasos:
1) Igualar las ecuaciones de oferta y demanda y resolver para P en función de los shocks aleatorios,
2) Elija la ecuación de oferta y demanda y sustituya P como una función de los shocks aleatorios del primer paso.
Al elegir la ecuación de oferta para el Paso 2, tenemos:
P = (beta_0 — alpha_0) / (alpha_p — beta_p) + (epsilon_d — epsilon_s) / (alpha_p — beta_p),
S = (alpha_p * beta_0 — alpha_0 * beta_p) / (alpha_p — beta_p) + (alpha_p * épsilon_d — beta_p * épsilon_s) / (alpha_p — beta_p).
Usando nuestra variable «Q», todas las constantes y variables aleatorias, tenemos:
P = mu_p + eta_p,
Q = mu_q + eta_q. (4)
Si bien eta_p y eta_q no son independientes, esta es la situación notablemente ordinaria en la que (P, Q) se distribuye como una nube gaussiana de puntos. Es sencillo derivar los parámetros de media y varianza:
E(P) = (beta_0 — alfa_0) / (alfa_p — beta_p),
E(Q) = (alfa_p * beta_0 — alfa_0 * beta_p) / (alfa_p — beta_p),
Var(P) = (sigma_D ^ 2 + sigma_S ^ 2) / (alfa_p — beta_p) ^ 2,
Var(Q) = (alfa_p ^ 2 * sigma_D ^ 2 + beta_p ^ 2 * sigma_S ^ 2) / (alfa_p — beta_p) ^ 2,
Cov(P, Q) = (alfa_p * sigma_D ^ 2 + beta_p * sigma_S ^ 2) / (alfa_p — beta_p) ^ 2. (5)
Al observar (4) y (5), no debería sorprender que recuperar los parámetros «estructurales» originales del sistema (1) sea imposible. Surge la pregunta: ¿por qué los necesitamos en primer lugar? ¿Por qué no simplemente estimar los parámetros del gaussiano bivariado?
Los modelos más útiles, causales o no, son aquellos que trascienden las particularidades de cualquier conjunto de datos. Y esta clase de conjuntos de datos es muy particular porque el equilibrio siempre se cumple .
Sabemos que en el mundo real, el excedente de inventario se acumula y se produce escasez. En estos casos, las ecuaciones de oferta y demanda de (1) aún se mantienen a pesar de S /= D. Las fuerzas empujan al sistema nuevamente al equilibrio bajo un modelo diferente donde la dinámica no es instantánea.
Por tanto, es incorrecto decir que la forma reducida, una nube gaussiana, es «la realidad». La forma estructural, aunque es una realidad estilizada, es más poderosa. Lo que pasa es que lo que podemos observar está fuertemente limitado por la condición de equilibrio.
Selección Sesgo Vínculos Estructurales y Formas Reducidas
Si eliminamos S=D, entonces tenemos dos modelos lineales que comparten sólo la variable explicativa ahora exógena P. Como econometrista, es posible que crea que su conjunto de datos consta de mercados que ya están en equilibrio. Eso no significa que siempre estuvieron en equilibrio, o que nunca podrían salir del equilibrio, pero estaban en equilibrio cuando se recopilaron los datos. Si sólo se ven datos de los mercados mientras están en equilibrio, cuando claramente es posible el desequilibrio, esto suena como un sesgo de selección.
Siempre he oído hablar de esto como sesgo de simultaneidad o sesgo de endogeneidad, nunca sesgo de selección. Por lo tanto, argumentaré que el sesgo de selección es una explicación con una simulación en R ( código ).
Primero, genero datos del sistema (1) usando los parámetros de nuestro juguete pero sin la condición S=D. El precio P se genera a partir de una distribución uniforme. Por lo tanto, tenemos dos ecuaciones de regresión que no están relacionadas excepto por la variable explicativa exógena común P. Genero 1 millón de puntos, creando la siguiente “batalla con sables de luz” entre las cantidades ofrecidas y demandadas:
Barriendo bajo la alfombra las cantidades negativas a los precios más bajos (éstas son aproximaciones lineales), no hay nada contradictorio en un precio en los extremos. Si el precio era 7 (unidades), entonces la oferta excede la demanda y los inventarios se acumulan.
Dado que nuestro modelo de equilibrio dice que S=D se cumple, tomé un subconjunto de situaciones en las que S es casi igual a D (con una diferencia de 0,75 unidades entre sí). El subconjunto ciertamente parece una nube gaussiana:
Si el sesgo de selección puede vincular el sistema estructural con el sistema reducido, entonces las medias y varianzas estimadas del subconjunto deberían estar mucho más cerca de las cantidades teóricas de (5) que las estimadas a partir del conjunto de datos completo. No calculé errores estándar, pero los tamaños de muestra son lo suficientemente grandes, con n=1.000.000 para el conjunto de datos completo y n=3.868 para el subconjunto, para hacer obvio lo que estamos a punto de ver.
E(P), el valor teórico es 4,0
- Conjunto de datos completo: la estimación es 3,50,
- Subconjunto: la estimación es 4,01.
E(Q), el valor teórico es 80
- Datos completos estimados: la estimación es 65,02,
- Subconjunto: la estimación es 80,05.
Var(P), el valor teórico es .067
- Conjunto de datos completo: la estimación es 4,08,
- Subconjunto: la estimación es 0,069.
Var(Q), el valor teórico es 50,4
- Conjunto de datos completo: la estimación es 3770,3,
- Subconjunto: la estimación es 51,9.
Se espera que Cov(P, Q) sea 0,165
- Conjunto de datos completo: la estimación es 122,4,
- Subconjunto: la estimación es 0,182.
Tú entiendes. En el código , puede establecer N en varios valores, ajustar y aflojar la cantidad en la que S puede desviarse de D, y verá que estos valores convergen con las estimaciones teóricas.
¿Por qué no un DAG?
Dado que los DAG pueden ampliarse con nodos de selección, ¿por qué no tener flechas que apunten desde el precio hasta las cantidades ofrecidas y demandadas, que a su vez apunten a un nodo de selección? Sería un sesgo de selección paramétricamente irrecuperable, pero ni siquiera podemos recuperar los parámetros originales del sistema gaussiano lineal.
Las flechas que emanan del precio parecerían oponerse a la idea de que el precio es endógeno, pero según este modelo de equilibrio, ¿lo es realmente? Si el sesgo de selección, más que el sesgo de endogeneidad, es el responsable de las propiedades del sistema, tal vez sea sólo semántica. Recordemos que fue incómodo demostrar secuencialmente que un shock de demanda aumenta el precio.
Una descripción más intuitiva de la endogeneidad de los precios tendría shocks de oferta y demanda en momentos anteriores que afectarían a los precios en momentos posteriores, ya que la información tarda en viajar, los inventarios tardan en acumularse, etc. Con la oferta, la demanda y el precio indexados por tiempo, no Restringido al equilibrio pero gobernado por fuerzas que empujan al sistema de nuevo al equilibrio, los ciclos desaparecen y el sistema puede volver a representarse mediante un DAG. Esto parecería ser una mejor representación de la realidad, aunque los datos en este momento pueden ser difíciles de obtener.
La causalidad simultánea es confusión instantánea
Si desea profundizar en el tema de la investigación metafísica llamado “causalidad simultánea”, este video de YouTube Causación simultánea, Dios y el Big Bang es bastante bueno. Por bueno me refiero a interesante y bien hecho, no necesariamente útil en la vida diaria. Aquí hay algunos puntos de conversación, generalmente parafraseados de otros pensadores y luego deconstruidos para que nadie tenga la última palabra:
- “¿Y si las causas pudieran ser simultáneas con sus efectos? Si es así, entonces el hecho de que Dios haga que el universo exista [sic] puede ser simultáneo con la existencia del universo (el efecto)”.
- “Si se permite la causalidad simultánea, entonces la cosa no necesita existir antes de existir, sólo simultáneamente con su propia existencia, lo cual, por definición, todo ocurre de todos modos. Así pues, parecería que si se permite la causalidad simultánea, entonces también se permite que las cosas se causen a sí mismas. Y, sin embargo, no vemos que esto suceda a nuestro alrededor”.
- Las influencias causales no pueden propagarse más rápido que la velocidad de la luz. Cualquier transferencia de energía debe llevar una cantidad de tiempo distinta de cero.
- Segunda ley de Newton: a medida que cambian las fuerzas, el estado de movimiento del cuerpo cambia instantáneamente. Las causas y los efectos deben considerarse extendidos en el tiempo.
- En el caso de una barra de metal calentada (hasta el punto de brillar), “decimos que la temperatura de la barra hace que la barra brille, pero estos son procesos continuos que ocurren al mismo tiempo… [Pero] lo que Lo que tenemos aquí es una situación de equilibrio en la que ciertos fenómenos ocurren simultáneamente”. Los cambios en esos fenómenos, como los cambios de temperatura de la barra de metal, no producen cambios instantáneos en el brillo.
Esperaba que se derribara la idea de causalidad simultánea. No entendí eso, pero una de las ideas en el video es que nuestra noción misma de causa y efecto existe para ayudarnos como agentes que navegan en nuestro entorno. Tener que lidiar con efectos que son sus propias causas no parece facilitar eso.
Me di cuenta de que las personas a las que realmente no parece importarles la causalidad simultánea son los econometristas, los que utilizan estos modelos causales cíclicos supuestamente canónicos. Cuanto más entiendo estos modelos, incluso aquellos en los que una variable está literalmente en los lados izquierdo y derecho de las ecuaciones del sistema, más seguro estoy de que la causalidad simultánea no tiene nada que ver con nada de esto, y que las ecuaciones adicionales simplemente imponen restricciones. para tener más posibilidades de identificación. He planteado estas restricciones como un sesgo de selección y tengo curiosidad por ver si recibo rechazo al respecto.
Si me he metido en problemas en este artículo, una cosa de la que estoy seguro es que la existencia de “modelos causales cíclicos” está confundiendo a la gente haciéndoles pensar que implican algún tipo de bucle causal en el mundo. Más bien, parecen ser herramientas para abordar situaciones en las que sólo observamos sistemas en ciertos estados, donde no tenerlo en cuenta daría lugar a sesgos.
Existe una oportunidad para que los educadores en el espacio de inferencia causal articulen qué son estos modelos y cómo los sistemas del mundo real que representan podrían ser representados por DAG.