分享到:
近日,山东大学经济学院陈强教授的合作论文《分位数随机森林控制法》(Quantile Control via Random Forest)在A类国际顶级期刊Journal of Econometrics在线发表。陈强教授为第一作者,合作者为波士顿学院肖志杰教授、路易斯安那州立大学姚青松助理教授。
合成控制法(synthetic control method)与回归控制法(regression control method)是面板数据中的流行因果推断方法,特别适用于处理组仅有一位或少数几位个体的情形。目前,合成控制法与回归控制法的统计推断主要依赖于安慰剂检验(placebo tests),但安慰剂检验需要较强的假定(比如随机分组),在实践中不易满足。为此,Chen, Xiao和Yao (2024)使用分位数回归(quantile regression),估计处理个体反事实结果的2.5%与97.5%分位数,以构造每期处理效应的95%置信区间。但传统的线性分位数回归收敛速度较慢,且可能存在函数误设的偏差。Chen, Xiao和Yao (2024)提出使用“分位数随机森林”(quantile random forest)的机器学习方法进行分位数回归,以构造处理效应的置信区间,并称此方法为“分位数控制法”(quantile control method,简记QCM)。作为一种非参数的集成学习方法(例如随机森林为1000棵决策树的平均),QCM在异方差、自相关或函数误设的情况下依然稳健,在小样本中表现优良,极具应用潜力。在统计软件Stata中,可通过命令qcm方便地实现分位数控制法,其下载安装方法为“ssc install qcm, all replace”。
陈强,山东大学经济学院教授,数量经济学博士生导师,研究领域为计量经济学、机器学习与经济史。2010年入选教育部新世纪优秀人才支持计划。于 Journal of Econometrics,Oxford Economic Papers(Lead Article), Journal of Comparative Economics, Economica,Stata Journal(Lead Article)以及《经济学(季刊)》《世界经济》等国内外领先期刊发表论文,并著有畅销教材《计量经济学及Stata应用》,《高级计量经济学及Stata应用》,《机器学习及R应用》与《机器学习及Python应用》。
文/陈强