经济管理学刊

观点 • 资讯

学者观点 | 耶鲁大学陈晓红：非参数过度识别、有效学习与检验在GAI时代的重要性

2025年5月28日，美国艺术与科学学院院士、耶鲁大学Malcolm K. Brachman 经济学教授陈晓红受邀莅临北京大学光华40年“顶尖学者学术讲堂”，分享了她的研究On Local Over-identification and Semiparametric Efficiency in Potential Outcome Casual Models与Efficient Difference-in-Differences and Event-Study Estimators。她结合大数据与机器学习技术对传统经济学研究的冲击，系统地揭示非参数过度识别模型在提升因果推断效率与检验效能中的重要作用，为生成式人工智能（GAI）时代的复杂经济分析提供了新范式。北京大学光华管理学院商务统计与经济计量系主任、教授虞吉海主持了本次活动。

非参数过度识别、有效学习与检验在GAI时代的重要性

陈晓红

在经济学研究中，建立经济因果分析模型并结合数据进行分析是非常关键的。仅凭观察数据，如果缺乏有效的经济模型，通常只能得到变量之间的相关性，而非因果关系。例如，增加从中国进口是否导致了美国失业率的上升，仅靠数据关联并不能提供明确的因果推断。

在统计学上，一个模型是对随机变量概率分布的集合，由未知参数所标识。根据参数的维度特征，这些模型可分为参数模型（参数维度有限）、非参数模型（参数维度无限）、半参数模型（兴趣参数维度有限，但干扰参数维度无限）和半非参数模型（同时包含有限维度和无限维度的兴趣参数）。半非参数模型具有更多优势，既能避免完全参数化模型的函数形式错误，又能比完全非参数模型提供更有信息量的估计与推断。同时，半非参数模型还支持过度识别的模型设定检验。

具体而言，非参数模型中，特别是非参数工具变量（NPIV）模型，涉及内生变量与工具变量，通过非参数形式确定因变量与工具变量之间的关系。Chen and Santos (2018)提出了局部过度识别的定义，认为过度识别是经济计量模型获得有效估计量的重要条件，同时也是构建非平凡模型检验的基础。与经典的广义矩估计（GMM）模型不同，NPIV模型因其参数与约束的无限维特性，无法用传统的计数法确定过度识别或恰好识别，因此需要新的局部过度识别定义。

Chen and Santos (2018)进一步指出，模型的局部过度识别性决定了模型的有效性。局部恰好识别模型中的不同渐近线性且正则的估计量在一阶上是等价的，这意味着在此情况下不存在有效性增益，同时所有规范检验的局部功效都是平凡的。相反，局部过度识别的模型中存在显著的有效性增益和非平凡的检验，这体现了经济模型设计中的效率和检验能力之间的本质联系。

以典型的因果推断模型为例，如未混淆模型（unconfoundedness），模型仅为全局恰好识别模型，因此不存在效率增益。Hahn (1998)与Hahn and Ridder (2013)分别提出了非参数插补法与倾向得分匹配法，都能达到半参数效率界。然而，当倾向得分已知时（如随机实验），模型变为局部过度识别，但效率界并未改变。这种情况反映出，在特定条件下，模型的识别状态并不一定影响效率界。

差异中的差异（DiD）模型在两期数据情境下，虽然是全局恰好识别模型，但在多期或交错处理情境下，可能出现局部过度识别的情况，从而获得显著效率增益与非平凡的检验能力。特别地，现代DiD方法经常涉及多个处理时期与交错处理采用，揭示模型中潜在的局部过度识别性质，从而允许更有效的估计与更严格的检验。多期数据的引入意味着可以更有效地利用历史数据，这为提升估计的精准性和检验的可靠性提供了可能。

在工具变量（IV）模型中，局部识别状况取决于模型设定中的约束条件是否紧密。当约束条件在一定测度集合上严格成立时，局部模型为过度识别，从而允许更有效的估计策略。若约束条件并不严格，则模型是局部恰好识别，不存在效率增益空间。因此，对约束条件的严格性分析是IV模型应用中的重要步骤。

因此，我们发现传统因果推断中的局部过度识别通常是由模型中的干扰参数如倾向得分等的参数化模型得到。首先，这类参数化模型往往是缺乏理论与实践依据的，其造成的过度识别并非研究者所希望利用的。其次，在当前机器学习方法流行的背景下，此类参数模型已不再被广泛使用，因为研究者可以使用各类机器学习方法进行非参数的估计。现代因果推断文献通常使用潜在结果框架与机器学习方法，这些模型多数为局部恰好识别。因此，不同的渐近线性与正态估计量通常在一阶渐近意义上等价，也不存在有效性上的显著区别。这限制了这些模型在规范检验与效率增益上的可能性。而传统的参数化结构模型则允许明确的过度识别设定，从而可以实现显著的效率提升与构建非平凡的检验。这提示我们在现代分析框架下也应更多关注模型的过度识别问题，以提高分析的稳健性与效率。

Chen et al. (2025)提出了一种高效的差异中的差异（DiD）与事件研究（Event-study）估计方法。差分-差分（DiD）和事件研究（ES）是计量经济学中应用最广的因果推断工具。最新统计显示，2024 年 NBER 应用微观经济学工作论文中逾三成使用 DiD 或 ES，比任何其他方法都多，且这两种设计在金融学、宏观经济学中亦日益普及。尽管近期理论进展提高了 DiD 在处理异质处理效应时的稳健性，若干关键计量问题仍未充分解决。

第一，研究者常将所有处理前时期视为等价信息，或干脆丢弃；此做法缺乏理论与实证依据，易导致精度损失。第二，现代DiD 虽能容纳丰富的处理效应异质性，其有限样本功效尚无系统评估；灵活性是否必然牺牲检验力，尤其相较传统双向固定效应，仍属未知。第三，实务中常并列报告多种 DiD、ES 结果，但缺乏正式准则判断它们是否依赖相同识别假设、针对同一因果参数。

文章提出统一框架，在“平行趋势＋无预期”假设下，对 DiD 与 ES 进行半参数效率分析和比较。（1）以观测变量联合分布约束方式重述 DiD 识别；（2）在单次处理与阶梯式处理、含或不含协变量的多场景下推导半参数效率界；（3）证明要达效率上界，必须对处理前时期与未处理组进行非均匀加权；（4）指出即便在最简单设计中，效率提升亦具有重要实证意义。我们证明 DiD 模型在非参数意义下通常过度识别，可利用额外矩条件提高效率。

在“大n、固定T”框架下，文章基于有效影响函数构建封闭式估计量，其权重与各比较组及各处理前时期的（条件）协方差成比例，天然满足 Neyman 正交，便于与机器学习配合。若假设参数化工作模型，估计量仍具双稳健性，可容忍适度模型误设。效率界揭示：等权使用全部前期或仅选最后一期做基线通常都非最优；应根据信息量差异，以协方差驱动的权重聚合不同时间点与组别。我们提供图形化工具展示权重几何结构，帮助研究者直观理解效率来源；这些权重完全由效率理论导出，而非主观设定。

此外，文章提出无需附加同方差或弱串行相关等强假设的非参数Hausman 类检验，用于检测是否应排除某些前期基线或比较组，并给出可视化方案评估结果对识别假设的敏感度。

通过基于CPS 与 Compustat 数据的仿真及一项住院与医疗支出再分析，我们展示框架的实际收益：在单次与阶梯处理场景中，新估计量的均方误差与置信区间宽度显著下降，精度常提升逾 40%；要达到同等精度，传统估计量需增加至少 30% 样本量。结果强调：让估计策略契合识别假设蕴含的信息结构，可显著改善推断效果。

文章与现有多时期、异步处理的DiD 估计量互补。传统双向固定效应在异质效应下易混合权重，解释困难；对时间或组别加总的简化假定亦损失效率。我们的效率界为评估各法提供统一标尺，帮助研究者在设计时权衡效率与稳健性。对小样本、动态效应或高维协变量场景，文章方法尤为合适，因为它在不加额外强假设的情况下充分利用数据信息。框架也可作为其他识别策略（如合成控制）的比较基准。文章系统刻画 DiD 与 ES 的识别信息，提出达到信息极限的估计量，并配套简便的检验与可视化工具，为实践提供精度更高的新途径。

未来研究方向应进一步探索如何在更多经济情境下实现模型的局部过识别，以充分利用数据的潜在信息并提高分析的有效性。此外，对不同模型设定下的有效性界限进行深入探讨，并提出更加灵活和强大的检验方法，能够更好地适应复杂的现实经济情境。

综上所述，随着经济计量学与人工智能的结合不断加深，在GAI时代背景下，非参数过度识别与有效学习的重要性愈发凸显。这不仅能提升模型估计的效率和精准性，也为未来的因果推断与政策分析提供了更为坚实的理论基础与方法支持。

发布日期： 2025-06-25 浏览： 727