通过神经需求势实现可积弹性

arXiv: 2605.22820v1

论文信息

标题: Integrable Elasticity via Neural Demand Potentials

作者: Carlos Heredia, Daniel Roncel

发布日期: 2026-05-21

arXiv ID: 2605.22820v1

PDF 链接: 下载 PDF

研究背景与动机

在零售定价决策中,弹性系数是核心输入量:它刻画了需求对价格变化的局部敏感度。然而,多产品环境下稳定、可复现的弹性估计始终面临巨大挑战。零售需求在店铺和产品间高度异质,随时间非平稳,并受促销、品类结构等多种因素影响。与此同时,不同 SKU 的价格常常存在相关性,传统的灵活模型虽然可以拟合需求,却容易产生不稳定或经济上不可信的弹性估计。

从数学角度看,弹性是需求映射的导数,因此估计需求表面上的微小不规则会在弹性中被大幅放大。多产品情形下,弹性矩阵将所有 SKU 耦合在一起,交叉价格效应尤其难以从观测性价格变动中识别——它们通常弱于自身价格效应,且容易被相关定价和促销活动所模糊。现有文献中,弹性通常从一个估计后的需求模型中导出,从简单的双对数 OLS 基准到现代深度学习方法均有应用。尽管这些模型能提供弹性估计,但它们往往没有将弹性作为需求函数的内在导数来对待,从而可能导致局部弹性与全局需求表面不一致。

针对这一不足,本文提出了“可积上下文依赖需求网络”(Integrable Context-Dependent Demand Network, ICDN)。核心思想是从需求本身出发,将对数需求建模为对数价格与上下文协变量的光滑函数,再通过精确微分直接获得弹性的解析表达式。这种“需求优先”的构造确保了弹性矩阵与一个一致的需求表面相兼容,从而满足了微分形式的可积性条件——即局部弹性能够积分回同一个需求函数,避免路径依赖。这一设计原则并非 ICDN 独有,任何足够光滑的需求优先模型都会产生可积弹性场,而 ICDN 的贡献在于将这一原则在高维零售定价场景中高效实现,通过显式的价格基函数、样条导数解析式、经济正则化以及稀疏有向的交叉价格交互,兼顾了灵活性和可解释性。

核心方法:可积上下文需求网络的架构

ICDN 直接将对数需求建模为一个关于对数价格向量 u=logpu = \log p 和上下文 xx 的可微函数 gθ(u,x)g_\theta(u, x),并由此定义弹性矩阵为其雅可比:E^θ(u,x)=gθ(u,x)/u\widehat{E}_{\theta}(u,x) = \partial g_\theta(u,x) / \partial u

结构化需求表面

ICDN 的对数需求表面将价格效应拆分为可解释的线性成分和基于样条的非线性修正。对于每个产品 ii,其对数需求包含三项:

  • 基线截距 bi(x)b_i(x),由上下文编码器生成。
  • 直接价格响应项:对每个产品 jj,包含一个线性项 βij(x)uj\beta_{ij}(x) u_j 和一个单变量样条修正 wij(x)Bj(uj)w_{ij}(x)^\top B_j(u_j)。当 j=ij=i 时,这是自身价格响应;当 jij\neq i 时,则是有向交叉价格效应。
  • 非线性相互作用项:针对 iji \neq j,引入双线性形式 Bi(ui)U(ij)(x)Bj(uj)B_i(u_i)^\top U^{(ij)}(x) B_j(u_j),捕捉两个产品价格相对位置的非线性交互。

这里 Bj(uj)B_j(u_j) 是为每个产品独立构造的三次截断幂样条基。该基函数具有解析的闭合形式导数,使得弹性和曲率可以精确计算。样条节点基于产品自身价格分布的分位数确定,并在训练前固定,从而保持计算的确定性。

上下文条件与稀疏有向交互

模型通过一个共享的编码器将每个 SKU 的上下文信息映射为隐向量 hih_i。自身价格参数从 hih_i 生成,而交叉价格参数则由有序对 (hi,hj)(h_i, h_j) 生成,并通过缩放点积注意力对选定的产品对进行加权。这种有向对的构建允许方向性的替代或互补模式(EijEjiE_{ij} \neq E_{ji}),而不强加对称性。

为了应对高维 SKU 的挑战,ICDN 采用稀疏邻居选择:利用注意力得分对每个焦点产品选出 top-kk 个最有影响力的竞争产品,仅对这些选中的对计算交叉价格效应。该稀疏图在训练后冻结,保证评估和弹性提取的一致性。

训练目标与经济正则化

训练目标由三部分构成:

  • 鲁棒拟合项:使用 Huber 损失拟合对数需求,降低异常值和异方差噪声的影响。
  • 光滑性惩罚 Lsm\mathcal{L}_{\text{sm}}:基于自身价格曲率 2gθ,i/ui2\partial^2 g_{\theta,i}/\partial u_i^2 的平方惩罚,抑制需求表面的虚假振荡。
  • 弹性带惩罚 Lelast\mathcal{L}_{\text{elast}}:对自身价格弹性施加 [5,0][-5, 0] 的软约束(负值且不过于极端),对交叉弹性施加 [1,1][-1,1] 的范围软约束,仅当弹性超界时施加二次惩罚。

这种设计将经济先验直接嵌入训练过程,而非后验解释。

可积性保证

由于弹性被定义为对数需求函数的精确导数,需求组件 gθ,ig_{\theta,i}C2C^2 时,对应的弹性 1-形式自动满足闭合条件,并可通过线积分恢复唯一的需求表面。ICDN 通过使用三次样条(C2C^2)和解析导数实现了这一性质。

创新点与贡献

论文的主要贡献体现在以下几个方面:

  1. 需求优先的弹性估计框架:将多产品弹性估计表述为学习一个光滑对数需求表面,弹性作为该表面的导数。这种“先需求后求导”的方式从数学上保证了可积性,避免了路径依赖的不一致性。

  2. 结构化神经需求模型 ICDN:结合了线性价格效应、有向样条非线性修正和稀疏注意力选择的交叉交互,在保持分析可处理性的同时实现了高度的灵活性。模型能够生成上下文依赖的、方向性的异质弹性。

  3. 解析可计算弹性:利用产品特异样条基的闭合形式导数,无需依赖密集的雅可比或海森矩阵计算,使在大规模 SKU 面板上的弹性提取变得高效可扩展。

  4. 上下文感知及稀疏交互:采用共享编码器生成产品隐向量,并通过有序对与注意力机制构建稀疏有向交叉价格效应,避免 n2n^2 的计算爆炸,更适合高维零售环境。

  5. 经济正则化:将运营定价中的弹性范围先验(如自身负弹性、交叉弹性不宜过大)直接融入损失函数,提升了弹性估计的经济一致性。

实验结果分析

论文在 Dominick’s 啤酒品类扫描数据上评估了 ICDN,并与一个经典的有向双对数基准进行了比较。分析关注预测泛化、弹性稳定性和经济可信度。

  • 预测性能:ICDN 在五个时序验证折上的 R2R^2 均优于基准,平均提升显著。在更细粒度的(店铺, UPC, 折)三元组比较中,ICDN 在 63%以上的情况下实现了更低的 MAE 和 RMSE,表明神经需求表面对观测噪声的过拟合程度更低。

  • 自身价格弹性稳定性:Bootstrap 重采样显示 ICDN 的自身弹性置信区间更窄(中位宽度 1.018 vs. 2.683),标准差更低,且 100%的弹性为负值,符合先验。在时序折间,ICDN 的跨折标准差也显著更小(82.7%的序列更稳定),表现出优异的可复现性。

  • 交叉价格弹性:ICDN 的交叉弹性估计同样更稳定(79.8%的配对有更窄 Bootstrap 置信区间)。值得注意的是,ICDN 的中位交叉弹性为 0.302(解释为替代效应),而基准为-0.260(似互补效应),且 ICDN 中 91%的配对为正,更契合同品类啤酒的替代预期。交叉弹性符号一致性较低(39.9%),揭示了此类效应估计的内在困难。

总体而言,ICDN 在保持更好预测能力的同时,产出了更稳定且经济上更可信的弹性估计,尤其改善了弱识别的交叉价格效应。

实践应用建议与未来方向

ICDN 为零售场景下的动态定价、促销模拟和收益优化提供了实用工具。其显式的对数需求表示使得我们可以对任意价格向量进行需求预测,并直接导出局部弹性,用于:

  • 情景模拟:设定不同价格组合,观察需求变化。
  • 价格优化:将模型嵌入梯度驱动或约束优化框架,寻找利润或收入最大化的价格。由于弹性解析可得,梯度信息准确且可扩展。
  • 弹性监控与诊断:可实时追踪产品弹性分布,识别异常值或结构突变,辅助定价策略校准。

在实践中部署 ICDN 时,建议:

  • 谨慎处理价格缺失和产品可用性,使用完善的补全和掩码机制。
  • 根据具体品类的弹性先验调整弹性带范围。
  • 采用分阶段训练(先线性热身再全非线性)以稳定收敛。
  • 将稀疏邻居选择与业务知识(如品类、品牌)结合,可启用基于品类的候选优先级。

未来研究方向包括:

  • 因果推断的整合:当前弹性为预测导数,而非因果效应。可结合工具变量、双重机器学习等方法提升解释力。
  • 端到端优化:直接基于 ICDN 的可微需求表面构建定价优化问题,并利用神经网络的可导性进行端到端学习。
  • 更大规模验证:将模型推广至更多品类和连锁零售商。
  • 扩展至零销量和缺货:当前模型仅处理正销量观测,未来可结合计量选择模型处理角点解。

总结与展望

本文提出的 ICDN 模型重新审视了需求建模与弹性估计的关系,通过“需求优先”的原则确保了弹性的数学可积性,并利用精心设计的神经网络结构兼顾灵活性与经济解释。实验表明,该方法在预测精度、弹性稳定性和经济一致性上均优于传统双对数基准,尤其为弱识别的交叉效应提供了更稳定的估计。ICDN 展示了可微需求表面在零售分析中的巨大潜力,为下一代可解释、可优化的神经网络定价系统奠定了坚实基础。未来,随着结构化经济模型与深度学习的进一步融合,此类方法有望在更广泛的商业决策支持中发挥核心作用。