当前位置: 爱股网 > 股票新闻 > 正文

【华安证券·金融工程】专题报告:因子溢价如何随时间变化?——来自一个世纪数据的证据

时间:2025年10月31日 08:01

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:华安证券研究)

主要观点

本篇是学海拾珠系列第二百五十三篇。本文探讨了因子溢价的时序变化规律及其可预测性。研究发现,这些因子的无条件溢价在长期维度下表现稳健,但其风险调整后收益存在显著时变性。这种时变性部分源于原始研究中的过拟合偏差,但并未发现套利活动对因子溢价的系统性影响,且因子收益未表现出对宏观经济变量的稳健暴露。此外,虽然证据表明存在显著但适度的动态溢价,但难以从中获利。最优择时组合在考虑现实世界的实施成本后,只能产生微小的利润。因此,投资者应谨慎对待通过战术性因子择时来偏离对这些因子的长期静态配置。

因子溢价的时序驱动机制

本文基于跨越近一个世纪、覆盖六大资产类别(股票、债券、货币、大宗商品等)的数据集,检验了价值、动量、利差和防御四大因子溢价的时序特性。研究发现,因子溢价的无条件成分在长期维度下表现稳健,但其风险调整后收益(夏普比率)存在显著时变性。关于时变性的来源,研究通过样本划分方法(将数据分为原始样本期、前样本期和发表后期)排除了两类非经济驱动因素:原始样本中存在过拟合证据,表现为样本外有效性下降,但这并非时变性的主要来源。几乎没有发现套利活动对因子溢价产生系统性影响的证据。此外,研究广泛检验了宏观经济变量对因子回报的暴露。尽管样本长度和经济事件广度提供了高统计效力,但未发现因子回报对宏观经济因素存在稳健的同期或预测性关系。

因子择时策略的实践效果

在择时策略检验中,使用全样本参数估计的择时策略(无法实时实施)能产生较高收益,如信息比率达 0.89,使复合组合夏普比率从 1.48 提升至 1.73,择时权重占 37.7%。但这仅代表理论上限。在样本外估计参数时,择时策略效果大幅减弱。最佳信号(如估值利差和波动率倒数)仅将夏普比率从 1.48 微升至 1.51。

文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。

1

引言

尽管有大量的资产定价理论文献支持动态模型,但大多数实证研究都集中在捕捉资产价格横截面差异的无条件因子溢价上,而对这类溢价如何随时间变化的研究则少得多。由于先前研究使用的时间序列数据有限,且倾向于仅关注美国股票,识别和检验条件性回报溢价模型尤其具有挑战性。本文利用跨越近一个世纪、涵盖六个不同资产类别的独特数据,研究因子溢价存在多大的变化。更长、更广的样本在统计上和经济上为识别条件性预期回报提供了优势,为检测因子溢价的变化提供了更有力的检验。作者研究了四个多空因子,它们捕捉了多个资产类别中回报的横截面变化,在世纪数据中是可测量的,并且是实证资产定价模型中最常见的:价值、动量、利差和防御。尽管文献中已经涌现出数百个因子,主要用于解释美国股票回报的横截面差异,但许多因子由于统计支持薄弱且缺乏稳健的样本外证据而受到质疑(Harvey, Liu, and Zhu (2016), Melean and Pontiff (2016), Hou, Xue, and Zhang (2017))。本文重点关注的少数几个重要因子在许多资产市场中具有强大的样本内和样本外支持,并且通常被量化投资者使用(Asness et al. (2015))。它们无条件回报溢价的稳健性,是这些因子仍然是大多数学术和实践界资产定价研究核心的原因。然而,关于因子溢价随时间变化的情况知之甚少,作者在本研究中使用广泛的数据集对此进行了评估。首先,作者发现了风险调整后回报存在显著变化的证据,这是由因子回报水平保持相对稳定驱动的,尽管风险具有高度时间变化性。其次,我们试图理解这种变化的经济驱动因素。作者首先排除了虚假或非经济来源的变化,例如原始研究中数据挖掘导致的过拟合,这使我们更加确信本文所识别的因子在样本外持续存在的可能性。具体来说,利用跨越六个资产类别的额外五十年的样本外证据,作者采用了一种新颖的过拟合偏差检验方法,将每个因子的样本分为三个子时期:因子被发现的原始样本期、原始样本期开始日期之前的时期、以及因子发现后的发表后期。这种划分将数据挖掘的影响与因子溢价时间变化的另一个潜在来源——套利者的知情交易(Schwert (2003), Mclean and Pontiff (2016))——分离开来。后一种效应也具有重要的投资意义,可能导致令人失望的业绩以及与这些策略相关的更高风险和交易成本(Alquist, Jiang, and Moskowitz (2019))。本文发现了与原始样本中过拟合一致的证据,但几乎没有证据表明套利活动改变了因子溢价。此外,与数据挖掘或套利活动无关的显著因子溢价变化仍然存在。为了研究因子溢价的额外变化来源,本文试图通过援引各种产生预期回报动态的模型,将因子变化与经济来源联系起来。跨越许多资产市场的长时间序列为衡量经济冲击和事件提供了更好的机会。作者从各种资产定价理论中汲取灵感,对经济暴露进行了广泛搜索,考察了与商业周期、增长和货币政策相关的宏观经济变量(Breeden (1979), Campbell and Cochrane (1999), Lettau and Ludvigson (2001), Bansal and Yaron (2004), Lettau and Ludvigson (2009), Greenwald, Lettau, and Ludvigson (2014), Tsai and Wachter (2015), Gabaix (2012))。Chen, Roll, and Ross (1986) 表明其中一些变量能够捕捉股票回报的变化。作者还考察了政治不确定性(Baker, Bloom, and Davis (2016), Caldara and Iocoviello (2018))、波动率风险、下行风险、尾部风险和崩盘风险(Brunnermeier, Nagel, and Pedersen (2008), Lettau, Maggiori, and Weber (2014), Jiang and Kelly (2014))、流动性风险(Pastor and Stambaugh (2003), Acharya and Pedersen (2005))以及投资者情绪(Baker and Wurgler (2008))。额外的50年经济事件和资产的广度提高了检验的效力。然而,作者未能发现因子回报对经济活动或新闻的显著暴露,尽管本文发现因子的风险和相关结构与经济环境存在一些变化。这一证据挑战了许多试图解释这些因子回报的宏观资产定价模型(Gomes, Kogan, and Zhang (2003), Carlson, Fisher, and Giammarino (2004), Zhang (2005), and Hou, Xue, and Zhang (2015), Lettau and Wachter (2007), Gormsen and Lazarus (2019)),并表明其他变化来源(例如,行为模型)可能在驱动因子风险调整后回报的动态变化。最后,为了回答在实践中能捕捉到多少风险调整后因子回报的时间变化,作者考察了文献中提出的大量因子择时方法。尽管文献主要集中于将这些方法仅应用于股票因子,但本文也探讨了相同的条件信息是否也能预测货币、债券和大宗商品中的因子回报。作者采用广泛的方法,研究了近十二种择时信号,使用多种方法应用于所有六个资产类别和四个因子。作者专注于可实施投资策略的回报,这样做的好处是使不同的模型和方法易于比较,并提供经济规模上的度量。本文评估了因子择时对于多元化静态因子组合的边际收益,以量化择时对实际因子投资模型的经济影响。然而,这次全面搜索的结果为因子择时提供了相当微弱且不一致的证据。最一致的结果来自于使用估值利差(valuation spreads)和波动率倒数(inverse volatility)来对因子进行择时,这支持了文献中关于股票因子的其他发现(Asness, Friedman, Krall, and Liew (2000), Cohen, Polk, and Vuolteenaho (2003), and Moreira and Muir (2017)),并且与理论一致。作者还发现,对择时模型施加来自理论的经济约束(例如,Campbell and Thompson (2007))能进一步提高样本外可预测性。然而,尽管这些结果在统计上是显著的,但它们的经济影响是有限的,尤其是在考虑了现实世界的实施成本之后。本文的其余部分组织如下。第一部分描述了本文的数据、因子构建方法以及因子随时间变化的汇总统计量。第二部分将样本划分为样本前、原始样本和样本后时期,以检验数据挖掘偏差和套利活动对因子回报变化的影响。第三部分试图将因子的时间变化与理论驱动的经济来源联系起来。第四部分使用带有各种条件信息和方法的择时模型分析条件性因子回报溢价。第五部分是全文总结。

2

数据、因子构建与汇总统计量

2.1 数据

作者收集了最早可追溯至1877年2月的月度资产回报和经济基本面数据,但数据序列从1926年开始,以确保资产类别覆盖足够广泛。主要数据来源是Global Financial Data,并辅以Bloomberg和DataStream。数据涵盖股票指数、政府债券、货币和大宗商品。作者还研究了来自证券价格研究中心(CRSP)的美国个股近一个世纪的回报,并添加了从1984年开始来自World scope的21个国际市场的个股回报数据。个股样本涵盖每个市场总市值的90%,因此排除了最小的股票。从1926年开始报告回测结果,当时CRSP数据首次可用于个股。与仅关注美国股票的典型研究相比,本文的分析受益于更广泛的资产和证券横截面信息,并且使用了比以前研究长得多的股票以外资产的时间序列。本文的样本包含来自23个国家的股票指数、13个国家的政府债券、20种汇率和30种大宗商品。

2.2 因子定义

作者在每个资产类别内构建横截面的价值、动量、利差和防御因子投资组合,使用最简单、记录最完善的度量方法以减少数据挖掘的担忧。

价值(Value)。遵循文献中使用的简单价值度量方法,以捕捉资产类别内相对于基本面的“便宜”和“昂贵”证券。作者不做限定性声明,说明资产“便宜”是由于风险还是因为错误定价。此处的“便宜”(“昂贵”)仅指相对于某个基本面指标价格较低(高),或者等价地,预期回报较高(低)。对于个股,作者使用Fama and French(1992,2012)的账面市值比。对于全球股票指数,我们使用聚合的10年周期调整市盈率CAPE(指数中所有成分股的市值加权平均市盈率)。对于全球债券,使用10年期实际债券收益率(Brooks and Moskowitz(2018)),即名义收益率与预期通胀之差,使用3年滚动消费者价格指数作为通胀预期的代理变量。对于货币,使用偏离购买力平价(PPP)汇率的程度,数据来自佩恩世界表(Penn World Tables),并辅以经合组织(OECD)数据库和报告的通胀指数,对于大宗商品,使用现货价格五年变化的负值,这受到DeBondt and Thaler(1985)、Fama and French(1996)以及Asness, Moskowitz,and Pedersen(2013)的启发。

动量(Momentum)。在所有资产类别中使用统一的动量度量:资产过去12个月的累计超额现金回报,遵循Jegadeesh and Titman (1993)。因子投资组合跳过了最近一个月的回报,以避免任何可能引起负的短期自相关的微观结构效应,例如买卖价差反弹。

利差(Carry)。按照Koijen, Moskowitz, Pedersen, and Vrugt(2018)的方法定义利差,即假设市场条件不变时资产的预期回报。对于股票指数,利差是近月合约的期货对现货贴水;在1990年之前有期货贴水数据可用时,使用超额现金股息率。对于全球货币,利差是两国之间的短期利率差(3个月LIBOR利率或最接近的3个月等效无担保贷款利率之差)。对于债券,利差是十年期期限利差(10年期收益率减去3个月利率)。对于商品期货,利差是假设期货曲线不变时持有期货合约的回报,通过最近月和次近月合约之间的价格百分比差异来衡量。作者不构建个股的利差策略,因为在这里利差和价值几乎相同,而且没有单个股票的期货。

防御(Defensive)。使用资产相对于其本地市场指数的(负)贝塔,遵循Frazzini and Pedersen (2013)。对于全球股票指数和债券,贝塔是通过对资产回报与所有国家指数(或债券)的等权回报进行36个月滚动回归来估计的。作者不构建货币的防御策略,因为没有逻辑上的市场指数。作者不构建大宗商品的防御策略,因为不同大宗商品的回报没有共同的市场成分。

2.3 因子投资组合构建

作者使用上述定义的各自的价值、动量和利差特征,为每个资产类别构建零成本、做多一美元和做空一美元的因子投资组合。对于防御因子,构建恒定的零贝塔(做多一单位贝塔,做空一单位贝塔)投资组合,这些组合不是零成本的,因为多头(低贝塔)的美元名义本金需要高于空头(高贝塔)才能保持贝塔中性。这种方法与文献一致,例如 Frazzini and Pedersen (2013) 的赌Against贝塔(BAB)因子。

对于每个在时间t具有特征slt∈(价值,动量,利差,防御)的证券i,首先根据该特征对证券进行排序,并根据每个证券在资产类别内的横截面去均值化排名分配权重,权重之和为零。具体来说,证券i在时间t的权重为:

其中,包含一个缩放因子 ct,使得整个投资组合缩放为美元中性的多空组合,但在防御因子的情况下除外,作者为策略的多头和空头使用单独的常数,使得最终的投资组合是贝塔中性的。投资组合的回报为:

最后,通过按每个资产类别的标准差倒数(使用过去36个月的回报估计)加权,将跨资产类别的因子投资组合结合起来。投资组合构建和加权方案遵循 Moskowitz, Ooi, and Pedersen (2012)、Asness, Moskowitz, and Pedersen (2013) 以及 Asness, Ilmanen, Israel, and Moskowitz (2015)。

2.4 一个世纪的汇总统计量

表1报告了按资产类别划分的过去一个世纪因子投资组合回报的汇总统计量。每个资产类别中每个因子的溢价均为正,并且大多数在统计上是显著的。价值、动量、利差和防御因子应用于所有资产类别时的夏普比率分别为0.53、0.64、0.57和0.68。股票选择中的夏普比率通常比其他资产类别中的更大,这是由于个股的广度更大导致更好的分散化收益,或者可能是原始美国股票样本中因子定义过拟合的结果。当跨资产类别汇总时,均值回报的t统计量从价值的5.1到防御的超过6.6,轻松拒绝了因子未被补偿的零假设。结合所有四个因子跨资产类别的多因子组合的夏普比率为 1.46,t 统计量为 14.2,表明结合不同因子和不同资产类别带来了巨大的分散化收益。本文采用的更广泛且长达一个世纪之久的数据集,包含了相对于原始研究有意义的样本外证据,展示了这些资产定价因子存在正回报溢价的压倒性证据,并严重质疑这些因子是数据挖掘的结果。14.2 的 t 统计量需要超过一万亿次随机搜索才能纯粹偶然产生——这是极不可能的数据挖掘工作。

2.5 时变因子溢价

图1按十年期绘制了每个资产类别中每个因子的夏普比率。每个因子在大多数十年期内的溢价都是正的,只有少数几个因子出现了持续十年的表现不佳。溢价似乎随时间基本稳定,跨十年的变化很小,下面通过适当的统计检验正式确认了这一结果。多因子组合在几十年间表现出更加稳定的溢价,因子的多资产版本也相当稳定。最后,最后一个图中突出显示了多因子、多资产组合,它在上个世纪的各个十年中都表现出一致的强劲表现。

一个世纪的数据在检测时变溢价方面具有更强的效力。作者使用(资产定价)无模型统计检验正式检验了因子溢价和风险随时间的变化。在样本中,20个因子-资产类别组合中的8个以及7个多因子组合中的4个,可以拒绝其均值在几十年间保持不变的假设。观察每个因子的多资产版本,利差和防御因子各自在几十年间表现出显著的均值变化,而价值和动量则未能显示出显著的时间变化。作为比较,对股票市场组合进行相同的检验,不能拒绝股权溢价在过去一个世纪中均值保持不变的假设。因此,尽管大多数关于检测时变预期回报的文献都集中在股权溢价上,但研究的因子溢价存在更稳健的随时间回报变化的证据。结果表明,因子溢价存在适度的时间变化,并且我们的数据似乎提供了足够的效力来检测它。这对投资的影响是显而易见的,因为因子溢价的变化会随时间扭曲回报预期。问题仍然是这种变化是否可预测,以及可能是什么驱动了它。

作者还分析了因子投资组合风险的时间变化。对这些因子投资组合方差的结构性断点检验(表B3,面板B)表明,所有因子(以及市场)的方差随时间变化的证据充分。这一点,加上随时间变化的回报,意味着因子夏普比率存在显著的时间变化。这种变化不仅与试图获取这些溢价的从业者明显相关,而且为检验各种动态资产定价理论以试图理解这种变化的来源提供了新的观察数据。

最后,将注意力转向跨所有因子分散化的多因子组合,该组合的均值回报变化的证据较为有限,但风险变化的证据仍然稳健。这一发现表明,即使对于跨因子分散化的组合,单位风险的回报也随时间显著变化。跨因子分散化并不能完全缓解每个因子风险随时间的变化。附录B中的图B1使用从1936年到2020年过去10年的滚动月度回报数据,绘制了因子之间(跨所有资产类别)的成对相关性的时间序列。图表表明因子之间的相关性随时间变化,这也导致了多因子组合风险的变化。然而,没有出现相关性都变得足够大以至于严重降低分散化收益的时期,并且相关性也没有明显的上升趋势,正如一些人推测的那样。

3

过拟合与知情交易

分析因子回报的时间变化的一个明显起点是样本外可能存在的衰减,正如 (Schwert (2003), Harvey, Liu, and Zhu (2016), Melean and Pontiff (2016), and Hou, Xue, and Zhang (2018)) 所分析的那样。除了确认这一结果外,作者还试图区分因子回报时间变化背后的两种解释——由于发现因子的原始样本的数据挖掘导致的过拟合,以及因子发现后知情交易者的套利活动导致的随时间衰减。本文冗长的数据集提供了更丰富的比较和更令人信服的检验,以补充其他研究的发现。

Melean and Pontiff (2016) 在考察97个美国股票异象时,将每个异象的样本期划分为样本内、样本后和发表后子时期。他们发现样本后表现下降了26%,发表后平均回报下降了58%。由于样本后和发表后子时期在很大程度上重叠,他们将26%的下降归因于过拟合,而额外的32%下降归因于发表后的知情交易。这项研究的一个潜在担忧是时间周期相对较短(特别是数据样本结束与研究发表之间的时期)。

本文长达一个世纪的数据使我们能够以一种新颖的方式扩展和改进这一结果;作者能够额外探索因子在发现之前、早于原始数据样本开始日期的“样本前”有效性证据。这种分析特别有助于区分数据挖掘偏差和知情交易,因为在原始样本甚至开始之前的样本期,当时的交易者不可能知道(至少不是广泛知道)这些因子。因此,比较样本前证据与原始样本证据提供了对过拟合偏差的清晰检验,不受套利活动的影响,而比较样本后证据与原始样本证据则同时衡量了数据挖掘和知情交易。因此,观察样本后证据与样本前证据之间的差异应该是对知情交易影响的无偏估计。至关重要的是,样本的长度提供了大量的观察值,以产生具有足够统计效力的结果来进行推断。这些结果对实际投资很重要,因为过拟合意味着对因子溢价的样本外预期较弱,而知情交易意味着因子溢价将随着套利活动的成本和难易程度而变化。

对于每个因子,将样本分为三个子时期:因子被发现的原始样本期、包含原始样本期开始之前数据的样本前期、以及原始研究发表后的后期。遵循该文献中的惯例,根据发现这些因子的最著名引用的论文来定义每个因子的原始样本期。对于货币,没有样本前期,因为在1973年之前汇率在布雷顿森林体系下是锚定的。作为另一个样本外检验,作者还将因子在最初被发现资产类别中的有效性与它们在其他资产类别中的表现进行比较。这些因子最初都是在美国股票中发现的,除了利差因子是在货币中发现的。对于其他资产类别中的因子子时期,作者使用与原始研究相同的日期,因为大多数关于其他资产类别中因子的研究都相对较近(Asness, Moskowitz, and Pedersen (2013) 和 Asness, Ilmanen, Israel, and Moskowitz (2015)),并且一旦一个因子在一个市场中被发现,有理由相信从业者会在相同或接近的时间将其应用于其他市场和资产类别。

3.1 样本内与样本外结果

表II报告了每个因子在各自样本前、原始样本和样本后时期按资产类别的年化夏普比率。因子回报通过其过去36个月估计的标准差进行标准化,以考虑波动率随时间的变化,并在单位风险基础上比较溢价,以便在不同波动率的资产类别之间进行比较。夏普比率也与经济模型有理论联系(Hansen and Jagannathan (1991))。

作者报告了原始样本期与样本前和样本后时期平均值之间的差异,以及该差异是否在统计上显著异于零的 t 统计量,以检验样本外表现差异。作者还报告了因子在原始样本期的表现与其样本前表现之间的差异,作为去除知情交易潜在影响的过拟合检验。

面板A报告了价值因子的结果。对于美国股票,价值因子在原始样本期的表现优于样本前或样本后时期,与过拟合偏差一致,尽管差异在统计上不显著。在美国股票的样本前期,价值因子仍然有相当大的正夏普比率,表明价值溢价并非完全由纯粹的虚假数据挖掘驱动,尽管在样本后期夏普比率为负。观察其他资产类别,国际股票和货币的样本外时期的表现基本上与原始样本相当(这两个资产类别没有样本前期)。对于其余资产类别,原始样本期的表现也优于样本外时期。在所有资产类别中,正式检验拒绝了价值因子夏普比率在原始样本期与样本外时期相同的假设(p值为0.000),夏普比率平均下降了49%。这一下降甚至比 McLean and Pontiff (2016) 在短得多的样本期内对股票价值因子的发现还要大。

更有趣的是,接下来转向原始样本期与样本前期之间的差异:这是本文新颖且更清晰的数据挖掘偏差检验,因为它排除了套利活动的任何影响。作者看到所有资产类别都存在衰减,拒绝了表现无差异的 F 检验,支持了过拟合的说法。然而,相反地,当比较每个资产类别中价值因子的夏普比率与它最初被发现的资产类别(美国股票)中的夏普比率时,其他资产类别显示出相似或更好的表现,这表明价值因子并未针对美国股票过拟合。

在面板B中重复对动量因子的分析,作者也发现动量的样本外表现较弱(大约差23%),但差异不显著,因为未能拒绝样本内和样本外表现相同的 F 检验(p值 = 0.094)。相对于动量的原始资产类别(美国股票),其他资产类别产生的动量利润大约只有一半。对于利差因子(面板C),样本外表现大约是原始样本的四分之三,并且未能拒绝表现相等的 F 检验(p值为0.243)。对于货币(利差因子最初被发现的资产类别),样本后的利差表现大于原始样本表现,并且货币之外的平均利差表现几乎是其两倍,这表明利差因子并未针对货币过拟合。面板D报告了防御因子的结果。在这里,防御因子的样本外表现在每个资产类别中都等于或大于原始样本,这与过拟合偏差不一致。然而,防御策略在个股(它们最初被发现的地方)确实表现更好。

面板E显示了每个资产类别中多元化多因子组合的结果。在此定义子时期划分很棘手,因为不同的因子有不同的发现样本期,并且为了进行有意义的比较,所有四个因子都应在每个子时期存在于组合中。取原始样本期的并集(1960年至2009年)或交集(1973年至1981年)各有利弊,因为前者样本可能太长,包含了因子发现前后,而后者样本太短,缺少大多数因子的原始样本的重要部分。作为折衷,将多因子组合的“原始”样本内时期定义为1960年至1990年,这覆盖了所有因子的大部分样本内时期,但请注意这个定义并不完美,因此对多因子组合结果的解释不太明确。尽管如此,结果反映了本文发现的总结,样本外夏普比率降低了18%,且在统计上显著(p值 = 0.000)。

总体而言,作者发现了因子溢价稳健的样本外证据,拒绝了它们是虚假数据挖掘结果的假设,但发现过拟合偏差可能导致这些因子样本外有效性的显著下降。

3.2 由套利活动引起的变化?

接下来,作者转向评估套利者的知情交易是否导致了因子回报随时间的变化。为了控制过拟合的混杂效应,本文考察了样本后时期与样本前期之间因子表现的差异,后者不应受到套利活动的影响。

表II的面板A显示,美国股票、股票指数和固定收益中的价值因子在样本前期的表现优于样本后期,这与知情交易导致价值衰减一致,尽管差异不显著。然而,对于大宗商品中的价值因子,样本后期的表现优于样本前期。并且,在国际股票和货币(没有样本前期)中,价值因子的样本后表现与原始样本一样大。这些结果与套利活动或知情交易降低发表后价值溢价的观点不一致。正式检验样本后表现是否与样本前表现相同的假设未能被拒绝(p值为0.764)。

面板B同样没有发现动量在样本后期相对于样本前期更弱的证据,这对知情套利活动压低动量表现的观点提出了挑战。动量样本前和样本后表现之间的差异与零无异(p值 = 0.696)。面板C同样显示利差没有样本后与样本前的表现差异(p值 = 0.313),而防御因子(面板D)的样本后表现实际上大于样本前证据,进一步挑战了套利说法。对于多因子组合(面板E),样本前与样本后表现没有差异(p值 = 0.834)。结果不支持知情交易影响这些因子的有效性或导致因子回报的时间变化。

与Mclean and Pontiff (2016) 相反,作者几乎没有发现这些因子在发表后受到知情交易影响的证据。然而,作者承认,检测套利资金涌入一个因子及其对价格影响的能力是具有挑战性的(Alquist, Jiang, and Moskowitz (2019)),而且样本和检验与Mclean and Pontiff (2016) 截然不同,后者仅研究了1963年至2014年间美国股票中的97个因子。尽管如此,本文提供了一种替代性的检验方法,用于检测因知情交易导致的因子回报衰减,这种方法具有更强的统计效力,但在数据中并未显示出太多支持。本文的发现至少软化了套利活动导致因子回报溢价减少的结论,因为我们在各种因子、资产类别和时间段内都没有找到证据。

发表后套利活动增加的另一个影响是由于交易带来的价格压力导致的超额相关性(Lou and Polk (2015), Alquist, Jiang, and Moskowitz (2019))。变化的相关性也可以提供对数据挖掘的另一种检验,因为 Linnainmaa and Roberts (2018) 认为数据窥探偏差会人为降低样本内因子的相关性。为了检验这些影响,作者检查了样本前、原始样本和样本后时期的相关性。

过拟合意味着给定因子在跨资产类别上的样本外相关性较弱,而知情交易意味着因子之间以及跨资产类别的相关性在发现后更强。

图2绘制了因子之间和跨因子相关性的时间变化。各子时期的相关性变化很小。在第一张图中,因子之间的相关性在样本外时期并不比原始样本中高。此外,没有证据表明因子之间的相关性在因子发现后更高,正如套利活动增加所暗示的那样。在第二张图中,作者也没有发现给定因子在跨资产类别上的相关性在发现后更高的证据。因此,无论是跨因子还是跨资产类别的分散化收益,在样本前与样本后时期似乎都没有差异。证据与套利活动对因子产生有意义影响的观点不一致。

4

宏观经济暴露

鉴于作者在第一章节发现单位风险因子回报溢价存在变化,并且过拟合和知情交易只能解释其中一部分,在这一章节中考虑可能驱动这些动态的其他变化来源。本文考察了由各种资产定价理论激发的各种经济冲击和新闻。过去试图将因子与经济风险联系起来的尝试由于时间序列的有限而被证明具有挑战性。更长、更广的样本提供了额外50年跨越不同市场的经济事件,有助于识别这些关系并在样本外检验先前记录的关系。资产类别的广度也有助于减少可能模糊这些关系的噪音。这项检验还使用大量新颖数据,为动态资产定价理论(Merton (1973))提供了更有力的检验。

4.1 因子回报暴露

表III报告了将每个因子过去一个世纪的回报对多种经济指标进行时间序列回归的结果。考察的第一个变量是来自 Amihud (2002) 和 Acharya and Pedersen (2005) 的流动性风险度量。Pastor and Stambaugh (2003) 和 Sadka (2006) 表明个股动量暴露于流动性风险,而 Asness, Moskowitz, and Pedersen (2013) 显示一些证据表明所有资产类别的价值和动量对流动性冲击的暴露方向相反。考察的第二个变量是 Baker and Wurgler (2008) 的情绪指数,Baker and Wurgler (2008) 表明该指数解释了价值、动量和其他股票因子回报随时间的变化。本文还包括股票市场波动率(全球股票组合过去36个月的实际波动率)作为市场套利成本和不确定性的代理变量。

为了试图将因子回报与宏观经济模型(Breeden (1979), Campbell and Cochrane (1999), Lettau and Ludvigson (2001), Bansal and Yaron (2004), Lettau and Ludvigson (2009), Lewellen et al. (2010), Greenwald, Lettau, and Ludvigson (2014))联系起来,本文考察了宏观经济活动的度量指标。考察宏观变量的一个问题是,关于因子应如何与宏观经济相互作用,几乎没有理论指导。虽然宏观经济变量与仅做多资产类别(如股票和债券市场)有直观联系,但它们对多空因子的影响并不明显。一些研究将价值因子与长期消费增长联系起来(Parker and Julliard (2005), Hansen, Heaton, and Li (2008), and Malloy, Moskowitz, and Vissing-Jorgensen (2009)),而其他研究则将价值和防御因子与可能和利率制度相关的贴现率敏感性联系起来(Lettau and Wachter (2007), Gormsen and Lazarus (2019))。基于投资的理论(Cochrane (1991, 1996), Gomes, Kogan, and Zhang (2003), Carlson, Fisher, and Gianmarino (2004), Zhang (2005), Xing (2008), Li, Livdan, and Zhang (2009), Liu, Whited, and Zhang (2009), Belo (2010), Li and Zhang (2010), Cooper and Priestly (2011), Liu and Zhang (2014), and Hou, Xue, and Zhang (2015))将资产定价因子与影响公司投资的经济冲击联系起来,这些冲击可能与商业周期、利率、增长甚至政治不确定性有关。例如,Berk, Green, and Naik (1999) 和 Johnson (2002) 将动量与公司的增长期权联系起来。Hou, Xue, and Zhang (2015) 将价值、动量和质量因子与投资联系起来。然而,一些理论做出了更明确的预测。例如,Lettau and Wachter (2007) 和 Gormsen and Lazarus (2019) 的基于久期的资产定价理论认为,价值因子(往往具有较短的现金流久期)对贴现率冲击敏感,因此在其他条件相同的情况下,更易受到货币政策宽松的影响。罕见灾难理论(Tsai and Wachter (2015), Gabaix (2012))和下行风险理论(Lettau, Maggiori, and Weber (2014))假定因子回报随尾部事件而下降,预期回报随尾部事件概率上升。

相同因子溢价在股票以外的其他资产类别中存在,这对许多以股票为中心的理论模型提出了挑战。鉴于有大量理论将因子回报与宏观变量联系起来,但缺乏将宏观变量与其他资产类别中因子溢价联系起来的理论,作者开始对跨资产类别的因子对一系列宏观经济变量的暴露进行实证探索。

使用全球GDP增长率(过去一年的实际增长率,在美国、英国、德国和日本平均)和全球CPI通胀率(过去一年的通胀率,在美国、英国、德国和日本平均),这是 Chen, Roll, and Ross (1986) 发现对股票回报很重要的两个变量。作者使用一个二元指标来代理尾部事件,如果发达股票市场回报处于其历史回报分布的最低五分之一分位,则该指标等于1,否则为零。遵循 Baker, Bloom, and Davis (2016) 和 Caldara and Iocoviello (2018) 的方法,使用来自policyuncertainty的地缘政治不确定性风险指数。为了捕捉利率环境,考察实际利率(3个月短期利率减去预期通胀,后者是3年通胀移动平均值)的水平值和一年变化,以及收益率曲线斜率(10年期利率减去3个月无风险利率)的水平值和一年变化。为了捕捉商业周期变化,根据每季度的年度GDP增长率将时期划分为正增长和负增长,并根据每季度同比GDP增长率的变化将时期定义为“加速”和“减速”增长。这些指标的交集创建了四个子时期:收缩(负增长且增长变化为负)、复苏(负增长但增长变化为正)、扩张(正增长且增长变化为正)和放缓(正增长但增长变化为负)。体制转换由GDP增长或GDP增长变化基于10年滚动历史窗口移动至少+/-1个标准差触发,以避免体制间频繁切换。与NBER的衰退和扩张日期不同,这些子时期仅基于事前信息确定。

一些宏观经济变量的一个重要方面是它们的时机。许多宏观经济变量是在其相关的实际季度或月份之后宣布和报告的。例如,第二季度GDP的初步估计只在同年的7月(第三季度)公布。这就产生了一个问题:是应该将第二季度的金融回报与第二季度的GDP数据(反映了当时的实际GDP增长)匹配,还是应该将第三季度的金融回报与第二季度的GDP数据匹配,因为市场只在第三季度才了解到第二季度的增长。第一种选择衡量回报与实际经济活动之间的关系。第二种选择衡量回报与经济活动新闻之间的关系,市场后来才知道这些新闻。对两者都进行了考察。表III的面板A考察了因子回报与经济活动之间的同期关系,面板B将所有变量滞后一期以捕捉新闻效应。

表III面板A的第一列报告了价值因子在所有资产类别中的结果。价值因子对流动性风险、Baker and Wurgler (2008) 情绪指数和经济放缓指标呈显著正暴露,这与 Asness, Moskowitz, and Pedersen (2013) 和 Baker and Wurgler (2008) 在较短样本期内的发现大体一致。然而,在考虑了多重比较后,这些系数均不具有统计显著性。对于动量因子,没有任何变量是显著的。类似地,利差回报与任何变量都没有同期关系。防御因子与价值因子类似,在流动性风险和情绪高时回报更高。此外,实际利率的一年变化对防御策略有正向影响,而尾部风险、通胀和商业周期扩张对防御策略有负向影响,这是直观的。然而,在考虑了多重检验后,只有情绪是显著的。几乎没有发现因子以久期模型(Lettau and Wachter (2007), Gormsen and Lazarus (2019))所声称的方式随利率环境变化的证据。

表III的面板B使用相同的自变量但额外滞后一期(可以是一个月或一个季度,取决于变量的频率)进行回归检验。对于某些变量,如流动性风险、波动率和情绪,滞后变量代表“新闻”,因为它是投资者可以实时获得的关于这些变量的最新信息。对于许多宏观经济变量,滞后确保了实际新闻在投资组合形成日期之前已经发布。这些变量上的系数代表预测关系。经济新闻预测因子回报的证据与同期活动一样弱,R方较低且系数不显著。

总体而言,几乎没有证据表明因子回报与宏观经济变量存在有意义的同期或预测性变化。尽管长而广的样本提供了丰富的宏观经济事件和增加的统计效力,但并未发现多空因子有太多的宏观经济暴露。这些结果与 Griffin, Ji, and Martin (2003)、Asness, Moskowitz, and Pedersen (2013) 以及 Herskovic, Moreira, and Muir (2019) 的研究基本一致,而与那些考察历史短得多且仅限股票因子的其他研究(Chordia and Shivakumar (2005), Hodges, Hogan, Peterson, and Ang (2017))不一致。因子投资似乎并未受到影响一般股票和债券市场的相同宏观经济风险的困扰,因此对传统资产配置策略具有分散化作用。

4.2 因子相关性

尽管宏观经济冲击似乎与因子回报无关,但它们可能与因子风险和相关性有关。图2绘制了不同经济环境下因子之间的相关性(第一张图),以及给定因子在跨资产类别上的相关性(第二张图)。第一张图绘制了在最差和最好的20%股票、债券和全球市场环境,20%最高和最低市场波动率时期,以及衰退和扩张期间因子之间的相关性。作者看到不同风格对之间的表现各异。价值与动量之间的相关性在表现最佳的市场月份为-0.66,在表现最差的市场月份为-0.41。这一结果表明,价值与动量在好时期彼此间的分散化效果更好,在坏时期则较差。相比之下,价值与利差、动量与防御在好时期的相关性高于坏时期。价值与防御、动量与利差、利差与防御之间的相关性在上涨和下跌市场中大致相同。

在高波动率和低波动率环境下也存在有趣的相关性动态。除了动量与利差、动量与防御之外,所有其他因子对在高波动率时期彼此间的分散化效果更好。最后,在比较衰退与扩张时出现了一些有趣的规律。价值与动量、价值与防御、以及动量与利差在衰退期间提供更大的分散化收益,而价值与利差、动量与防御在衰退期间彼此相关性更高。

图2中的第二张图绘制了给定因子在跨资产类别上的平均相关性。对于价值和动量因子,以及在某种程度上防御因子,在最差市场回报月份,跨资产类别的相关性较低,表明在糟糕时期跨资产类别的分散化收益更好。然而,在高波动率时期,动量和防御因子的跨资产相关性比低波动率时期强得多,而利差因子则相反。在衰退期间,价值和动量因子的跨资产相关性更高,但利差和防御因子的跨资产相关性略低。

综合考虑相关性结构中的所有这些动态,多因子组合在下跌市场、低波动率环境和扩张期中表现出略高的跨资产相关性,但差异很小。总体而言,作者没有发现宏观经济冲击对回报有太大影响,但确实发现与宏观经济体制相关的相关性和风险存在一些变化。

5

条件性因子溢价与因子择时

鉴于因子回报和风险的变化,能否找到可以预测因子风险调整后回报的条件信息?

使用条件信息的预测性检验一直是评估动态资产定价模型的主要方法(Hansen and Richard (1987))。本文试图通过因子择时策略来捕捉可预测的、随时间变化的风险调整后因子溢价。更广泛地说,本研究为大量的因子择时和条件收益文献提供了启示。既然相同的无条件因子溢价存在于不同资产类别中,那么评估类似的条件下溢价是否也存在于不同资产类别中就变得有趣了。

漫长而广泛的数据样本为检测条件下溢价和检验先前择时研究的稳健性提供了一个更强大的实验室。

择时研究通常分为三类:1)单一资产类别中的单一因子使用单一预测变量进行择时;2)单一资产类别中的多个因子使用一个或多个预测变量进行择时;3)多个资产类别中的单一因子使用相关预测变量进行择时。通过使用多种择时信号(和方法)检验多个资产类别中的多个因子,综合跨市场的因子择时,从而扩展了关于择时和收益可预测性的证据。为了评估条件因子溢价的规模并在不同预测变量和方法之间进行比较,作者基于可实施交易策略的收益来比较择时模型。这种方法有几个好处。首先,它通过样本外收益表现进行比较,使所有因子择时模型处于同等地位。其次,每单位风险暴露的收益提供了经济规模的度量。第三,收益使我们能够评估因子择时对投资者最优静态因子组合的边际效益。第四,关注投资策略的收益避免了其他择时指标(如R平方)的问题,在这些指标中,自由度、参数精度和其他统计偏差可能干扰推断(Stambaugh (1999), Boudoukh, Israel, and Richardson (2019))。投资策略的收益包含了这些问题,因为糟糕的模型估计会导致较差的样本外表现。最后,与R平方等其他指标不同,不需要为有意义的可预测性设定基准,因为任何风险调整后的交易策略的自然基准是零。

5.1 择时信号

作者从最著名的因子择时信号开始:估值利差。估值比率长期以来一直被用于预测股票市场收益,可以追溯到Fama and French (1988) 和 Campbell and Shiller (1988)。这个指标的一个自然候选者是价值指标,如总账面市值比或周期调整市盈率(CAPE),用以指示预期收益何时高或低,这可能是由时变风险溢价或投资者情绪导致的错误定价所驱动。同样的概念可以应用于多空因子,通过比较多头头寸和空头头寸的平均估值。这个差异,在文献中通常称为价值利差,可能提供关于因子条件预期收益的信息。如果因子的估值能指示时变溢价,那么预期因子的估值与未来收益之间存在正相关关系。

虽然估值利差是一个直观且重要的择时预测指标,但其他变量也被用来提供条件预期收益的信息。Gupta and Kelly (2018), Ehsani and Linnainmaa (2018) 和 Arnott 等人 (2019) 使用因子动量,即因子自身的过去收益,来对美国股票因子进行择时。另一个条件变量,其思想与估值或动量择时相似,是使用因子自身的特征利差来对因子进行择时。其思想是,当多头和空头头寸之间的特征利差特别大时,这可能是因子收益溢价预期会更大的时候。对于价值因子,“特征利差”与估值利差相同。对于其他因子,特征利差代表carry因子的carry(如 Koijen, Moskowitz, Pedersen, and Vrugt (2018)),动量因子的动量,以及防御因子的贝塔利差。

作者还考察了五年反转作为择时信号,即因子过去五年收益的负值。此外,我们按照 Moreira and Muir (2017) 的方法检验了波动率择时,使用每个因子标准差和方差的倒数作为条件信息。

作者还考察了一系列商业周期和宏观经济变量来对因子进行择时,包括GDP增长和通胀增长,以及商业周期指标。最后,添加了两个通用的市场择时变量:CAPE 和市场的滞后已实现波动率,“VIX”。

5.2 择时方法

使用择时信号构建投资组合的方法有很多。作者主要关注四种方法。第一种是简单的z得分方法,它将信号在其历史数据上标准化为均值为零、单位方差的度量(标准化也允许我们比较和组合不同的择时信号)。通过对因子在每个时间点的权重按其z得分比例增加来进行择时,z得分的符号和大小决定了做多或做空的金额。由于许多信号存在极端值,使用历史中位数和绝对中位差来定义“z得分”,并将权重上限设定在+2和-2。此外,为确保没有前视偏差,z得分是使用从样本中第一个收益观察到t-1月的扩展窗口进行估计的,要求至少10年的历史数据,然后应用于t时刻的因子收益。

第二种方法是对因子收益与滞后的择时信号进行预测性回归,以衡量它们的经验关系,并使用回归系数对因子进行择时。接下来,按照 Campbell and Thompson (2007) 的建议,对系数施加经济限制。最后,一些研究使用样本内矩来确定参数,这在实时中不能完全实施,并可能产生前视偏差。作者也考察了这种方法,以估计使用全样本参数所带来的偏差。

这项分析相当于一次大规模的模型设定搜索,旨在找到从信号中提取预测内容的最佳方式。我们总共分析了11种择时信号,跨越19种不同的设定,针对所有20个因子×资产类别的多空组合加上6个多因子和多资产组合,创建了11×19×26 = 5,434种择时策略。虽然这种搜索引发了数据挖掘的担忧,但鉴于将展示的普通的结果,其目的是评估这些弱结果的稳健性。如果大规模的择时搜索收效甚微,那么我们会更有信心地认为,缺乏强劲的结果不仅仅是运气不好,而是证明了因子择时具有挑战性。考虑到尝试的择时方法和信号的数量,任何显著的结果都必须与所进行比较的数量进行权衡,在这种情况下,对正常5%显著性水平进行Bonferroni校正后,阈值变为0.0009%。

图3报告了多因子、全资产类别组合的11种因子择时变量在四种核心择时模型设定下的结果。同时考察所有资产类别和所有因子的择时,为检测数据中的条件溢价提供了最大的灵活性和效力。由于择时策略可能会增加对静态因子的无条件贝塔(Asness, Chandra, Ilmanen, and Israel (2017) 和 Asness, Liew, Pedersen, and Thapar (2018)),将择时策略的收益对静态因子进行回归,其中的阿尔法代表了剥离掉任何无条件因子暴露后的纯粹择时收益。

跨资产类别因子价值择时的信息比率(每单位残余风险的阿尔法)在0.25到0.50之间。这一结果在方向上与 Cohen, Polk, and Vuolteenaho (2003) 以及 Asness, Friedman, Krail, and Liew (2000) 的结果一致,他们在较短的样本期内使用略微不同的方法,发现对美国股票价值因子进行估值择时具有积极效果。Baba, Boons, and Tamoni (2019) 发现价值策略的收益可以通过价值利差预测,尽管他们主要关注仅限于股票的因子。Asness, Liew, Pedersen, and Thapar (2018) 表明,“深度价值”时期(即廉价与昂贵证券之间的估值利差处于其历史极端20%分位数的时期)可以预测全球股票、股票指数期货、外汇和债券中的价值因子收益。Brooks and Moskowitz (2018) 表明价值利差可以预测全球债券组合的收益。作者在更长时期内的发现为估值择时提供了样本外证据。

图3中接下来的四个柱状图报告了因子动量(因子过去12个月的收益)的结果,其择时表现较弱。该结果在方向上与 Gupta and Kelly (2018) 和 Arnott 等人 (2019) 一致,但比他们的结果弱。本文研究与他们研究的主要区别在于:1)他们仅关注美国个股的几十个多空因子,而作者只考察四个因子,但在六个不同的资产类别中研究它们;2)在更长的时期内考察因子动量择时。

图3中的下一组结果表明,特征利差择时略弱于估值利差或动量择时,这表明利差和防御利差对于择时的用处不大。五年收益反转也没有产生任何择时利润。

Moreira and Muir (2017) 发现波动率倒数和方差倒数可以预测美国股票因子以及外汇利差因子的条件夏普比率。使用每个因子过去36个月收益的已实现波动率和方差,检验了六个资产类别中因子在整个世纪内的逆波动率择时。图3显示,简单的z得分择时模型(最接近 Moreira and Muir (2017) 使用的方法)产生了可观的择时阿尔法,信息比率分别为0.37和0.36。回归模型表现不佳,尽管对系数施加经济限制有很大帮助。当系数不受约束时,回归在样本外产生了负的择时阿尔法。这一证据表明了对择时模型施加理论限制的重要性。

下一组结果侧重于商业周期和宏观经济择时预测变量。使用前面描述的商业周期变量对因子进行择时。这里的一个问题是,理论对于这些指标应如何与未来因子收益相关联提供的指导很少。这使得基于宏观经济变量的择时特别具有挑战性,因为你必须做两个预测——首先预测宏观经济事件,其次预测因子对这些宏观经济事件的暴露程度,这对于市场中性因子来说并不明确。

鉴于缺乏关于因子应如何受宏观经济变量影响的直觉,作者无法运行简单的z得分择时方法。因此,转而关注回归方法,但同样由于这个原因,只关注那些没有经济符号限制的方法。图3显示,商业周期和增长动量指标产生了一些择时阿尔法,特别是使用全样本回归来估计系数时(考虑到前视偏差,这并不奇怪)。此外,在表III中表明,商业周期变量的样本内估计系数并不显著,并且对于给定的因子,在不同资产类别中符号会改变。当参数在样本外估计时,增长和通胀动量择时同样表现出弱得多的表现。该图凸显了使用样本内参数估计的危险,特别是对于像宏观经济指标这样在理论上不明确的变量。

最后两个择时信号,CAPE和“VIX”,旨在捕捉股票市场中变化的风险、风险厌恶或情绪。如图3所示,CAPE对因子溢价具有显著的可预测性。另一方面,VIX并未显示出任何对因子的择时能力。样本外的择时阿尔法与零没有可靠差异。

5.3 全模型择时

如果每个择时信号对预期收益都有一些独特的预测能力,并且如果信号中存在独立的信息和独立的误差,那么结合择时信号可能更有效,以更好地捕捉条件收益溢价。

本文报告了所有择时策略的等权平均值,它显示出相对于基础静态因子而言较小但为正的阿尔法。然而,整合跨择时信号信息的更好方法可能是同时考察它们,以考虑它们的相互作用和边际贡献。对于z得分方法,根据所有择时信号(不包括没有预测符号的商业周期变量)的等权平均z得分对所有资产进行排序。对于回归方法,对未来因子收益与所有十一个择时信号进行多元回归,并使用估计系数与当前变量实现值的乘积来生成每个资产类别中每个因子的预期收益预测。在某些设定下,作者还限制择时系数的符号以符合经济理论。全模型的结果显示出最一致的择时收益。样本外表现带来了信息比率为0.31的结果,且与基础静态因子正交。对系数施加经济约束略微改善了样本外表现,产生了0.32的信息比率。使用择时模型的完整样本内回归系数估计会产生0.89的信息比率,这再次凸显了使用全样本信息的危险。结果确认了显著的条件因子收益溢价的存在,当结合多种择时信号时,能更好地识别这些溢价。

5.4 因子择时的经济影响

研究结果的实际意义是什么?作者在此研究最优的因子择时组合是否具有经济意义。考虑投资者会在静态多元化因子组合上增加多少因子择时,以在样本期内最大化夏普比率。表IV报告了各种择时策略的夏普比率和信息比率(相对于基础静态因子)。作者计算了因子择时策略的最优事后择时权重,该权重当与静态多因子、多资产组合结合时,能使无条件夏普比率最大化。第一行报告了不使用择时的静态多元化多因子、多资产类别组合的统计量,其夏普比率为1.48。本文还报告了该组合每美元杠杆的年化双边换手率,为4.4(即,做多净资产的220%并做空净资产的220%)。每美元杠杆的换手率衡量了考虑杠杆后的交易量,以便在同一尺度上比较投资组合。

表IV的其余各行报告了各种择时策略的相同统计量。作者从产生最大利润的择时策略开始——使用全样本回归的全择时模型,其参数在样本内估计且对系数不施加任何限制。如前所述,该策略产生了相对于静态基础因子0.89的信息比率。将此择时策略与静态多元化因子组合相结合,产生的夏普比率为1.73,其中择时策略的事后最优权重为37.7%。这些结果代表了在样本中使用本文研究的择时信号并知晓全样本参数估计的情况下,择时所能达到的最佳情景。当然,这种择时策略无法实时实施,因为它需要知道全样本参数。相反,这个设定作为一个基准,代表了我们可以期望从因子中的条件信息获得的额外夏普比率的上限。

择时策略还需要额外的换手率和交易。表IV报告称,该择时策略的每美元杠杆换手率为5.9,使多空换手率增加了134%。额外的换手率值得吗?作者没有尝试建立一个适用于我们研究的所有资产类别的交易成本模型,而是根据额外的换手率反推出盈亏平衡成本,该成本将抵消择时策略带来的所有收益。具体来说,在确定了择时策略的最优权重后,可以比较两种策略:具有恒定战略因子权重的“原始”组合,以及第二个“择时”组合,它是战略策略和择时策略的最优加权组合。然后,计算原始组合和择时组合之间的表现差异,并将其与它们各自换手率水平的差异进行比较,从而计算出每美元交易的成本需要多大才能抵消因添加择时而带来的表现提升。

在这种特定情况下,该数字为每交易1美元7.3个基点。只要交易成本低于这个数字,添加此择时策略就会提高多元化因子组合的净收益。根据 Frazzini, Israel, and Moskowitz (2020) 关于股票的证据,对于一个成本效率高的套利者来说,在过去二十年里,合理规模(例如,日交易量的百分之一)的交易成本会略高一些。在股票之外,文献中没有对交易成本的良好估计,但固定收益、外汇和股票指数期货的平均交易成本可能略低,而大宗商品的交易成本与股票大致相同或略高。这些估计仅反映了当前的市场和交易基础设施;鉴于研究时期很长,投资者在我们样本的大部分时间里可能面临高得多的成本,并且重申,这些是带有前视偏差的样本内结果。

下一行报告了同一择时模型但所有参数均在样本外估计的相同统计量。这种样本外择时模型的表现较弱,产生的信息比率为0.31。该择时策略仅将静态多元化因子组合的无条件总夏普比率从1.48提高到1.51,其中择时的最优权重为17.4%。由此带来的换手率增加所隐含的盈亏平衡交易成本为每交易1美元1.8个基点。合理规模下的实际交易成本很可能超过这个数字。对择时变量施加经济限制对改善结果作用不大,其中择时策略的最优权重为17.6%,添加择时的盈亏平衡交易成本为每交易1美元1.9个基点。表IV的其余各行分别报告了每个择时信号的结果。价值利差、商业周期、增长动量和CAPE择时变量是似乎能改善样本外表现的唯一变量。然而,因子择时带来的额外换手率只有在交易成本极低的情况下才是合理的;大约在每交易1美元2-3个基点的量级。

在实践中,将因子择时添加到已经分散化的多因子组合中的理由是站不住脚的。尽管考察了大量的择时策略、方法和信号,作者只找到了有限的样本外因子择时证据。考虑到因子择时相关的换手率和交易成本增加,择时的净收益很可能微乎其微。

更积极的一面是,尽管实时从因子择时中获利的能力有限,但我们发现了与跨不同资产类别的常见因子相关的显著条件收益溢价。一个采用一系列条件信息的模型在预测条件收益方面表现更好。这一证据为识别经济中的条件预期收益以及能够容纳它们的资产定价模型类型带来了希望。未来的研究很可能会发现一种更有效的方法来提取条件信息,从而产生更可观的经济回报。

6

结论

跨越六个不同资产类别的一个世纪数据为研究典型资产定价因子溢价如何随时间变化提供了一个丰富的实验室。作者发现,价值、动量、利差和防御的收益溢价在上个世纪的几乎每个资产类别中都是稳健且显著的,并且随时间发生显著变化。这种变化的一部分源于原始研究较差的样本外表现,这与过度拟合偏差一致。我们几乎没有发现证据表明这些收益溢价因知情套利活动而改变。通过考察大量宏观变量以及各种条件信息和择时方法,本文识别出了因子在整个世纪内的条件风险调整后收益溢价,发现当施加理论限制并结合多种条件信息来源时,得到的结果最一致。证据表明存在显著但适度的动态溢价,但这些溢价难以从中获利。一个可实时实施的最优择时组合,在考虑现实世界的实施成本后,只能产生微小的利润。因此,投资者应谨慎对待通过战术性因子择时来偏离对这些因子的长期静态配置。

文献来源:

核心内容摘选自Ilmanen A , Israel R , Moskowitz T J ,et al.于2025年在Social Science Electronic Publishing上的文章《How Do Factor Premia Vary Over Time? A Century of Evidence》。

文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。

本报告摘自华安证券2025年10月29日已发布的《【华安证券·金融工程】专题报告:因子溢价如何随时间变化?——来自一个世纪数据的证据》,具体分析内容请详见报告。若因对报告的摘编等产生歧义,应以报告发布当日的完整内容为准。

查看更多董秘问答>>

热门新闻

>>>查看更多:股市要闻 内参消息 实时内参 财经日历