量化投资与机器学习微信公众号 , 是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体 。 公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者 , 荣获2021年度AMMA优秀品牌力、优秀洞察力大奖 , 连续2年被腾讯云+社区评选为“年度最佳作者” 。
量化投资与机器学习公众号独家解读
量化投资与机器学公众号 QIML Insight——深度研读系列 是公众号全力打造的一档 深度、前沿、高水准栏目 。
公众号遴选了各大期刊前沿论文 , 按照理解和提炼的方式为读者呈现每篇论文最精华的部分 。 QIML希望大家能够读到可以成长的量化文章 , 愿与你共同进步!
本期遴选论文组合优化中 , 计算各资产之间的相关性 , 即协方差矩阵是非常关键的一步 。 在Sander Gerber与Harry M. Markowitz的最新论文中 , 提出了一种新的相关性度量指标Gerber统计量 , 相对传统的协方差矩阵 , 这个统计量的表现来的更加稳健 。
来源:The Journal of Portfolio Management February 2022
标题:The Gerber Statistic: A Robust Co-Movement Measure for Portfolio Optimization
作者:Sander Gerber, Harry M. Markowitz, Philip A. Ernst, Yinsen Miao, Babak Javid and Paul Sargen
如何计算Gerber statistics
假设有 个证券标的 , 个时间 。 令 表示标的 在时间 的收益率 。 对于在时间, 任意两个标的组合, 我们将它们的收益对 根据以下公式转换为联合变量 :
也就是说 , 当标的 同向涨跌超过一定幅度 ,为1 , 此时称 为concordant;逆向涨跌超过一定幅度 ,为-1 , 此时称 为discordant;其他情况 ,为0 。 上式中 , 标的 涨跌判断的阈值 的计算方法如下:
其中 为常数 , 一般取 (也有可能取数学公式: 或 ) ,为标的 的收益率的标准差 。
综上 , 我们定义Gerber统计量:
如果用 表示上式中concordant的数量 ,表示discordant的数量 , 那边上式可以改写为:
从上等可以看出 , 如果设 为0 , 那么等式4计算的就是 Kendall's Tau相关系数 。
Gerber矩阵
有了Gerber统计量 , 我们就有了Gerber矩阵 , 我们用 表示 。 在矩阵 中 , 第 行 列的值 表示标的 的Gerber统计量 。 同时 , 我们用 表示所有标的在过去一段时间的收益率矩阵;用 表示 中收益率超过一定阈值(上限)的矩阵 , 即:
那么各标的过去收益率超过上限阈值的次数就等于:
同样用 表示 中收益率低于下限阈值的矩阵 , 即:
那么各标的过去收益率低于下限阈值的次数就等于:
最后定义同向变动次数矩阵 :
逆向变动次数矩阵 :
那按照等式4定义的Gerber统计量 , Gerber矩阵可以写为:
其中 为Hadamard除法(位置对应) , 且Gerber协方差矩阵为:
其中 是收益率标准差构成的对角矩阵 。
解决 矩阵非半正定的问题
在实证研究中 , 我们发现根据等式9计算的Gerber协方差矩阵经常为非半正定矩阵 。 由此作者改进了Gerber统计量的计算方法 。 我们可以对任意两个资产 ,根据各自的上下限阈值把一个区域分为如下的9个部分:
那么等式4可以改下为如下等式10:
而上式的分母于等式11的分母等价 , 在实践过程中 , 由等式11计算的Gerber协方差矩阵均为半正定 。
Gerber统计量与Pearson相关系数的比较
1、相关系数基于所有历史数据进行计算 , 而不管两者是否是同向涨跌 , 这其中可能包括了部分噪音 , 导致相关系数对较小的同向涨跌比较敏感 。
2、而Gerber统计量 , 正如等式11的分母所示 , 仅包含了显著涨跌的数据 , 这使得Gerber统计量比Pearson相关系数更稳健 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
