日报标题:研究量子力学,从事金融工作,碰巧是对口专业
有门新兴交叉学科叫经济物理(econophysics ),会运用很多研究物理学的手段来研究经济现象,例如随机行走和价格时间序列之间的相似性,价格序列之间的关联可以随机矩阵来描述等等。
首先明确一点,量子力学、哈密顿力学这两个概念在金融中有没有实际的应用我不清楚。仅就个人的研究心得做一点评论。
先提出几个概念:
1、复杂网络(Complex network)
2、随机矩阵(Random matrix)
3、时间序列(Time series)
第一个:复杂网络,其实来源于图论,最后被统计物理学家发扬光大,成为一种强有力的表征多体相互作用的方法论。想象一下,一个图,有点,有连线,如下:
取自:Graph theory
那么这只是一个非常抽象的概念,至于点是什么类型,边代表什么作用都不清楚。So 就到我们发挥想象力的时候了。例如点 1-6 是留个人,那么边可以代表朋友关系。或者 1-6 代表留个城市,边代表铁路线路,航班线路。更甚者 1-6 代表六个基因,边代表他们有无共同调控作用。这里要引入一下图的表示,最简单的就是用邻接矩阵描述一个网络(图),上图中的网络表示成矩阵为
:
0 1 0 0 1 0
1 0 1 0 1 0
0 1 0 1 0 0
0 0 1 0 1 1
1 1 0 1 0 0
0 0 0 1 0 0
可以看到有连边的地方都是 1,无连边的两点之间为 0.
那么在金融中,我们是否可以想象这些点代表了股票,而边代表着两只股票之间是否有关联性呢?
那好,我们如何从咱们常见的股票价格数据来得到以上的表征股票之间关联性质的网络呢?从我们现有的价格序列出发。假如我们有 N 只股票,其中股票 的价格序列为:
由于我们知道,简单的价格序列在时间序列的描述语境下是一个非平稳的序列或者说异方差序列,会具有长期的趋势,不利于计算两两关联。那么我么通过所谓的去趋势转化,得到一个稳定时间序列:
其实这是最简单的差分序列,更加常用的做法是对价格序列取对数,然后做一阶差分,便于计算复合收益率。那么我们有了 序列之后我们可以计算 N 只股票两两之间的关联系数。最常见的线性关联例如 Pearson 关联。当然也可以计算非线性关联。那么我们会得到一个 N*N 的关联矩阵:
那么我们怎么从这个关联矩阵得到一个网络呢?
手段有很多,但是指导思想只有一个,从关联矩阵中构建一个网络(图)来表现股票之间最强的关联性。这里简单介绍一下三种手段:
1.阈值切割
2.最小生成树
3.最大平面图过滤
首先阈值切割,设定一个阈值 ,假设在矩阵 中某个元素大于 ,则将其转化为 1,否则为 0,对角元全部为 0.这样切割之后会得到一个元素全部为 0,1 的对称矩阵 ,这个矩阵其实就是表征网络的邻接矩阵。画出来是这样子的:
阈值取到了 0.9,也就是说当两只股票的关联系数大于等于 0.9 的时候讲矩阵元转化为 1 否者为 0,得到矩阵 ,然后表征成上面的网络。
第二,最小生成树(Minimum spanning tree).首先我们得到了上面的关联矩阵 之后可以定义距离矩阵
通过寻找最小的距离的路径保证网络是树图:
取自:ONNELA et al. PHYSICAL REVIEW E 68, 056110 (2003)
第三种方法,最大平面图过滤(planar maximally filtered graph),其实这种方法是基于最小生成树的方法,只不过得到的图不在是树图,而是带有三圈和四圈的图。携带的信息比树图更加多。
不同颜色代表着不同的金融版块。
好了介绍完三种从时间序列到复杂网络的方法之后呢,我们既然有了网络,那么可以用研究网络的那套方法去研究股票之间的关联网络的一些参量,例如聚集系数,最短路径,中心度,社团划分,度分布。
下面就涉及到第二个概念:随机矩阵。随机矩阵最初的应用时在核物理方面用来描述重离子的能谱之间的间隔类似于随机矩阵的本征值之间的间隔。而且随机矩阵的本征值密度分布有一个很完整的解析形式。后来被拓展到很多物理研究领域。既然上面的关联矩阵 的矩阵元是两个随机序列之间的关联系数,大小在[0,1]之间。那么它的本征值分布能否用随机矩阵本征值谱来描述呢?
回答是可以,又不可以。可以是在股市没有遇到大的波动行情时本征值可以用随机矩阵预测的分布来描述。而不可以是在遇到金融危机或者股市崩盘的时候,最大本征值不和随机矩阵预测值有很大的偏差。这个最大本征值被描述为市场整体行为(market mood).而且超出随机矩阵本征值预测的范围的其他本征值还有更加明确的意义,即版块整体波动行为。进一步可以参考 Phys. Rev. Focus 4, 10 (1999)(Physics - The Market Isn’t All Random).这一期有两篇 PRL 文章用随机矩阵的方法应用到了描述金融市场行为的研究。
第三个概念前面有用到,所谓的时间序列分析。(大坑)当然在研究金融方面的应用就是股票价格和指数价格时间序列的研究和预测。在统计性质研究方面用物理的手段主要集中在:分形性质研究,波动率统计性质研究,收益分布,运用基于 agent-based 或者 random walk 之上的模型来模拟股票的 stylized factor,例如收益的尖峰胖尾分布,波动率的幂律分布等。在预测方面主要涉及到时间序列建模,例如常用的 moving average(MA),auto regression(AR),auto regression moving average(ARMA)等以及这些模型的推广。
关于以上三点,前两点是自己研究的内容,虽然不能说深入,但还算熟悉。最后一点时间序列分析只是提出一些概念,需要深入了解的可以自行 Google。如果错误欢迎批评指正,有兴趣可以一起研究,共同学习。
最近在看 nus 的一本 quantum finance,也跟马普所搞量子场论的表弟了解过一些物理的理论背景,这是我的一点感受:
首先先吐个槽,我是数学系出身的,对于物理学家写的书和论文实在不敢恭维,包括积分可以不写被积项,多个积分项如果区域一致就不写全,微分里偏微分和全微分符号经常混淆使用,有一些没有 well defined 的东西也能写,虽然只是中间的推导过渡步骤。这些东西发到靠谱点的 math 类期刊无疑都会挂掉。
吐槽就这些。现在说重点。金融这个领域数理要求最高的无疑是衍生品定价与对冲、优化策略这一块,也就是传统意义上金融工程、金融数学的研究方向。国内市场还没到这个地步,因为国内的衍生品太少太简单,就连期货这种简单产品竟然都能被政策引导的流动性将近丧失,而且从老百姓到监管层无一例外认为衍生品就是加杠杆赌博的,别无他用,不得不说是个神奇的市场和受众。在国外,虽然这一块最近被以统计为主流手段的后台 risk 打压的很厉害,尤其是 regulator 主导的。但衍生品的存在还是不会消失的,因为没有衍生品的交易是完全暴露在所有风险里赌博,你不能有指向性的持有某种特殊风险。而且在这段时间的 Basel 4 研究里,包括中央清算模型与信用风险、运营风险的量化工具其实并不 naive。如果没有用,那 MS 的 delta-one,JP 的 QR,GS、CS 的 QS 的几千号人存在的合理性该如何解释?数理在金融的应用都有一个度,不能过,也不能少。
市场背景就是这些。金融工程研究的很大一个方面是衍生品定价。欧式的东西都是简单至极的,基本常用模型都有 analytical 或者 semi-analytical 的解,所以只要一张纸就可以把价格解出来。复杂的是结构化产品与路径依赖产品。绝大部分老百姓眼里的金融都是炒股,但其实股票衍生品市场在金融里的分量很小,远低于 fixed income 与 credit 的产品。而且就这段时间来讲,股票市场也远没有外汇市场、信用市场的交易机会多,估计比各大银行都裁掉的大宗商品要强一星半点。而跟 fixed income 和 credit 有关的产品往往都不简单,很基本的一个 swaption,有解析解的模型就少了很多。而对这些产品进行定价,往往要借住 PDE 或者蒙特卡洛来进行。PDE 好处是快,而且求用来量化对冲量的 Greeks 方便,美式与 barrier 期权简单轻松,坏处是不能处理高维度问题,比如 ETF 的期权,还有对于路径依赖的产品的处理能力很弱,比如 Asian 或者 lookback。蒙特卡洛的好处是能把上述的问题全部解决,坏处是慢,但好在每个蒙特卡洛路径都是独立的,所以超级计算机或者显卡计算都可以很明显的提高加速比。这也是为什么现在很多银行花了很多心血去研究并行计算,尤其是显卡计算。可能对单一产品你觉得无所谓,5min 和 1 小时的差异你觉得没什么。但假如你做 macro-hedging 时,你想研究你的 portfolio 时,你想降低你的蒙特卡洛误差时,你的时间可能就不再是一小时了,比如两周没日没夜挂机等,还是运用新技术让它 6 小时算完,你自己决定吧。
而有了衍生品定价的 complexity,如何能提高效率是个很重要的问题。这里终于出现了量子金融的一个优势点了。传统金融工程里,主要数学工具是随机分析,也就是研究布朗运动或者 levy 等一些 process,然后通过鞅(martingale)来定价。量子物理在这里有一个共同点,那就是 Gaussian white noise 对应着布朗运动,是 randomness 的代表。而一般的金融模型都是一个 SDE(随机微分方程),与之对应的是量子物理里的 Langevin equation。这些都有着千丝万缕的联系。但是,这些既然都可以用传统的随机分析来做,为什么还要用量子物理?从我现在了解的知识看(未必完全正确,望指正),答案就是 path-dependent 上。路径依赖产品和欧式的差异在于,它们的价格一个是 non-Markovian 的,一个是 Markovian 的。后者的 filtration 可以简化成 current information,而前者必须是完整的 sigma algebra。一般的 BS 方程可以写成哈密顿算子的表达形式,也就是所谓的 BS 薛定谔方程。而哈密顿算子,可以定义一个 pricing kernel(这是我老板的 PhD thesis 主题,只不过我没继承他衣钵继续发展这套理论,他也没强迫我做这个),这个东西可以承载一个 path-depedent 产品所需的所有 information stream,所以这时候传统意义的 filtration 就可以使用 pricing kernel 来替代了。一个 path-dependent 的产品的 pricing PDE 可以通过调整原先的薛定谔方程来调节,这样就可以使用 pde 手段对路径依赖产品来分析了,然后,哈密顿算子和 completeness eqn 可以把这个 pde 的解用 path-integral 的方式来进行表达。这提供了一个路径依赖衍生品定价的新思路,确实很有意思。或许有人知道 Cont 的 Functional Ito Calculus,也是在讨论路径依赖问题,但是是从随机分析的角度出发的。我之前没有打算去听那门课,但现在真的是有兴趣想去了解一下了。学科之间的联系真的美极了。
再次声明,我的研究方向现在还没有转移到这里(主要是做金融计算和 counterparty credit 两个方向),现阶段也只是在读那本 quantum finance 而已。所以答案可能有疏漏,望批评指正。