日报标题:想在 Excel 里少犯错,多用自动化替代人肉操作
(接上一期日报如何在 Excel 中少犯错?,本期着重讲下图用红心标注的第四层和第五层)
第四层,提升自动化程度
就像在 IDE 中使用了关键词提示以及经常检查 Code Review,还是不能写好程序一样,这里面还有套路。
Excel 中的错误经常发生在不断的手工人肉操作,再简单的事情做个几十遍或者几百遍,出错的概率也会非常低。因此在 Excel 中可通过使用系统工具、高阶函数甚至 VBA 来提高自动化程度,避免反复输入函数或者重复操作,就能大大降低出错概率。
比如,逐渐学会使用 Excel 自带的丰富数据清洗(排序、筛选、根据统一分隔符来分隔数据等)及分析工具(包括高阶的统计工具,ANOVA 及多元线性回归等等一个都不少),减少人肉人工参与的过程。
再比如,下面表格中,要求白色区域中的矩阵元素等于所在行、列及 worksheet 上对应数字的总和。最笨的办法是每个单元格写一次加总函数,重复几十次值几百次(应该会有许多张 worksheet),非常容易出错;进阶的办法是利用绝对地址和相对地址,写一次函数,整个矩阵的函数拷贝粘贴就完成,出错概率大大降低,但是每出现一个新的表格就要更新函数,仍然有出错的不低概率;最高级的办法就是在上一个办法的基础上,利用 CELL 函数获取 Worksheet 的名字并提炼数字,然后一气呵成,整个表格的函数完全是动态的,Worksheet 复制之后只要改成相应的名字就可以完成任务,在出错方面的鲁棒性很强。
又比如,制作 Financial Modeling 的时候经常需要将季度或者半年度数据汇总成年度的(或者反向实施),一般的做法都是写加减等简单的函数,然而却不能成块拖拽或者复制函数而需要手工不断写函数,不仅麻烦而且容易出错,利用 Offset 等函数,可以写好函数就一步成型,完成整个过程。
函数写法是:
=IF(MOD(COLUMN(Constant!A1),2)=1,OFFSET($M4,0,INT((COLUMN(Constant!A1)-1)/2)),
-OFFSET($M4,0,INT((COLUMN(Constant!A1)-1)/2))+OFFSET($C4,0,INT((COLUMN(Constant!A1)-1)/2)))
又比如,在第二层中,使用设置 Check Point(检查站)的方式来检测三张报表是否配平,然而这种土法炮制的方式只能防止最后的结果不能出错,而不能保证中间的状态以及提升效率。为了偷懒和提高财务模型的健壮性,将各类索引函数及数组函数用到极致,于是实现自动配平以及检查。
函数写法是:=SUM(('Balance Sheet'!$AA$8:$AA$100='Cash Flow'!$B44)*('Balance Sheet'!O$8:O$100-'Balance Sheet'!N$8:N$100)*('Balance Sheet'!$AB$8:$AB$100))
第五层,使用先进的“编程思想”
以上都是技法,让编程真正成为一门科学或者手艺的是,里面存在心法或者思想。围绕着这些编程思想,构建出一套套体系:MVC 框架、MVP 框架以及 OO 等等。这些体系的目的大概都是提高工作效率、复用率以及鲁棒性等等,都是多快好省少出错得完成任务。然而世间万物,不少都是触类旁通。利用 Excel 做数据分析的基本思想其实和编程非常类似,许多框架都可以参考编程思想,这样就能提高效率和降低出错概率。
所以归根结底,还是要做“有思想”的人和“有思想”的事。
Excel 最大的实战价值就是制作各类财务模型(Financial Model)或者简单的数学模型,用正确的方式方法来做模型(所谓的“套路”)才是心法。
比如可以借鉴著名而老套的 MVC 到 Excel 的 Financial Modeling,实战性强且效果好。将构建 Financial Model 的逻辑被分成三层, Model(负责数据),View(负责呈现)和 Controller(负责业务逻辑),理想状态下其中一层的改动不会影响到另一层。
- 灵活性高,需要有灵活的框架快速满足老板及客户多变的需求
- 复用性强,这个项目做得 Financial Model,随便改改就能投入到下一个毫不相关的项目中使用
- 健壮性强,尽量减少频繁的手工输入或者操作,将原始数据集中在一个模块,改一个数据,相关的数据及模块自动更改
在做大部分 Financial Model 的时候基本就是按照 MVC 的框架来要求自己的。
Financial Model 搭建的过程就如同修建高楼一层层往上累加模块
- 常数 / 核心数据 / 假设数据部分,包括:商业常数(汇率及税率等)、历史数据(过去的财报以及市场规模的历史数据)、认为靠谱而不能改动的预测数据、核心假设(比如假定宏观经济按照 6-7% 来增长)等等。这些数据略等于 C 语言的 h 文件部分,动一发而动全身,所以要单独对待。如同程序一样,Excel 的函数中是不能出现 hard-code 的数字,所以如果一个财务模型中出现“=2*3.14*r”,基本是可以打回去重做的。
- Scenario 场景,包括:模型中需要经常调节的重要输入参数(比如:市场渗透率、Exit PE ratio 等)。这些参数最好剥离出来成为一个单独的界面,可以比较方便的控制和调整,为之后的 Sensitivity Analysis 做准备,甚至可能遇到在上文中提到的类似于用梯度下降法寻求最优值的情况。
- 基础模型。这一步的核心就是做出预测的三张财务报表,最令人痛苦的是配平。可以使用各类复杂函数(Indirect/Offset/VLookup 等)来进行配平而不会出错,而且复用性极高。
- 进阶模型。基于历史及预测的三张报表,做一些更复杂的财务分析或者估值预测,包括:DCF、Comparable、敏感性分析等等。
- 呈现。把用户(包括老板或者客户)最关心的产出放出来,用最友好的界面展现出来。当然做得极致些,可以把调整 Scenario 以及重要参数的界面也放出来,方便用户 Manipulate Data(其实翻译成中文更有趣一些:猥亵数据)以便得到最满意的结果。
下图是曾经奋战过的一个 Financial Model,基本涵盖了上述的逻辑和构建过程,供大家参考。
...更多回答请看何明科的主页
...更多文章请到数据冰山 - 知乎专栏