日报标题:未来十年,金融行业会被人工智能取代吗?
这是一个比较大的话题,同时涉及到了大数据和人工智能两个部分。孙志超老师已经从大数据角度谈了一下现阶段的发展对于金融行业的影响,作为一个在金融服务类公司从事 AI 相关的工作的人,我想从 AI 方面谈谈对于金融行业可能有什么影响。
上一个我不成熟的结论:
金融学是一个复杂的学科,在短时间内,很难被 AI 完全替代。在利润率较高、数据结构化较好、问题定义明确的一些方面,AI 会大行其道。在不同金融领域的 AI 如果都能发展到一定程度时,或许能加速整个金融产业的 AI 发展。
在现阶段,金融公司所面临的数据结构化需求远远高于大数据要求。大量的历史数据还并未电子化,甚至现阶段大量金融公司新产生的数据都还属于不规范的格式。
对于金融人才来说,这个时代需要专精金融且能和计算机从业者顺畅沟通的人才。同时金融学的进一步发展也需要专业人才继续探索。因此金融完全是需要继续学的,但有所侧重的补充计算机知识可以为个人和社会带来更大的价值。
对于金融机构来说,有目的和计划的在合法的途径下收集、购买、或生成相关数据将会为未来企业发展带来巨大的优势。对于大型的金融机构 / 研究机构,应该继续加大在 AI 领域的投资,从内部培养跨金融和 AI 领域的人才,即使在短时间内不能产生直接利润。
1. 人工智能在金融学中的应用:
大量的机器学习模型已经被用于金融实践当中,比如利用机器学习进行风险预测或者假账 / 错账检测。更多的例子可以轻松的通过搜索引擎获得,如“人工智能 + 财务”。比较值得看的的行业动向包括各大金融服务类公司发布的展望,比如高盛去年年底发布的人工智能展望,机器之心有翻译其中的重要部分。答主本身也在 随着人工智能的进步,财务工作者会大批失业么?该如何应对?中提到了我们正在开发审计 AI 的进展与展望。
2. 为什么 AI 不能完全替代金融学的各种模型?
A. 无法很好的用 AI 来定义一个金融问题
现阶段比较被商业化广泛应用的机器学习还是监督学习,而监督学习要求有明确的问题定义。现在看起来很有希望的强化学习,迁移学习等还并不能大规模普及应用。
以简单的监督学习为例,如果你想建立一个模型来预测企业并购是否会影响公司股价,那么你需要提供大量并购数据,以及并购后股价是否发生了变动。理想情况下,在收集足够多的并购消息和股价变动信息后,做自然语言分析后提取特征放到机器学习模型里面就大功告成了。
然而在实际情况中:我们无法给出明确的问题定义和边界。如果想用 AI 来来制定一个股票交易策略,那么需要考虑进去多少因素?仅仅只考虑并购消息就够了么?越多的相关的因素越可以提高模型的拟合性和准确性。如宏观政策和微观的具体情况都会影响到股价的波动,漏掉其中哪一个都会造成一定的影响,往往是多多益善。在这种情况下,每个问题都需要大量人和数据来支撑,这也是为什么大量用 AI 来预测股票走势的探索都无疾而终的原因。
现阶段或者可预见的未来,在很多问题上不会出现这种明确的定义和范围。
B. AI 从业者和金融从业者缺乏有效沟通
在很长的时间里面,计算机和金融学之间的联系相对比较薄弱。作为一个 CS 背景的人,我个人对于金融 / 经济学的理解还处于比较肤浅的状态,只理解基本的概念和原理。同样的,金融服务类从业者又缺乏对于 AI 模型和统计的了解。因此使用 AI 来推动金融学发展需要大量跨领域的人才,至少需要两个方向都懂的项目经理。
C. 金融领域缺乏足够的大数据和人工智能人才储备
人工智能的火爆,或者说 06 年 Hinton 论文后带起的深度学习的老树开花,并没有来得及为行业储存大量的专业人才。不难看出,大量一流 AI/ML 人才还是被互联网公司一网打尽,(Hinton 在谷歌 Lecun 在 FB)留给金融服务类公司的人才并不多。以我们公司举例,各国分公司的 Chief Data Scientist 基本都不是计算机 / 统计 / 数学背景出身的科学家。
D. 投出产出在现阶段不成正比,短时间内难以获得收益。在这种情况下,每个问题都需要大量人和数据来支撑。因此研究探索型的、不能产生利润的方向很少有公司来投资 AI 来进行研究的。换言之,有财力提供 AI 研究的金融公司不多,小型的金融机构或者学术机构又缺乏资源(资金,技术人才,数据积累)来进行相关系统的研究。
E. 技术性的难题还包括很多,比如 AI 在金融领域应该以什么样的模式存在?是一个软件,一个网络服务,还是一个机器人。在大量需要与客户沟通的领域,人机交互以及如何生成内容也是继续探索的领域。
3. 金融公司开发 AI 需要什么样的数据?
需要结构化的数据,至少是电子数据。像上面第二点 A 和 B 中谈到的,金融领域的大数据化,甚至是数据结构化都还有很长的路的要走。以审计为例,很多公司还有大量的票据都不能无纸化,更不要提 AI 能够消化的电子数据了。前一阵子我司开发一个面试 AI,但是并没有原始数据可以直接使用。于是我们让 12 个刚入职的员工花了一周时间把我们保留的面试视频逐字逐句的转译到文字 + 特征,整个过程苦不堪言。
因此对于金融公司从现在起就应该继续大力推进数据电子化,在数据价格便宜的时候从其他公司购买数据。或许在不久的将来,数据的价格将会高到不可企及的程度。
4. 为什么还是要继续从事金融学研究?如何有所侧重的学习?
金融领域的 AI 化最需要的不是 AI 专家,也不是金融学者,而是懂 AI 的金融从业者。如果现阶段各行各业都因为人工智能火爆而转向这个方向,只会看到 AI 泡沫破灭后整个社会的一片狼藉。我们需要各个领域专家来告诉 AI 从业者行业的痛点,我们需要项目经理来领导各行各业的 AI 化。
对于已经从业的金融工作者,掌握一些基本的软件操作技能,遇到新的系统能很快上手,就可以了。至于专门花时间来学 CS,甚至 AI/ML,是不大必要的。毕竟最终留给金融从业者的入口不是数学模型或者代码,而是封装好的软件 /APP/ 机器,不会要求过高的理化背景。更何况 AI/ML 的学习要求如线代统计概率等很多基础数学基础,自学起来的时间成本很高。
对于正在选择专业方向或者转型的年轻人来说,继续学习金融,探索未知的领域是一条正道。如果有条件的话,多吸收数据科学方向的知识,甚至可以读一个数据科学的副学位或者双学位。AI 时代说到底,我们只要抱着开放的心,选择迎接新技术,成为最能接受改变那一小部分人,是永远都不会失业的。历史只会淘汰那些选择对抗,停滞不前的人:)