以下文章来源于SAIFR ,作者SAIFR
2月19日,特许全球金融科技师(CGFT)学员活动围绕热点话题ChatGPT成功举办,活动特别邀请到达观数据联合创始人纪传俊分享,并邀请前达摩院创新业务中心高级产品专家、智慧数字人产品负责人,高金MBA校友李彬主持嘉宾对谈,两位嘉宾与各位CGFT学员共同探讨了ChatGPT的强大能力和对金融行业带来的机遇和挑战。活动吸引近200位学员在线参与,其中有10余位学员锁定线下席位获得与嘉宾现场交流的机会。
达观数据联合创始人纪传俊以“大语言模型的无限潜力”为题,从 ChatGPT是什么、有哪些超能力、为什么不是万能的、能力从何而来以及如何应对其带来的机遇和挑战等几方面展开分享。他提到ChatGPT具有文本生成与写作、多轮对话问答/多项下游任务能力、思维链能力、上下文学习、涌现能力、代码及debug能力、有害问题规避能力等等,但它也不是万能的——存在诱导有害性回答、计算性错误、回答时效性、版权、安全性等诸多方面有较大改进空间。
该技术对金融行业带来的机遇,如为智能客服、智能研报、债券募集书等工作带来便捷,离数字员工更进一步;也可针对一定场景提供落地可能性,甚至在一定程度上可为监管合规提供助力,但目前在可解释性和生成可控性和中文语料数据库上仍有提升空间。
活动现场气氛热烈,学员们均积极参与问答环节,就CGFT算法及非算法背景学员能如何加入到趋势中来、以及CGFT相关人工智能、机器学习课程、投资偏好讨论等问题发散讨论,互动交流。
嘉宾对谈-精彩实录节选:
李彬:纪总对ChatGPT从技术衍进的过程,包括在金融行业的一些核心应用场景做了介绍。我自己是产品经理,可能我的角度会跟纪总从技术的角度出发会有一些差别。想先替算法的朋友问一个问题,您刚刚在讲机遇和挑战的时候,有提到说ChatGPT带来了一个模型解决所有问题的这样一个新技术的框架和范式。对算法同学来讲,是不是就应该集中精力往预训练大模型这个方向去做研究了呢?
纪传俊:目前来讲这是个大趋势,但不敢说下定论。大模型这个大的技术来讲,现在研究下来还是有挺多问题的。我们看到应用可能已经不错,但是如果真的要做到非常精准,或者完全按照人类的意图去生成,还是存在一些gap。这个方向上有些技术问题并没有完全解决,未来的方向或者新的更好的方向去完成这个解决问题也不确定,但总体来讲应该是一个非常重要的趋势。对于现在的研发人来讲,我觉得这个趋势肯定是要跟上。从应用层面反过来,怎么在有限的时间人员和成本下,去做出真的能对应用产生效果的东西。目前来讲,这路子实在是太贵了且难度非常大。
李彬:ChatGPT虽然是美国的公司训练,但是他在整个的中文语境下,表现也非常不错,是不是代表说在机器翻译领域里面可能也会遇到比较大的一个挑战?
纪传俊:如果是说机器翻译,现在大模型已经基本解决这个问题,随便用什么语言问都能翻过来。简单的翻译任务问题不大,现在难的是说给中文,他是怎么理解问题同时以中文的形式组织出答案。因为中文的语言方式跟英文还是有差别的,他能做到,这是一个很可怕的能力,前提是他也用了中文语料训练。目前这部分工作比例可能没有那么大,数据库也没那么大,但从趋势来看正在加强。用机器翻译后去训练比人工翻译效果更好,机器可能更能理解机器。现在加强速度很快。也可能是在ChatGPT在学了大量的英文之后,他其实掌握了一些人类这种通用的抽象的语言逻辑。虽然中英文的一些语法不太一样,但是很多这种思维逻辑还是有相似度的。所以它基于大量的英文语言模型,再加上少量中文的语言模型的数据的训练之后,很快就具有了中文的一个思维能力,所以这块是也是这个大模型涌现的一些比较神奇的能力之一。
李彬:它体现出了这么多神奇的能力,我跟算法同学交流的时候一直会提这样的一个问题,就是现在是掌握了它怎么去运作阐述结果的这样一个东西了,但它背后的原理,我们是不是真正的掌握了?我们是不是真正地去理解了背后的原因?
纪传俊:对,其实这个问题应该是从模型出来之后一直存在的,为什么导出最终的结果,有很多科学研究在做可解释性这样一个方向,专门去研究怎么去推导算出、可视化出它整个一个推导的过程。从目前的结果来讲,没法百分之百地确定说是怎么得到这种结果,1000多亿的参数的思维路径是怎么过来的,可能要更复杂的模型去理解这个模型。目前来讲就有点像人类的思维过程。慢慢它也是会变成这个。希望通过原理的理解去知道怎么规避或者怎么更好地利用它,包括后面衍生出的安全问题、版权的问题,其实是需要理解它整个过程才有更好的方式去限制它,作为安全的一个保障。
李彬:对,我记得前几天马斯克就在说,“我们应该先把new Bing关掉,把ChatGPT关掉,因为我们现在搞不清楚它是怎么回事。” 还有一点就是纪总刚刚也提到,就是模型应该是一个基础设施,但它的成本确实也很高,如果我们换换过来想,会不会将来就会带来一个新的问题,可能大家都得看这几家大厂,比如说最近百度的研究很火, 很多的公司已经宣布了接入“文心一言”。这种在商业的结构上或者说技术演进当中会带来什么样的影响?
纪传俊: 目前来看,这个影响确实会有,短期来讲如果是以现在这种大模型的成本不变的情况下, 那肯定是只有某些比较大科研机构、大的厂商才有能力构建这种通用智能的大模型。通用模型肯定是非常之庞大,而且成本很高的,对外是通过SaaS服务去提供这种模式的,但通用的问题就是他可能对具体领域的应用没有那么的好。比如说金融领域具体的应用领域,它可能还是可以训练出规模相对通用来讲比较小一点的大模型,当给了人类这种强的干预之后,它的模型参数是可以大量减少,这也是一个方向,包括现在学术界也在研究这种模型压缩或系数化的这种技术,让模型变小,这是未来整体怎么让大模型变得成本低的一个方式。未来可能低到让一个手持的设备上也能有这样的能力也有可能,现在来讲可能还比较早期,未来怎么演化进步还不好说,现在来讲变小的话,压缩的可能性还是比较大,压缩后可能算力上要求会比较低,反过来我们算力上也在逐步的升级。像像一笔点,未来可能也会针对大模型出定制型的卡,让数据成本更加高,都有可能。
李彬:在我理解看来,那这里面可能就有一个悖论:既然我们对他的这个背后的why不是很理解。那现在我们又对它的生成可控性又不是很好把控,那这个可控到底有可能吗?
纪传俊:呃,不能说完全不能把控,可以看到OpenAI 还是从各种技术方向做了很多的把控,否则的话现在会出来很多人类无法接受或者不太符合伦理规范的内容。
李彬:您刚刚也提到了应用层面,我刚好就是做应用这块的,我觉得在金融行业里面跟我之前在电商零售行业里面还有另外一个比较大的区别就是金融是强监管的,这个会不会也会影响ChatGPT在金融行业的应用?我们现在敢不敢把它真的用到金融领域当中呢?
纪传俊:我觉得如果从监管角度讲肯定会提出很多要求,比如说安全性,数据安全的要求,还有这种监管的要求一定会提。但现在我们了解到说,其实金融行业在这个新技术的应用上是最最激进的。可能不一定会直接上到核心的业务领域,但一定会以一些形式开始调研ChatGPT,甚至我们的客户就现在立项想一起来共言说在某些场景上应用的可能性,落地是非常积极,当然监管同样会非常严格。这两块可能甚至反过来,这种技术能力也可能成为监管科技的一部分。通过它去加强监管的能力,然后反过来去强化我们的监管体系也有可能。
李彬:产品层面上,您刚刚也有提到to B和to C这样的两种市场和机会。假如说就在金融行业里面,您觉得现在最有可能落地的可能是在内部的这种场景里面还是说对客户的场景里?
纪传俊:现在看到的一种应用趋势大部分是to C的,比如说刚说写微信公众号,写各种社交媒体的文章。然后在国外最多也就是写社交媒体的东西 C端应用。为什么ChatGPT那么火?因为它是toC的,全民一起了。然后大家发现这东西在通用的C端非严肃领域的,已经够了,它的精确性已经达到要求。To B其实在应用层面还更广阔,但是还有很多问题比如精准性、准确性的要求,包括监管、合规性的要求,这些是需要再进一步加强。所以在to B 业务上还是需要再做尝试。
李彬:明白,还有另外一个点,我们通常说一个技术带来了一个变化,包括其实我们之前的所谓的文本的生成能力, 生成式AI其实也提得蛮久了,包括刚刚提到的智能写作,包括音乐画画等等已经很多了。所以其实我理解这个背后的一个逻辑,会不会说机器跟人的分工合作的边界会不会因为ChatGPT的出现又会发生一些变化?
纪传俊:我觉得肯定是会发生变化,原来很多觉得一定是人来做的事情现在已经不一定。从很多工作上来讲,可能也能减轻一些工作的压力。李
彬:对,我们之前很多时候提的一个概念叫数字员工,感觉这个员工已经非常接近,
纪传俊:对对对,尤其看问答的能力,数字员工第一个上岗是问答的能力,现在这个方向如果有这样的一个ChatGPT机器人来加持的话,基本上你告诉他一些希望回答的答案的内容,他可能就能从里面找出你要的东西。对答上比较自然的,
李彬:感觉不光是在生成上能够解决一些问题,在交互层,也能够像一个真人一样对话聊天了,这个就会让我感觉到,也可能让很多人感觉到,以前我觉得它是个工具,现在是不是它已经不是一个单纯的工具了?就会有这种替代的感觉。
纪传俊:有些对话的时候他会反问你一些问题,他自己不确定他会再问你一下,在得出一个答案。
李彬: 主次关系感觉变掉了。原来客服是先到机器人再到员工,原来机器人他能解答的问题太少。加上ChatGPT后,可能能覆盖80%-90%, 那客服人员就会轻松很多。
李彬: 嗯,对,我之前在做这个客服这个领域的时候,我们在研究后续的方向。其实现在大家对于这个机器人服务的这种冰冷感其实越来越厌恶了。上来就直接转人工,这个其实也是现在很严重的一个问题。所以我们发现ChatGPT出现以后就让大家又发现说可能会有一个更智能的机器人来去服务大家了.
纪传俊:大家甚至有点喜欢用ChatGPT,这是一个很可怕的,有人宁可跟Chat GPT聊去找一些东西,发现比用搜索引擎准,还更快、交流更顺畅。所以这是为什么Google很慌的一个原因,包括Bing,为什么这么快就上new Bing,他就是去抓住这个点。
李彬:因为您是做创业的,可能对抓住这样的一个创业机会可能会更有敏感度。我现在接触到的这个AI圈子里人也有分两个方向,第一个就是看怎么样能够基于中文的语境,中国的环境市场来做一个中国版的,还有一个就是看怎么样,能够有更多的一个应用的场景。您觉得如果从投资的角度的话,投资人应该先关注哪一块,可能会更有有收获呢?
纪传俊:这个可能得从投资的偏好来讲,因为我毕竟不是投资人,就从他们角度来讲,投资人可能更看重的是风险跟收益。如果投第一条路,风险很大,但收益可能是巨大的。高风险,高收益,那第二条肯定是低风险,低收益。还有应用在于说是浮在大模型上的一些应用,那万一大模型技术或体系转换,或者某一天它不开放了,那应用也就没了。为什么百度它要跟其他厂商一起来谈论,说很多人已经接入文心,他是要做一个生态,给其他小厂去赋能,去做应用,这是一个挺好的模式。这种生态在国内因为刚起步,它能多持久化,包括未来的稳定性可能是还需要多考量。这块其实也是有风险。从大模型来说现在最大问题就是它技术不确定很强,投入一定是非常巨大,一定是要有一定的积累的企业他才能去做这个事情。
李彬:像您现在的这个领域,达观在的领域其实就是跟这个有强相关的,您现在的感受是是机会更多还是压力更大呢?
纪传俊:对我们来讲肯定是机会更大,从我们本身,因为从15年一直在做这个技术,所以现在到这个趋势,它能出圈之后我们就会非常之兴奋,有更多人知道我们做这个的价值在哪,以及我们其实一直在跟这块的技术有跟着这个技术,所以不会说感觉这个东西跟我做的东西好像差距很大,我们还是能理解这个东西,从过去的趋势到现在为什么发展到现在这个点。所以我们未来的一个怎么打法,怎么去跟金融结合的,其实我们心理也比较有谱 ,所以这对我们应该是比较好的一个机遇。我们期待厂商,大家真的能做出一个中国这样中国人的自己ChatGPT,这样我们能自主掌控。
李彬:是的,是的,话说回来,我当年之所以这个人工智能公司做产品经理,像我们这个CGFT很多的学员,他可能是类似我这样的背景。非算法CGFT学员他会有什么样的一些机会能够参与到这样的一个趋势当中呢?你有什么建议?
纪传俊:其实机会还是很大的,这个技术怎么落地?第一步就是你怎么去指引它,其实这块是需要大量的,这种可能有这种专业背景或者是更懂说人类思维过程这样的给他指引,其实需要花大量的人力去构造数据啊,去交互,这其实非常需要一些有智慧的人或者聪明的人作为好的导师去教他。从训练过程它需要很大工作量以及需要这样的人去指导。包括再上一层就是如果有大模型怎么去做应用?还是得跟场景跟应用结合。在每个场景里面让他能更适应我们的工作的需求,其实也是需要金融行业的专家来给到他一些指引。
李彬:对是的,可能同一个问题,给到的表述稍微变化一点点,给的信息稍微详细或者换一个角度,ChatGPT给出的答案都不太一样,所以这个需要我们产品经理要提出一个合理的需求,这对需求的要求好像很高。
纪传俊:对,可以再进一步教他说你怎么能理解不同的说法,到底想表达什么。这个理解能力上的一个培养,其实也是需要我们专业人士去指导的。
李彬:了解,其实我自己的话,觉得在to C这个领域现在可能在产品上面是离落地更近一点的。您觉得在国内的话会有反向的可能吗?国内to B的落地机会似乎更大一点。可能更快?国内本身对商业化这块要求也比较高,尤其我是从大厂里出来的,我感觉这个压力也很大。
纪传俊:呃,也不好说,To B市场不是爆发式增长,它是一个蜂窝状的,一个一个做,不同的小蜂窝内的需求不太一样,所以它的扩展性或者说它传播性没有像toc那么强。但应用场景其实非常之多,能直接产生的经济价值可能比C端要明确和直接,所以to B还是有很多厂商或市场会去做。其实ChatGPT从去年年底开始火了之后,其实各行业的很多企业都在找我们说能不能帮他们做一些尝试或者落地,大家的需求其实是很多很多的,但现在怎么做可能各个方面还在尝试。
李彬:对,我觉得ChatGPT相当于它已经做了一轮大众教育,宣传这一步其实目的已经到位了,下面其实大家都在看真正能够有应用的东西了,我觉得纪总您对这个趋势的把控还是很到位的。
纪传俊:不敢说把控,只能说我们的理解吧,我们做这个事情,从我们的角度的一些理解。