大模型落地金融业,尚有这些关键点
2024-05-22 【 字体:大 中 小 】

编者按:过去的一年,人类社会在AI、具身机器人、脑机接口等领域取得瞩目成就,令我们目不暇接。新时代的大门已经开启。站在龙年开首,我们想问,科技进步带来的新质生产力会把我们带向何方?光芯片、飞行汽车以及不断进化的AI,又会打开一幅怎样的人类社会图景?在此,请同
一起,聆听技术最前沿科学家们的声音。
自2022年11月ChatGPT问世以来,生成式AI大模型的浪潮便迅速席卷全球,成为人工智能领域最炙手可热的赛道。在赛事行至中场之时,从业者对于行业发展图谱的认知也愈发清晰:大模型只有从通用走向垂直,并迅速投入到产业应用才是王道。
其中,金融行业因其数据密集型和科技驱动型的行业属性,被视为垂直大模型应用落地的最优场景之一。也正因如此,有越来越多企业开始布局金融垂类,截至目前,度小满、蚂蚁集团(06688.HK)、华为、腾讯云、马上消费金融、同花顺(300033)(300033.SZ)等公司都开发了金融大模型,并积极探索这一垂直行业的应用场景。
金融大模型目前进展如何?还有哪些应用前景有待开发?落地过程中数据安全和隐私合规如何得到保障?2024年金融大模型又将涌现出哪些技术突破点?站在龙年的起点,
采访到了同花顺金融大模型HithinkGPT的研发团队,试图探寻这些问题的答案。
据悉,和国内外其他大模型相比,HithinkGPT在金融数据方面具备数据覆盖广、量极大、质量优、合规强等优势,并展现了强大的分析、预测、推理能力。这些优势的获得主要得益于研发团队从训练语料、训练框架到模型结构的设计。
“HithinkGPT预训练阶段金融语料约1.4T token,占比超过了50%。”HithinkGPT研发人士介绍称,在使用优质金融语料训练后,HithinkGPT的金融知识储备远超其他金融大模型。
在模型应用方面,同花顺凭借多年来的数据积累和业务经验,将金融RAG体系,金融领域专家系统,知识图谱,领域知识库等集成在HithinkGPT中,使其具备了实时分析、逻辑推理、精准预测的能力。
即便HithinkGPT拥有诸多优势,但研发人士坦言,“模型幻觉问题目前依然存在,实际部署的推理成本较高,推理速度不够理想,离真正的商业化落地应用还有一些距离。”
研发人士所说的“模型幻觉”(Model hallucination),指的是大模型在缺乏足够信息或面对模棱两可的输入时,生成的错误、虚构或无根据的错误回答。
在研发人士看来,这种错误回答在金融行业是不可容忍的。金融行业容错率较低,无论是知识问答,还是内容提取上,都对大模型技术提出非常高的要求。“只有真正解决了模型幻觉,才能实现to c应用。”
不过在面对模型幻觉时也并非无计可施,研发人士表示,通过数据清洗,RAG技术,RLHF对齐等方法可以有效降低模型幻觉。未来可能会通过研究和开发新的模型解释性工具,开发新的模型架构和训练技术(如更细粒度的注意力机制、更有效的上下文理解能力)等方式来修正并减少模型幻觉问题。
从应用进展来看,目前金融大模型已涉及运营、客服、营销、风控、研究以及贷后等多个场景,但不少分析认为,金融机构对大模型的应用仍处于探索、研发或试用阶段。
研发人士称,除了对“模型幻觉”的考量外,金融行业本身对数据安全合规有着严格的要求,也决定了其在采用金融大模型方面更为谨慎。
对此,同花顺在向金融机构提供大模型服务时,将采用问句侧风控,模型本身安全性能增强,答案侧风控三层风控机制来保障合规性。“HithinkGPT对于违规问题的风控召回率已经达到99%+。”研发人士介绍称。
据悉,HithinkGPT已和大量包括但不限于银行、券商、会计师事务所、政府机构等客户开展合作,很快将会接入他们的系统。
“目前大模型的应用处在一个可以用,还不错的阶段,但距离好用,能准确解决实际问题尚有一定的距离。”在研发人士看来,需要解决的关键点除了“模型幻觉问题”和“安全合规采集问题”外,“如何降低推理成本,提升推理速度”以及“如何生成实际有用的,对用户有参考意义的具体建议,而并非泛化的‘安全回答’”也是亟待解决的问题。
不过研发人士也表示,其中一些问题有望在2024年迎来一些突破点。比如在模型回答方面,或将更加个性化,对于不同的用户画像、不同的上下文信息,模型能理解得更透彻,生成有深度、有逻辑的准确回答;对于意图不准确的问句,也有望能够自动进行澄清和确认。
目前,HithinkGPT大模型在智能投研、智能投顾等应用场景已经取得了一些进展,能够赋能投研工作的多个环节,并辅助投顾从业人员产出更多优质内容。
猜你喜欢
东吴期货研究所投资策略早参20220923
8675
广州等地无人环卫车规模化商用,下一步要减少传感器实现降本
7076
美国防部突然宣布:美军特种部队正支持乌克兰军队
359
这个拥有顶级风光的地方,美食多到本地人都吃不完
7162
广汽丰田创新教育守护儿童出行梦想
268
格力发布全新一代火冷暖机:夏季空调、冬季地暖
5163
隔壁老杨:损到没头绪
9121
多家银行发布2024年上半年业绩快报,南京银行等城商行表现亮眼,行业净息差企稳
9593
股票期货配资网 ,国家统计局城市司首席统计师董莉娟解读2024年1月份CPI和PPI数据
7252
刚刚!科技大佬出大事!涉嫌操纵股市
5334
非农前行情观察:美元遭遇"双重压力"!瑞郎避险价值再受青睐
Neuralink已为第二位患者植入脑机芯片 马斯克:进展顺利,今年或再植入8例
同程旅行:今年“五一”假期国内旅游市场热度或创历史新高
突发!特朗普大楼遭袭数百人涌入! 警方称98人被捕
刚刚!科技大佬出大事!涉嫌操纵股市
晨星最新发布:调高11家公司价值,学而思、新东方、拼多多冲上榜单
A股午评:三大指数下探回升沪指跌破2700,银行券商股活跃;三市一度5100股下跌;机构解读后市
4月13日六福珠宝黄金价格990元克
深康佳A一季报“开门红”!解码单季度全面盈利背后的“双核引擎”
让男人上瘾的“女人味”到底是什么?_女性_男性_魅力
非农前行情观察:美元遭遇"双重压力"!瑞郎避险价值再受青睐

Neuralink已为第二位患者植入脑机芯片 马斯克:进展顺利,今年或再植入8例

同程旅行:今年“五一”假期国内旅游市场热度或创历史新高

突发!特朗普大楼遭袭数百人涌入! 警方称98人被捕

刚刚!科技大佬出大事!涉嫌操纵股市

晨星最新发布:调高11家公司价值,学而思、新东方、拼多多冲上榜单

A股午评:三大指数下探回升沪指跌破2700,银行券商股活跃;三市一度5100股下跌;机构解读后市

4月13日六福珠宝黄金价格990元克

深康佳A一季报“开门红”!解码单季度全面盈利背后的“双核引擎”

让男人上瘾的“女人味”到底是什么?_女性_男性_魅力

