常识资讯
沪粤联合研发金融知识大模型 在自己擅长的金融知识领域超越了GPT4等
尤其是AI大模型技术如何在金融垂直领域应用落地?日前,上海交通大学上海高级金融学院(SAIF)与粤港澳大湾区研究院(IDEA)联合研发出“金融知识大模型”,并发布“金融试题解析”“金融分析计算”和“金融事件分析”三大功能。仅就其金融知识库而言,就囊括了超过20万篇
最新测试结果表明,金融知识大模型的“垂类”性能突出。不仅在主流金融测试集FinEval上全面超越了现有的主流大模型,而且在金融领域的重要考试方面成绩喜人——譬如,在注册会计师全国统考CPA考试中,全面超越现有的主流大模型,包括GPT3.5和GPT4;在国际通行的金融投资从业者专业资格认证CFA考试中,则全面超越了主流的中文大模型,在大部分科目上跟GPT4互有胜负。
此次“模拟考”在现场演示了3个场景。第一个场景是求解注册会计师考试CPA例题。CPA题目相对简短,金融知识大模型就定位题干关键词对应的知识点,还针对知识点检索做了特定优化。第二个场景是解答较为复杂的CFA二级分析计算题。金融知识大模型的求解过程,经过OCR图表识别和STEM剪枝过程,以便精简题干。
第三个场景更具时效性,即针对“2023年中央金融工作会议”的公报内容作深层次的信息检索和归纳整理。由此,金融知识大模型构建了以“2023中央金融工作会议”为问题主体的思维导图,并生成了与其相关的子问题。通过意图识别选取相关的子节点,对金融知识库、资讯库进行信息检索,实现最终内容生成。
粤港澳大湾区研究院数字金融首席科学家林舟驰表示,“金融知识大模型”面向金融教育、金融咨询与金融分析这3个主要场景,以金融知识检索、知识问答、信息抽取、意图识别、代码智能和工具调用等能力为支撑。从CPA到CFA的金融试题解析方面,大模型通过题干关键词进行背景知识搜索、相关案例搜索和相关例题搜索,能够根据需要解答问题、对答案进行分析或答疑。
林舟驰博士解读认为,其背后以金融知识库+大语言模型为底座,取代了传统的单一语言模型底座架构,再搭配金融、、咨询场景的高质量语料进行模型预训练,形成了思维图谱推理技术。这种思维图谱推理技术,能在某种程度上把大模型的推理过程白盒化,通过知识的归纳整理,形成思维图谱,逐点逐层解决一个现实中的金融问题。
值得一提的是,当推理过程不再是“黑盒”,CPA、CFA考试的两个场景中,会计及金融专业学生也可以以交互式学习方式,获得答案的解析以及针对题干内容的答疑,革新了传统的人机教培方式。
在知识+模型的底座基础上,沪粤研发团队还开发了一系列面向现实场景的工具接口,例如金融信息抽取,可在海量研究报告与新闻材料中抽取有价值的金融常识、金融主体和关系信息,以及金融事件各类观点等等。这些金融信息都被AI解析,并被吸收成为金融知识库的一部分,服务于各类顶层任务。
目前,这款大模型采用了来自金融教科书、企业财报、企业研报、新闻舆情、法律案例和政府报告等超过160G的高质量金融文本进行增量预训练,还通过30多万条衍生于金融公式、金融试题、金融代码、金融问答、金融表格和金融知识图谱等的高质量指令数据进行有监督微调,有力保证了大模型最终输出内容的可靠性和可控性。
据悉,目前金融知识大模型还未对外开放,其未来计划的第一阶段,主要以上海高级金融学院的业务场景为落点,在业务中“跑”起来并不断迭代,逐渐在更大范围落地。