基于推理大模型与知识图谱构建信用债券数智化分析新范式

  ◇ 作者:中国邮政储蓄银行金融市场部 杨再宝 张涵 刘晨晔 程昊   ◇ 本文原载《债券》2025年3月刊   摘   要   受知识图谱、大语言模型等前沿人工智能(AI)...

  ◇ 作者:中国邮政储蓄银行金融市场部 杨再宝 张涵 刘晨晔 程昊

  ◇ 本文原载《债券》2025年3月刊

  摘   要

  受知识图谱、大语言模型等前沿人工智能(AI)技术的影响,信用债券的信用分析范式正在发生巨大变革。相较于高成本且闭源的GPT4.0模型,以深度求索(DeepSeek)为代表的前沿低成本、高效能推理大模型,为大规模应用AI开展信用分析提供了可能。本文梳理了信用债券分析数智化的发展趋势,并通过实践研究,论证了推理大模型和知识图谱技术在信用债券分析领域的应用潜力。

  关键词

  推理大模型 信用债券分析 知识图谱

  信用债券分析数智化发展概况

  信用债券分析的数智化发展主要历经了三阶段:一是以财务比率分析为代表的传统评估框架(Altman, 1968),二是由结构化模型与连接(Copula)方法奠定的现代信用组合分析体系(Merton, 1974; Treacy et al., 2000),三是当前基于机器学习的智能评估体系。近年来,以机器学习为代表的人工智能(AI)技术取得突破性进展,并在识别信用风险非线性特征方面表现卓越。基于这种优势,众多国内金融机构积极采取行动,已系统性地部署机器学习模型群组,挖掘个人及中小企业客户的海量信用数据,构建多维度特征工程,实现了信用画像颗粒度与预测精度的显著提升(徐劲等,2022)。

  当前,金融机构在将机器学习技术应用于信用债券分析时面临一定的困难:其一,标的资产集中于大型企业集团,单笔大金额形成的风险高集中度与机器学习依赖的大数定律存在根本冲突;其二,集团化经营衍生的复杂股权嵌套和差异化的业务范围显著增加了企业异质性,导致模型在特征工程阶段面临跨主体可比维度缺失问题;其三,市场主体数量较少导致训练样本规模不足,可能引发共线性或过拟合问题。尽管如此,AI技术在信用债券分析领域仍然有巨大的应用潜力,但需要构建更具有针对性的应用范式。

  当前,以大语言模型(Large Language Model,LLM)为代表的生成式人工智能领域取得了一系列突破,发展出具备推理能力的大语言模型(Reasoning LLM,以下简称“推理大模型”)技术和基于知识图谱的检索增强生成技术(graph based retrieval-augmented generation, GraphRAG),为信用债券分析提供了一种切实可行的数智化范式。

  信用债券分析数智化发展趋势

  (一)研究方法:从定量主导向混合方法转型

  在信用债券分析中,传统的信用评级模型过度依赖财务指标等结构化数据 (Blume et al., 1998),其可能因方法论存在问题而导致结果错误,即存在“定量陷阱”(王正绪等,2023)。与此同时,定性因素发挥着愈加重要的作用,如社会评价、政府关系、融资支持力度等,已成为衡量信用还款能力的重要因素。鉴于此,信用分析师通常会在定量模型的基础上,依据定性因素进行调整(Bozanic et al., 2023),将行业政策、政府支持力度等难以量化的定性因素考虑在内。过去,评估这些定性因素极度依赖分析师的个人知识储备和从业经验,而大语言模型的蓬勃发展带来了新的可能,投资机构可以通过模型微调或简单的上下文学习(In-Context Learning),将这些知识和经验融入信用分析模型,从而实现定性分析的自动化和标准化。

  (二)评估体系:从结果输出到过程透明

  基于传统机器学习的评估体系在研究方法上侧重于分类或回归,即通过大数据构建监督学习模型,直接依据数据结果对企业信用状况予以分级、给出违约概率。然而,这样的方法缺乏可解释性,且存在弊端:一方面,风险归因缺失,导致无法判别特定风险因子对评级结果的边际贡献;另一方面,决策支持断层,导致难以将模型的输出转换为可操作的避险策略。相比而言,推理大模型具备显著的优势。一方面,推理大模型能够以自然语言输出分析结果,具备可读性和可解释性;另一方面,深度推理大模型能够给出推理过程,分析步骤清晰透明,有助于投资者依据推理过程进行风险归因,为投资决策提供有力支持。

  (三)数据架构:从结构化向多维度整合

  信用债券分析面临多源异构数据的整合困境,传统模型依赖结构化数据建模的局限性日益凸显。除了财务数据,发债企业的信用风险评估还需要整合文本、时空、关系等多维度数据特征。其中,文本维度包括募集说明书、招股书等非结构化文档及舆情信息,时空维度包括供应链地理数据与区域经济热力图等信息,关系维度涉及股权穿透网络、业务往来与债务担保关联图谱等内容。当前,图数据库和知识图谱技术日臻成熟,其天然适配此类数据的构建和分析。GraphRAG技术为知识图谱与推理大模型搭建了桥梁,使得投资机构既能通过知识图谱缓解推理大模型的幻觉问题(hallucination,即模型输出不准确或完全错误的信息),又能够借助推理大模型大幅降低知识图谱的使用成本和难度。

  (四)技术应用:从人机分治到人机协同

  在进行传统信用债券分析时,基于复杂模型的信用评级过程与分析师的分析过程往往并行推进。由模型得到的结果通常起防范风险的作用,分析师的结论起体现风险偏好的作用,在最终投资决策时,二者相互融合、相互制约。这种人机分治的模式使得分析师难以理解模型结论,也使得模型无法快速响应市场变化。此外,分析师技能的提升取决于其对固定收益市场的理解程度及对发债企业认识的深度,模型精度的提升依赖于数据的拓展和模型的优化,但两者之间亦难以相互学习。在大语言模型的助力下,投资机构可以构建具备自主性、适应性和交互能力的信用债券分析AI智能体。AI智能体能够迅速学习人类经验并校正分析结果,还能够向分析师输出自身的分析经验,从而实现人机协同开展信用债券分析。

  基于推理大模型和知识图谱

  构建信用债券分析AI智能体的实践方案

  AI智能体是大模型发挥业务价值的重要载体,除了存储信息的知识库,通常还包括4个模块:一是感知模块,负责读取和收集相关数据;二是决策模块,作为智能体的中枢,自主规划各类任务,依据数据进行决策判断,确定下一步执行方案;三是执行模块,落实决策模块提出的操作要求,例如运用搜索工具进行计算等;四是学习模块,依据外界变化或与外界的交互来调整规划方案,优化相关决策。

  信用债券分析AI智能体契合信用债券分析的数智化发展趋势,能够通过多种技术组合提升生产效能。本文基于推理大模型和知识图谱技术展开实践,围绕发债企业构建了信用债券分析AI智能体。

  (一)感知模块——构建知识图谱

  2024年7月,微软公司推出基于大语言模型的知识图谱生成与检索框架。该框架由大语言模型阅读文字资料,抽取每段文字中所涉及的三元素(实体、属性和关系),并对三元素加以描述,从而生成知识图谱。其中,文字抽取环节对模型的逻辑性有极高要求,中小模型难以承担,必须依靠千亿参数以上的超大模型。该环节主要致力于处理大量同质化任务,要求结果具有一致性和准确性,不过任务相对简易,暂不需要推理大模型参与。

  在实践中,笔者运用深度求索V3(DeepSeek-V3)模型来阅读发债企业的募集说明书、评级报告、关联企业工商信息、风险舆情等材料信息,生成发债企业的知识图谱,并将地区经济、财务数据等结构化数据注入知识图谱,可构建出一张能够让AI理解的全市场发债企业知识图谱(见图1)。同时,依据社区检索算法(如Leiden算法)对发债企业和所有关联企业、个人进行多维度聚类,挖掘传染性风险。在知识图谱抽取过程中,一旦发现异常情况,感知模块便会及时向决策模块进行报告。

基于推理大模型与知识图谱构建信用债券数智化分析新范式

  笔者在图谱构建过程中,开创性地融合了非结构化数据与结构化数据,并引入算法去重机制,进一步提升了图谱的知识密度,减少了多个图谱的维护成本。在图谱生成时,以协变量作为节点关系的辅助性事件记录,可在不提升图谱复杂度的情况下大幅提升图谱的信息承载能力。当前,得益于混合专家(Mixture of Experts, MOE)架构大模型的低推理成本和图谱结构优化,知识图谱的构建成本大幅降低。据测算,将2024年全部银行间市场发行的信用债券1募集说明书构建成一张知识图谱,总费用只需要大约60万元。如进行本地化部署后,所需开销会更低。

  (二)决策模块——规划和反思

  决策模块的主要作用在于对感知模块发现的风险进行研判,利用信用分析框架定期更新企业信用评级和信用报告,同时回答分析师的提问。上述功能皆为低频、复杂且极具个性化的任务,AI需要将任务拆解为条理清晰的步骤依次执行,每个执行过程会涉及工具(如知识图谱检索工具、网络搜索工具、计算工具)调用,在执行遭遇问题时要能够自主解决问题(如反思执行方案、询问人类、跳过步骤)。

  在推理大模型出现之前,业界通常采用思维树(ToT)框架、语言代理树搜索(LATS)框架来进行任务拆解、执行、评估,以增强普通大语言模型的规划、反思能力。然而,由于搜索空间有限,此类方案只能在推理成本、响应时效和决策效果三者之中择其一。推理大模型的出现使得上述三者几乎能够同时兼顾。在实践中,笔者以DeepSeek-R1模型作为智能体的决策模块,对任务步骤进行规划、拆解,生成的系统性信用分析框架如图2所示。

基于推理大模型与知识图谱构建信用债券数智化分析新范式

  (三)执行模块——检索知识图谱

  在执行阶段,最为重要的任务是响应决策阶段所提出的信息检索需求,比如获取发债企业财务指标、掌握企业与政府之间的业务往来情况。此前在感知阶段,已经构建了全市场一体化的发债企业知识图谱,因此只需要大语言模型依据知识图谱按图索骥进行检索,便能准确获取企业的特定信息。执行阶段与感知阶段相似,均为同质化的单一任务。

  得益于知识图谱的高密度信息承载能力,在检索知识图谱时对算力的需求大大降低。此外,笔者在检索过程中引入分级检索机制,进一步实现了节约算力、提升准确率的效果。

  (四)学习模块——学习总结经验

  学习模块包含两部分功能:其一,对分析师已有的分析成果予以总结提炼,以供决策模块参考;其二,对进行信用分析时发现的异常情况,提炼出全新的分析视角和维度,经分析师验证后供决策模块参考。与决策模块类似,学习模块需要具备复杂的推理能力,适合以深度推理大模型作为基础底座。在实践中,笔者采用DeepSeek-R1模型阅读了8个重要行业的313篇研究报告,形成的行业分析要点可供决策模块参考。

  未来展望

  相比传统信用债券分析方法,以推理大模型和知识图谱为基础的信用债券分析AI智能体在效率、成本、稳定性等方面呈现显著优势。其应用普及,一方面能够有效降低投资机构信用评估成本,增强信用债券定价能力,提升交易决策水平;另一方面有助于金融机构更加高效快捷地发掘优质客户,拓展服务实体经济的深度和广度。

  以DeepSeek系列模型为代表的高性能、低成本开源大语言模型的影响正不断显现,未来,相关创新也将优化金融市场的数智化生态。特别是具备强大逻辑分析能力的推理大模型,有望在信用分析、投资决策等金融生产活动中发挥重要作用。随着大语言模型、多模态算法、知识图谱等技术的持续迭代,AI在金融领域的作用将进一步凸显,并强化金融行业的价值发现功能,使逆向选择成本大幅降低,从而最终降低全社会的融资成本,进一步促进金融资源的有效配置。

  注:

  1.信用债券依据万得(Wind)口径,其统计数据显示,2024年银行间市场共发行信用债券12027只。

  参考文献

  [1]王正绪,栗潇远. 实证社会科学研究中的因果推断:挑战与精进[J]. 社会科学,2023(8).

  [2]徐劲,许皓玮,葛善伟. 运用机器学习强化银行风险预警[J]. 中国金融,2022(2).

  [3]Altman E I. Financial Ratios, Discriminant Analysis and The Prediction of Corporate Bankruptcy[J]. Journal of Finance, 1968, 23(4).

  [4] Blume M E, Lim F, MacKinlay A C. The declining credit quality of US corporate debt: Myth or reality?[J]. The journal of finance, 1998, 53(4).

  [5]Bozanic Z, Kraft P, Tillet A. Qualitative disclosure and credit analysts’ soft rating adjustments[J]. European Accounting Review, 2023, 32(4).

  [6]Ji S, Pan S, Cambria E, et al. A Survey on Knowledge Graphs: Representation, Acquisition, and Applications[J]. IEEE Transactions on Neural Networks and Learning Systems, 2021, 33(2).

  [7] Merton R C. On The Pricing of Corporate Debt: The Risk Structure of Interest Rates[J]. Journal of Finance, 1974, 29(2).

  [8] Treacy W F, Carey M. Credit Risk Rating Systems at Large US Banks[J]. Journal of Banking & Finance, 2000, 24(1-2).

本文来自作者[水袖萦香]投稿,不代表运输号立场,如若转载,请注明出处:https://xn--5nq41wa3486cyiaxc.cn/txbk/202504-9559.html

(1)

文章推荐

  • dnf转职等级dnf几级转职业

    dnf几级转职在《地下城与勇士》游戏中,当你达到18级时,就可以开始进行转职操作了。不同职业有不同的转职导师,你需要根据自己的职业选择正确的导师进行转职。例如,枪手的转职导师是凯丽,格斗家的转职导师是风振,魔法师的转职导师是莎兰,鬼剑士的转职导师是G.S.D,圣职者的转职导师是歌兰蒂斯。总之,只要

    2025年03月01日
    21
  • sp3下载ghostXPsp3下载

    xpsp3原版光盘系统下载1、xp系统安装教程:xp系统下载到电脑怎么安装具体步骤是什么下载地址中关村ghostxpsp3原版系统iso镜像v20105中关村ghostxpsp3原版系统iso镜像集成海量硬件驱动,安装过程中提供选择安装。集成vb、vc++2002002010运行库库支持文件,确保

    2025年03月04日
    20
  • 寒流枪寒流枪在哪

    寒流枪怀旧服寒流枪1、打小莹峰用的(冻住他再抓)打别人会出现冻住的效果要塞保卫战可使用(本人不推荐)抓小莹峰到云霄星2层里面有个飞来飞去的峰用寒流强射他一下就可以抓了抓小莹蜂,把他打冻住,再抓就打小淫风用的,别的没啥好用可以去抓小莹蜂,用寒流枪冻住他。2、用寒冰枪冰住它再点击,寒冰枪要用米

    2025年03月06日
    24
  • 金蝶国际暴涨逾22% 设立卡塔尔公司进军中东市场

      金蝶国际(00268)早盘暴涨22.55%,现报17.28港元,成交额18.41亿港元。  2月25日,金蝶国际宣布成立卡塔尔公司,进军中东市场。据悉,2023年12月,金蝶国际与卡塔尔投资局(QIA)宣布达成一项协议,QIA将向其投资约2亿美元。此次战略投资不仅体现了QIA对金蝶作为中国企

    2025年03月06日
    28
  • 博时基金于玥:解析“她经济”与新兴领域“五年十倍”投资机遇

    专题:2025女神节:致敬基金圈“她力量”解析女性投资理财  3月8日,蛇年权益资产机会来了?哪些赛道可能成为蛇年投资主线?新浪基金对话博时基金权益投资一部基金经理于玥为您解析>>视频直播  于玥表示,宠物经济、潮玩盲盒以及AI在消费、医疗等领域的应用都具备广阔的市场空间。此外,在机

    2025年03月08日
    21
  • ti6奖金ti6奖金池有多少了

    ti6是什么意思?TI6是指第六届DOTA2国际邀请赛。DOTA2国际邀请赛,简称TI,创立于2011年,是一个全球性的电子竞技赛事,由DOTA2的游戏开发商ValveCorporation主办,用于庆祝DOTA2这款游戏的诞生与发展。每年,全球最优秀的DOTA2战队都会聚集一堂,为了争夺DOT

    2025年03月11日
    21
  • 微商铺微商铺下载

    公众号开通微商铺后微小店怎么显示在手机端在微信上开设商铺,首先需要注册一个微信服务号,并进行认证,这一步骤是确保店铺合法运营的基础。认证通过后,需要开通微信支付功能,以便于顾客通过微信完成支付。接着,可以通过微信提供的微小店功能直接开设店铺,微小店操作简便,功能齐全,适合个体商户使用。微信服务号开

    2025年03月14日
    15
  • 连锁店加盟连锁连锁店加盟有哪些

    加盟店和连锁店一样吗?1、不一样。所谓的加盟,就是该企业组织,将该服务标章授权给加盟主,让加盟主可以用加盟总部的形象、品牌、声誉等,在商业的消费市场上,招揽消费者前往消费。2、产权关系不同。加盟连锁(特许连锁)是独立主体之间的合同关系,各个特许加盟店的资本是相互独立的,与总部之间没有资产纽带;而直

    2025年03月21日
    12
  • 暗黑2雇佣兵装备暗黑2雇佣兵装备栏

    暗黑2第一幕给的雇佣兵(女的)左边的装备放弓箭,右边放什么装备?大哥们...1、尽管第一幕中的雇佣兵没有明确的弹药限制,装备箭袋仍然是一个好主意,因为它可以增加你的备用弹药量。此外,箭袋和其他装备一样,可以为你的角色提供额外的攻击力或其他属性加成。值得注意的是,雇佣兵的装备不会像玩家角色那样有耐久

    2025年03月23日
    6
  • 特朗普贸易政策引发需求担忧,咖啡和可可价格下滑

      全球可可和咖啡价格下跌,原因是投资者担心唐纳德・特朗普总统对美国进口商品征收惩罚性关裞的举措,会损害美国这个全球最大的巧克力和咖啡消费国对这些产品的需求。  食糖价格也出现下跌,被卷入了关裞纷争之中,因为美国也是世界上最大的食糖进口国之一。  特朗普表示,他将对所有美国进口商品征收10%

    2025年04月04日
    8

发表回复

本站作者后才能评论

评论列表(4条)

  • 水袖萦香
    水袖萦香 2025年04月07日

    我是运输号的签约作者“水袖萦香”!

  • 水袖萦香
    水袖萦香 2025年04月07日

    希望本篇文章《基于推理大模型与知识图谱构建信用债券数智化分析新范式》能对你有所帮助!

  • 水袖萦香
    水袖萦香 2025年04月07日

    本站[运输号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 水袖萦香
    水袖萦香 2025年04月07日

    本文概览:  ◇ 作者:中国邮政储蓄银行金融市场部 杨再宝 张涵 刘晨晔 程昊   ◇ 本文原载《债券》2025年3月刊   摘   要   受知识图谱、大语言模型等前沿人工智能(AI)...

    联系我们

    邮件:运输号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们