保险学院发布全球首个保险大模型专业评估基准-中央财经大学新闻网

首页 · 综合要闻 · 正文

您现在位于：

保险学院发布全球首个保险大模型专业评估基准

发布时间：2025-09-17 来源：保险学院

随着人工智能大模型技术在垂直领域的深度渗透，保险行业作为兼具严监管、强风险敏感与专业知识密集特性的领域，其大模型应用的科学评估成为行业迫切需求。在此背景下，中央财经大学保险学院、中国精算研究院发布全球首个保险大模型专业评估体系——“CUFEInse”保险领域评测基准（CUFE Insurance Evaluation Suite），填补了行业空白，为保险大模型的规范发展提供了权威工具。

CUFEInse遵循“定量为主、专家驱动、多重校验”原则，经行业调研、专家命题、交叉复核、敏感性审查四步严谨流程构建而成，形成覆盖保险理论知识、保险行业理解、保险安全合规、保险智能体应用、保险严谨性等五大核心维度的评估体系。该基准v1.0版本收录14,430道高质量题目，全面覆盖模型知识储备、推理能力与场景适应性。评分采用“维度等权、子类均衡”策略，一级维度权重均等，二级子类题目分布均匀，确保评估结果的全面性、可解释性与可对比性。

相较于现有金融领域评估工具，CUFEInse实现多维度创新，树立行业新标杆：系统化梳理保险学科知识，基于规范学科体系，覆盖保险精算、法律等核心领域，避免知识碎片化；优化分类与权重设计，贴合实际业务场景的知识分布与重要性，精准反映模型细分能力差异；强化合规与严谨性评估，针对性设置相关维度，契合保险行业严监管、强风险敏感特性；融入精算与专业认证内容，确保精算计算的专业性与准确性，评估模型专业人才级知识水平；适配多尺度模型需求，兼顾超大参数模型与轻量化模型的评估，支持计算效率检测，为产业选型提供参考。

作为全球首个保险大模型专业评估体系，CUFEInse的发布将为学术界提供研究基准，为产业界提供选型依据，推动保险大模型向安全、可靠、高效方向发展。

CUFEInse遵循Apache-2.0协议开源，数据集部分开源发布至GitHub（https://github.com/CUFEInse/CUFEInse）与HuggingFace（https://huggingface.co/datasets/CUFEInse/CUFEInse）。

撰稿：马冰；审稿：周桦

编辑：刘禹、吴宇昂；审核：孙颖