综合要闻

您现在位于:
保险学院发布全球首个保险大模型专业评估基准
发布时间:2025-09-17 来源:保险学院

随着人工智能大模型技术在垂直领域的深度渗透,保险行业作为兼具严监管、强风险敏感与专业知识密集特性的领域,其大模型应用的科学评估成为行业迫切需求。在此背景下,中央财经大学保险学院、中国精算研究院发布全球首个保险大模型专业评估体系——“CUFEInse”保险领域评测基准(CUFE Insurance Evaluation Suite),填补了行业空白,为保险大模型的规范发展提供了权威工具。

CUFEInse遵循“定量为主、专家驱动、多重校验”原则,经行业调研、专家命题、交叉复核、敏感性审查四步严谨流程构建而成,形成覆盖保险理论知识、保险行业理解、保险安全合规、保险智能体应用、保险严谨性等五大核心维度的评估体系。该基准v1.0版本收录14,430道高质量题目,全面覆盖模型知识储备、推理能力与场景适应性。评分采用“维度等权、子类均衡”策略,一级维度权重均等,二级子类题目分布均匀,确保评估结果的全面性、可解释性与可对比性。

相较于现有金融领域评估工具,CUFEInse实现多维度创新,树立行业新标杆:系统化梳理保险学科知识,基于规范学科体系,覆盖保险精算、法律等核心领域,避免知识碎片化;优化分类与权重设计,贴合实际业务场景的知识分布与重要性,精准反映模型细分能力差异;强化合规与严谨性评估,针对性设置相关维度,契合保险行业严监管、强风险敏感特性;融入精算与专业认证内容,确保精算计算的专业性与准确性,评估模型专业人才级知识水平;适配多尺度模型需求,兼顾超大参数模型与轻量化模型的评估,支持计算效率检测,为产业选型提供参考。

作为全球首个保险大模型专业评估体系,CUFEInse的发布将为学术界提供研究基准,为产业界提供选型依据,推动保险大模型向安全、可靠、高效方向发展。

CUFEInse遵循Apache-2.0协议开源,数据集部分开源发布至GitHub(https://github.com/CUFEInse/CUFEInse)与HuggingFace(https://huggingface.co/datasets/CUFEInse/CUFEInse)。

撰稿:马冰;审稿:周桦

编辑:刘禹、吴宇昂;审核:孙颖