
三六零数字安全科技集团有限公司近日发布了《2025年大模型安全白皮书》,这份报告深刻分析了大模型技术在推动行业智能化变革的同时,所带来的安全风险和挑战,并提出了构建大模型安全全链路防护体系的核心理念和策略。报告指出,随着人工智能技术的快速发展,大模型安全问题已从传统的网络安全边界扩展到模型全栈,涉及基础设施、数据、内容等多个层面,形成了一个多维、动态、交织的复杂威胁矩阵。报告中不仅详细论述了大模型安全的四大核心观点,还提出了“以模治模+平台原生安全”的技术应对策略,以及通过生态共治构建可信AI生态的未来倡议。这里面有很多关于如何确保大模型安全、向善、可信、可控的宝贵内容,对于理解当前AI安全领域的最新动态和未来趋势具有重要价值。

在人工智能飞速发展的今天,大模型技术已成为推动各行业智能化变革的关键力量。然而,随着大模型技术的广泛应用,其安全风险也日益凸显,对个人、企业乃至国家安全构成威胁。《大模型安全白皮书》深入剖析了大模型安全的全链路挑战,并提出了应对策略,旨在构建一个“安全、向善、可信、可控”的AI世界。
大模型安全风险是系统性的,贯穿基础设施、模型层、数据层、智能体层及用户端五大层次。据IDC预测,到2030年,人工智能将为全球带来22.3万亿美元经济收入,大模型正驱动百行千业智能化变革,而开源大模型在性能提升、部署成本降低的推动下,加速向政务、金融、能源等重点行业落地,安全风险也随之渗透到全生命周期。从模型层的提示注入、越狱攻击,到数据层的敏感信息泄露,再到应用层的智能体越权,任何一处漏洞都可能威胁个人、企业国家的财产安全,甚至是生命安全。
大模型的“幻觉”问题、智能体在工具调用中的越权风险、以及数据泄露与知识污染,共同构成了一个多维、动态、交织的复杂威胁矩阵。面对这一全球性挑战,中国开创了“发展与安全并重”的敏捷治理之路,以《生成式人工智能服务管理暂行办法》为代表的“包容审慎、分类分级”原则,为技术创新与风险防控提供了动态平衡的框架。
360主张采用以AI对抗AI、原生融合安全的新范式来应对大模型时代的安全挑战。提出“外筑‘以模治模’动态屏障,内固‘平台原生’安全底座”的核心理念,将安全能力内嵌于大模型的构建、训练、部署与运营的全过程。通过构建一个纵深防御、动态演化的全景框架,从基础设施安全、内容与价值对齐、幻觉缓解到智能体行为管控,实现从“网络安全”到“大模型安全”的范式升维。
大模型安全的复杂性、全局性,决定了仅靠单一力量的技术或资源难以实现全链路、全场景的大模型安全治理。必须通过标准共建、产学研协同——例如开源安全模型、共建联合平台,以及组建产业联盟等形式,汇聚各方力量,共同打造智能时代可信、向善的安全基底。
360提出的“以模治模+平台原生安全”是应对新范式的技术必然。通过专用安全大模型,例如风险检测、幻觉纠正与红蓝对抗模型,对抗通用大模型风险,它既具备“外挂式”插件的灵活快速,又兼具“原生式”的深度安全能力,实现了双向赋能的协同防御,构筑起从模型、数据、内容到行为的全链路深度防护体系。
大模型安全的治理,需要企业、行业组织、与用户等多方合力共筑。我们呼吁所有大模型技术与服务提供商,将“安全、向善、可信、可控”奉为发展的生命线。唯有坚守这一底线,AI创新才能行稳致远。核心在于践行“以模治模、原生安全”理念。需将安全能力深度融入大模型全生命周期,让安全成为每个环节的固有属性,而非事后补充。这不仅是风险防控的必然要求,更应成为企业的核心产品竞争力。
这篇文章的灵感来自于《大模型安全白皮书》。除了这份报告,还有一些同类型的报告也非常有价值,推荐阅读,这些报告我们都收录在同名星球,可以自行获取。
以上为节选样张,关注公众号【蝉鸣报告】回复领取PDF完整电子版(无广告)。
【蝉鸣报告】每日更新最新硬核报告,覆盖产业报告、全球化、经济报告、趋势等全领域。
蝉鸣报告(原爱报告知识星球)







