【360】2025年大模型安全白皮书-蝉鸣报告（原爱报告知识星球）

三六零数字安全科技集团有限公司近日发布了《2025年大模型安全白皮书》，这份报告深刻分析了大模型技术在推动行业智能化变革的同时，所带来的安全风险和挑战，并提出了构建大模型安全全链路防护体系的核心理念和策略。报告指出，随着人工智能技术的快速发展，大模型安全问题已从传统的网络安全边界扩展到模型全栈，涉及基础设施、数据、内容等多个层面，形成了一个多维、动态、交织的复杂威胁矩阵。报告中不仅详细论述了大模型安全的四大核心观点，还提出了“以模治模+平台原生安全”的技术应对策略，以及通过生态共治构建可信AI生态的未来倡议。这里面有很多关于如何确保大模型安全、向善、可信、可控的宝贵内容，对于理解当前AI安全领域的最新动态和未来趋势具有重要价值。

在人工智能飞速发展的今天，大模型技术已成为推动各行业智能化变革的关键力量。然而，随着大模型技术的广泛应用，其安全风险也日益凸显，对个人、企业乃至国家安全构成威胁。《大模型安全白皮书》深入剖析了大模型安全的全链路挑战，并提出了应对策略，旨在构建一个“安全、向善、可信、可控”的AI世界。

大模型安全风险是系统性的，贯穿基础设施、模型层、数据层、智能体层及用户端五大层次。据IDC预测，到2030年，人工智能将为全球带来22.3万亿美元经济收入，大模型正驱动百行千业智能化变革，而开源大模型在性能提升、部署成本降低的推动下，加速向政务、金融、能源等重点行业落地，安全风险也随之渗透到全生命周期。从模型层的提示注入、越狱攻击，到数据层的敏感信息泄露，再到应用层的智能体越权，任何一处漏洞都可能威胁个人、企业国家的财产安全，甚至是生命安全。

大模型的“幻觉”问题、智能体在工具调用中的越权风险、以及数据泄露与知识污染，共同构成了一个多维、动态、交织的复杂威胁矩阵。面对这一全球性挑战，中国开创了“发展与安全并重”的敏捷治理之路，以《生成式人工智能服务管理暂行办法》为代表的“包容审慎、分类分级”原则，为技术创新与风险防控提供了动态平衡的框架。

360主张采用以AI对抗AI、原生融合安全的新范式来应对大模型时代的安全挑战。提出“外筑‘以模治模’动态屏障，内固‘平台原生’安全底座”的核心理念，将安全能力内嵌于大模型的构建、训练、部署与运营的全过程。通过构建一个纵深防御、动态演化的全景框架，从基础设施安全、内容与价值对齐、幻觉缓解到智能体行为管控，实现从“网络安全”到“大模型安全”的范式升维。

大模型安全的复杂性、全局性，决定了仅靠单一力量的技术或资源难以实现全链路、全场景的大模型安全治理。必须通过标准共建、产学研协同——例如开源安全模型、共建联合平台，以及组建产业联盟等形式，汇聚各方力量，共同打造智能时代可信、向善的安全基底。

360提出的“以模治模+平台原生安全”是应对新范式的技术必然。通过专用安全大模型，例如风险检测、幻觉纠正与红蓝对抗模型，对抗通用大模型风险，它既具备“外挂式”插件的灵活快速，又兼具“原生式”的深度安全能力，实现了双向赋能的协同防御，构筑起从模型、数据、内容到行为的全链路深度防护体系。

大模型安全的治理，需要企业、行业组织、与用户等多方合力共筑。我们呼吁所有大模型技术与服务提供商，将“安全、向善、可信、可控”奉为发展的生命线。唯有坚守这一底线，AI创新才能行稳致远。核心在于践行“以模治模、原生安全”理念。需将安全能力深度融入大模型全生命周期，让安全成为每个环节的固有属性，而非事后补充。这不仅是风险防控的必然要求，更应成为企业的核心产品竞争力。

这篇文章的灵感来自于《大模型安全白皮书》。除了这份报告，还有一些同类型的报告也非常有价值，推荐阅读，这些报告我们都收录在同名星球，可以自行获取。

以上为节选样张，关注公众号【蝉鸣报告】回复领取PDF完整电子版（无广告）。

【蝉鸣报告】每日更新最新硬核报告，覆盖产业报告、全球化、经济报告、趋势等全领域。

【360】2025年大模型安全白皮书

猜您想看

评论抢沙发

加入星球任意下载20000+报告

不定期更新一些报告合集

关注公众号限时领取优惠

热门标签

如何快速寻找资料？