大模型安全涉及到大模型的设计、训练、部署和应用的全过程,要求对数据的采集、存储、处理、传输、使用等环节进行系统化的管理与控制。首先需要考虑大模型作为通用信息系统的安全需求,构建安全的计算环境;并在此基础上,针对大模型面临的独特挑战,如运行框架风险、供应链风险,及模型污染、对抗攻击、数据泄露、信息操纵、偏见传播等威胁,需思考新的安全对策。

从治理结构看,大模型安全治理体系是针对大模型可能面临的安全风险而建立的系统化管理框架,不仅需考虑技术维度的安全控制措施,也需要从法律法规、监控审计、应急响应及合规评估等多个方面进行全面布局,确保大模型的系统安全、数据安全与行为安全。

1、安全目标

大模型数据安全与隐私保护的安全目标包括:

(1)敏感数据的安全性

大模型在训练推理与运营中使用的敏感数据,如个人、企业专有数据需通过安全控制机制防止未经授权访问、数据泄露、数据篡改,保证数据在存储、传输、使用过程中的安全。

(2)隐私信息处理的合规性

隐私涉及到大模型训练过程对数据源中隐私信息的处理、企业在使用大模型过程中对内部数据中隐私信息的处理。未经数据所有人授权,应避免收集、使用或披露个人信息,以维护用户隐私和信任,规避大模型不当使用带来的法律风险。

(3)模型安全

模型安全涉及模型防篡改、模型防滥用、模型设计框架安全、模型运行框架安全及模型部署安全,以保证模型产生准确且值得信赖的输出结果,模型决策可信,与伦理价值对齐,减少错误信息或偏见内容的传播。同时,安全可靠模型应具备缓解未知威胁的能力。

2、安全架构

针对数据安全与隐私保护需求,基于密码的大模型安全架构如图所示: image

该架构从基础设施安全、模型内生安全、模型应用安全三个方面,分别提出基于密码的安全控制措施,并共同构筑多层次的大模型数据安全与隐私保护体系,以期为大模型安全应用提供指导与参考。

(1)基础设施安全

基础设施安全通过构建可信计算环境、加固运行框架、执行模型不同部署模式的安全控制等来实现。 可信计算环境为大模型的运营提供安全可靠的基础环境及安全算力支撑,主要包括以下安全机制:数据存储安全/数据传输安全、身份认证/资源隔离与访问控制、可信执行环境、硬件密码模块支撑。 针对于大模型的运行框架存在的开放性、安全管控薄弱等问题,采取针对性的安全加固技术,防止数据或隐私在运行框架层的泄露与损害。安全运行框架主要通过以下安全机制来落地:增强的身份鉴别与访问控制、安全隔离、模型存储与加载安全、模型完整性验证/源验证、运行环境加固与安全配置。 大模型部署包括云上托管、自托管等模式。针对于不同部署方式的特点,安全部署主要包括以下安全机制:云端部署安全、本地部署安全、混合部署安全。

(2)模型内生安全

模型内生安全涉及模型设计、训练、推理等各个环节的安全保护,旨在确保模型产生准确且值得信赖的输出结果。同时,模型训练及推理所存储、使用的数据集,能够抵抗数据泄露、数据污染、隐私侵害等风险,模型本身作为重要信息资产及辅助决策资源,能够抵抗模型盗取、滥用、篡改等攻击,保护模型参数(权重、梯度、偏置)安全,提升模型决策的可信性。 模型内生安全通过算法安全与参数安全、训练推理安全、模型迭代安全等安全控制机制与防护措施实现。 在算法安全与参数安全方面,首先要求通过改进、加固等手段提升大模型所依赖的如 PyTorch、TensorFlow 等深度学习框架的安全,补齐深度学习框架涉及的深度学习算法、依赖的组件、工具等脆弱性短板,通过材料清单等手段加强版本管理与监控;其次通过安全隔离、加密、完整性校验、参数防篡改、访问控制等保证模型参数的安全,进而降低模型盗用的风险。 在训练推理安全方面,涉及到训练及推理所使用数据集的安全性与合规性问题。通过对数据完整性及源验证等管控手段,防止数据防篡改,并通过敏感数据脱敏、匿名、泛化、安全多方计算、联邦学习等技术提供隐私保护。本节也针对大模型的输入/输出攻击、越狱攻击等威胁提出了越狱攻击针对性训练、恶意提示词检测、输出结果合规性审核等安全控制机制与防护措施。 在模型迭代安全方面,主要针对于模型微调、知识蒸馏、模型漂移等模型更新场景,提出了增量数据质量监控、模型隔离、对抗训练、数据溯源等安全控制机制与防护措施。

(3)模型应用安全

模型应用安全主要针对于大模型应用过程中,因身份假冒或权限管理不当导致模型滥用或资源非授权访问、API 接口攻击、恶意的数据输入输出或供应链漏洞导致数据及隐私泄露等问题,从身份认证与授权管理、设计与接口安全、数据安全与隐私保护等维度提出有效的安全控制机制与防护措施。 身份认证与授权管理包括多因素身份认证、去中心化身份认证、零信任架构、细粒度访问控制、多用户间数据隔离、动态权限调整等安全控制机制与防护措施。 设计与接口安全包括安全编码与开发环境代码加密、API 安全配置、输入验证/消毒、输出审核追踪、输出结果加密、提示词安全、RAG/Agent 安全、供应链安全等安全控制机制与防护措施。 数据安全与隐私保护包括密态存储、安全检索与查询、模型及数据跨域安全推理、分布式模型密态推理等安全控制机制与防护措施。


Related Posts

量子安全:数字世界的未来盾牌,你准备好了吗?

量子安全是指利用量子计算的独特性质,来保护数字信息的安全。与传统的基于数学难题的加密技术不同,量子安全利用量子比特来实现信息的快速加密和解密。

勒索病毒防护

介绍勒索病毒的基本概念、类型、攻击方式和防护措施,帮助用户了解勒索病毒的风险和防范方法。