卷 2 编号 4 (2025): 中文大语言模型越狱框架

					查看卷 2 编号 4 (2025): 中文大语言模型越狱框架

如何突破大语言模型的安全防护机制?

采用场景伪装手段,将恶意指令隐匿于安全语境之中,并通过指令拆分技术将风险内容碎片化,从而利用模型的推理能力重组并执行有效载荷。

已发布: 2025-12-31

文章