大模型逆向工程：谷歌Gemini遭遇史上最大规模“提示词克隆”攻击

网络安全界近期曝光了一起针对谷歌（Google）旗舰级大模型 Gemini 的极端攻击事件。据谷歌安全团队透露，匿名攻击者通过高度自动化的脚本，在短时间内向 Gemini 发送了超过 10 万次经过精心设计的提示词（Prompts），试图通过这种“暴力破解”的方式克隆其底层逻辑。

这并非传统意义上的系统入侵，而是一场硬核的“模型逆向工程”（Model Inversion）。攻击者的目标非常明确：通过海量的输入与输出对比，逆向推导 Gemini 的参数分布与权重逻辑。

在安全专家看来，这属于典型的大模型“蒸馏攻击”（Distillation Attack）。攻击者将 Gemini 作为一个昂贵的“教师模型”，通过记录其对不同指令的反馈，训练出一个廉价但表现极度接近的“学生模型”。这种行为不仅是对知识产权的野蛮掠夺，更是对模型安全防护体系的巨大挑战。

谷歌安全团队在监测中发现，这些攻击指令并非杂乱无章，而是涵盖了复杂的逻辑推理、代码生成及敏感语义边缘测试。攻击者试图寻找 Gemini 过滤机制的边界，一旦成功克隆，他们就能在本地部署一个几乎等同于 Gemini 能力、且不受任何伦理限制的私有模型。

此次攻击暴露了 AI 行业的一个致命漏洞：API 即泄露。只要模型对外提供服务，其核心资产就处于被逆向推导的风险之中。目前，谷歌已紧急升级了速率限制（Rate Limiting）和异常流量检测算法，但对于这种模拟正常用户行为的“蚂蚁搬家式”克隆，防御成本正呈几何级数增长。

对于 AI 厂商而言，这场 10 万次提示词的洗劫敲响了警钟。在大模型时代，保护源代码和数据库已远远不够，如何防止模型本身的“语义泄露”，将成为未来十年安全防御的核心战场。

本报道由圈小蛙（qxwa.com）科技资讯站特约稿。🐸️

科技圈动态，尽在圈小蛙