AI代码建议破坏软件供应链

随着以大型语言模型(LLM)为驱动的代码生成工具的兴起,软件开发的方式正在发生变化,但同时也引入了新的供应链风险。这些AI编码助手常常会“幻觉”出不存在的软件包名称。来源

研究人员发现,商业模型中约5.2%的软件包建议是不存在的,而开源或公开可用模型中,这一比例高达21.7%。这一现象被一些不法分子利用,通过在软件包注册表或索引(如PyPI或npm)上上传恶意软件包来进行攻击。

安全公司Socket的CEO Feross Aboukhadijeh表示,这些虚假的软件包名称看起来非常可信,开发者在没有仔细核对的情况下就可能安装这些包,从而带来安全隐患。Python Software Foundation的Seth Michael Larson称之为“slopsquatting”,意指这些虚假软件包名称是AI模型输出的“垃圾”。