瑞士近日推出名为Apertus的全开源多语言大型语言模型(LLM),该模型以隐私保护为核心原则,并在全球范围内引发关注。Apertus由ETH Zurich团队主导,通过处理超过15万亿词元、涵盖1000多种语言进行训练。Apertus项目的最大特色在于对开放性的高度承诺——不仅公开模型权重,还完整披露训练数据集、文档和所有训练过程细节,所有资源均采用宽松的开源许可,可用于商业项目。
与众多只能通过API交互的专有模型不同,Apertus允许研究人员和监督机构自由审查其训练数据以及合规性。这一公开透明流程,让外界可以验证模型的法律合规性和数据保护情况。该项目严格遵守瑞士的数据保护和版权法规,并在数据源收集阶段引入了溯源式主动退出机制,以尊重原数据方意愿。
ETH Zurich项目负责人Imanol Schlag表示,Apertus致力于成为面向公众利益的数字基础设施,类似公共事业设备,为AI未来发展开辟新路径。目前,Apertus不仅上线瑞士本地Swisscom Sovereign Swiss AI平台,同时也通过Hugging Face及Public AI Inference Utility等渠道开放获取。