Bluesky 用户讨论有关用户数据和 AI 训练的计划

社交网络 Bluesky 在 GitHub 上提出了一项新提案,详细说明了用户控制是否可以出于生成式 AI 训练和公共存档等目的抓取数据的选项。首席执行官 Jay Graber 在 South by Southwest 会议上讨论了这一举措,并在 Bluesky 上的一篇文章中进一步阐述了它,导致用户反应不一。一些人表示强烈反对,认为这与 Bluesky 之前承诺的不出售用户数据或将其用于 AI 训练的立场相矛盾。

Graber 回应了这些担忧,解释说来自 Bluesky 的公共数据已经被生成式 AI 公司抓取,类似于任何公共网站上的信息。拟议的标准旨在为数据抓取设定新的指导方针,类似于网站用来管理网络爬虫权限的 robots.txt 文件。这项新标准虽然不具有法律效力,但旨在为合乎道德的数据使用提供明确的期望。

该提案将允许 Bluesky 应用程序和其他使用 ATProtocol 的应用程序的用户调整其设置以允许或限制数据抓取。这种方法旨在平衡用户控制与在线数据抓取行为的现实,从而为数据使用建立一个更加透明和道德指导的框架。

来源