研究人员抓取20亿条Discord消息并发布在线

一组巴西研究团队使用Discord的公共API,抓取了超过20亿条消息,并将其数据库发布到网上。这些数据来自3,167个服务器,涵盖了2015年至2024年间的所有帖子。尽管研究人员声称已对数据进行匿名化处理,但几乎没有人会对自己近十年的消息被公开存储在在线JSON文件中感到舒适。同时,另一位程序员发布了一个名为”Searchcord”的工具,基于不同的数据集,展示了未匿名化的聊天记录。

来源