Twitter 公司刚刚更新了自家的社交平台 API,以便被许可的开发者和研究人员能够实时研究有关 COVID-19 的公开话题讨论。预计每日产生的数据集将包含数千万条推文,且允许开发者们跨语言访问与新冠病毒和 COVID-19 疾病相关的内容。
(来自:Twitter Developer)
这些数据可用于研究与新冠病毒大流行有关的一系列主题,包括疾病传播、不实信息、社区内危机处理等。
Twitter 指出,开发者还可借助新数据集来构建机器学习和数据工具,以帮助科学界回答有关 COVID-19 的关键为你。
该公司将根据推文中使用的关键词来确定哪些内容是符合条件的,并且会查询常见的话题标签(涵盖多种语言)。此外,Twitter 将对数据流进行过滤,以排除垃圾邮件和低质量内容。
需要指出的是,尽管端点 API 开放了免费访问,但平台方仍将严格审查哪些开发者和研究人员才能被授予使用权限。
有需要的开发者必须向 Twitter 告知其项目计划,详细说明他们在大数据使用方面的经验,以及处理此类数据的可用资源。