我们中的许多人都熟悉痕迹证据,如毛发、纤维、枪击残留物和土壤等,这些证据被用于将某人与特定地点、物体或事件联系起来。 人们意识到许多地方都有独特的细菌群,因此认为利用人们在旅途中自然采集的微生物来确定他们的行踪将大大有益于医学和流行病学领域,更不用说刑事调查了。
在瑞典隆德大学的领导下,研究人员开发出了一种工具,几乎可以做到这一点。 利用一个人携带的微生物群样本--存在于特定环境(比如海滩)中的微生物群落--它能以惊人的准确度确定样本的来源。
这项研究的通讯作者、隆德大学生物学研究员埃兰-埃尔海克(Eran Elhaik)说:"与人类DNA相比,人类微生物群在我们接触不同环境时会不断发生变化。通过追踪微生物最近的去向,我们可以了解疾病的传播,确定潜在的感染源,并定位微生物抗药性的出现。 这种追踪还提供了可用于刑事调查的法医关键。"
微生物群落就像人类一样,会显示出特定的地理痕迹。 这些群落中的一些数据是全球性的,但也有一些数据仅限于特定区域或环境。 在本研究中,研究人员重点研究了像微小指纹一样的细菌。
"我们分析了来自城市环境、土壤和海洋生态系统的大量微生物组样本数据集,并训练了一个人工智能模型来识别这些指纹的独特比例,并将它们与地理坐标联系起来,"埃尔海克说。"结果证明,这是一个非常强大的工具,可以精确定位微生物组样本的来源地。"
mGPS工具可以区分相距仅172米的两个香港地铁站
研究人员利用来自不同环境的大量微生物组数据对人工智能进行了训练,其中包括来自MetaSUB数据库的4135个样本,该数据库包含从53个城市的地铁和城市环境中采集的微生物基因组、来自18个国家的237个土壤样本以及来自9个水体的131个海洋样本。 研究人员将这一工具命名为"微生物组地理种群结构"(Microbiome Geographic Population Structure)或 mGPS。
接下来,他们对该工具进行了测试。 在 92% 的城市样本中,mGPS 成功地确定了城市来源。 然而,研究人员发现,"mGPS 预测与采样城市之间的最高一致性是在训练数据集中代表性较高的城市"。 为了了解取样较多的地区是否会影响该工具的准确性,他们只对取样少于 100 个的 31 个城市重新训练了模型,计算得出的预测准确率为 87%,仅略低于完整数据集 92% 的准确率。
为了评估 mGPS 的精确度,他们在取样最多的三个城市的 MetaSUB 数据上对其进行了训练: 纽约、香港和伦敦。 在香港,mGPS 可以区分相距 172 米(564 英尺)的两个地铁站。 在纽约市,它能区分距离不到一米(3.3 英尺)的售货亭和扶手。 然而,在伦敦,该工具的预测准确率很低,只有一半的样本被正确地分配到了它们的地理集群中。 研究人员将这归咎于伦敦地铁站的不洁状况(样本是在COVID-19之前采集的),而香港地铁站则被他们形容为"绝对一尘不染"。
研究人员说,随着微生物组数据的收集增加,该工具也将不断完善。
"我们才刚刚开始了解微生物与(环境)之间的关系,"埃尔海克说。"我们现在正计划绘制整个城市的微生物组图,这可能会促进法医调查,让我们了解栖息在我们的街道、花园、皮肤和身体上的生物。"
该研究发表在《基因组生物学与进化》 期刊上。