新的计算机程序旨在减少微生物样本中的DNA污染
微生物样本的DNA测序可以为研究人员和医学专业人员提供关于微生物群落的丰富信息——栖息在我们身体和周围环境中的微生物群落。了解微生物群可以帮助我们理解什么使我们痛苦以及为什么。但是当微生物样本被其他来源的DNA污染时会发生什么呢?
“微生物组测序中的污染可能导致错误的发现,”北卡罗来纳州立大学微生物组和微生物群落助理教授本·卡拉汉(Ben Callahan)说。“例如,研究人员最近认为他们发现了几种可以预测早产的新微生物,但当他们深入研究时,发现这些微生物是污染物。所以这些错误并非无关紧要。”
获得完全不受周围环境污染的样本是不可能的——研究人员预计大多数测序的微生物组样本都有一定程度的污染。然而,在使用低生物量样品(如气道样品)时,污染的影响要比使用高生物量样品(如粪便样品)时大得多,因为在高生物量样品中,合法的微生物种群压倒了污染。
卡拉汉和他的同事们已经创建了一个叫做Decontam,它使用污染物与非污染物的频率和存在的统计模式来识别样本中的污染物。污染物在低浓度样品中出现的频率更高,而且经常出现在阴性对照中。
目前控制污染的方法——包括专门的实验室操作或从样品中消除任何不寻常或罕见的微生物物种——都有显著的缺点,因为它们可能成本高、时间密集,并可能从样品中消除合法的微生物。此外,这些方法不能完全去除污染物。
卡拉汉说:“我们的方法简单、快速、经济。”“这是一个算法,它使用一个简单的二元分类器的基础上区分污染物和noncontaminants两种模式样本:污染物在频率将增加输入DNA的数量减少,和污染物将出现在一个更高的分数负控制样本。
“此外,除了通常在微生物组测序实验中产生的数据,我们的方法不需要额外的数据。”
在测试中,Decontam从人类嘴里收集的数据中,从污染物中提取的测序读数减少了99%以上。该方法在识别和去除大量可能干扰后续分析的污染物方面特别有效。
你可以在这里找到Decontam:https://github.com/benjjneb/decontam
卡拉汉的研究也发表在该杂志上微生物组。
