跳转到主要内容

《皮囊之下:大数据工作》(Under the Skin: Big Data at Work

2014年设计毕业生亚伦马丁内斯图

自从未来学家阿尔文·托夫勒(Alvin Toffler)在近50年前首次警告世界,信息过载将带来“未来的冲击”,科学家们就一直在加班工作,以迎接数字时代的挑战和机遇。

这也难怪。成功利用大数据的力量的回报可能是巨大的。来自国家安全专家挑逗潜在威胁对企业领导者试图击败其竞争对手的潜在威胁的早期迹象,赌注很高。

但是,如果你真的为挑战,那就享受了一个奇妙的航程生物信息学-将大数据分析应用于现实世界问题的最热门领域之一

生物信息学的研究人员开发工具来帮助理解庞大,复杂和多样化的数据集由在生物和医学.这些数据大多以DNA串的形式出现,其中包含有机体的所有遗传信息。

在人类中,大约3亿碱基对腺嘌呤,鸟嘌呤,胞嘧啶和胸腺嘧啶 - DNA扭曲的梯子上的梯级。这些碱基的序列提供了有机体所需的指令,以发展,生存和繁殖。

在他的实验室百周年校园,植物病理学家大卫鸟带领大学的新生物信息学集群,将遗传,统计,计算机科学与生物学的顶级研究人员汇集在一起​​。伯德说,迎接大数据的挑战引发了“我们做科学的方式的哲学变革”。

对于一件事,研究人员现在拥有十年前的计算能力和统计工具,这是一个十年前是不可能的任务,就像经过一串DNA到100亿测试。DNA测序为研究人员提供了前所未有的深入了解基因组的内部作品 - 解释了蛋白质如何进行,鉴定哪种突变与癌症风险相关,或者显示寄生虫如何与其宿主相互作用。

在我们的基因中

“有些人使用在大海捞针中寻找针的类比,”统计学家弗雷德赖特说。“但这不是我们正在做的事情。我们实际上是在寻找很多很多的干草堆里的针。

赖特是北卡罗来纳州立大学新生物信息学团队的成员,也是生物信息学研究中心(bioinformatics Research Center)的主任。他正在研究囊性纤维化患者的基因变异。囊性纤维化是一种遗传性疾病,会对肺部和消化系统造成严重损害。

生物信息研究中心主任弗雷德·赖特(左)和生物科学研究副教授周贻辉将大数据方法应用于人类健康问题。
生物信息研究中心主任弗雷德·赖特(左)和生物科学研究副教授周贻辉将大数据方法应用于人类健康问题。

赖特说:“即使有现代医学,有些囊性纤维化患者15岁就死了,有些活到50岁。”“我们试图理解的正是这种变化。他们的DNA结构中是什么让一些人活了这么久?”

回答这个问题,赖特和合作者Unc-Chapel Hill囊性纤维化中心在成千上万的囊性纤维化患者中进行复杂的遗传分析 - 一种数据嘎吱嘎吱的挑战,即科学家们只有快速,强大的计算机才能解决。通过比较不同人的遗传谱,研究人员正在学习疾病的进展情况。

“如果我们发现与减少肺功能相关的变化,那么它就成为医学遗传学家的工作,以了解基因如何相互作用或介导免疫系统导致肺部发炎,”赖特解释说。“最终的希望是可能有一种药物目标可以有助于解决问题。”

跟踪毒素

从保护作物的杀虫剂到注入页岩形成中的加压液中以提取天然气和石油,有毒化学品对人和环境的风险造成不断增长的风险。寻找毒素和疾病之间的遗传联系至关重要 - 并且非常困难。

“为什么人们对同一环境的反应不同?”问大卫·赖夫,在美国环境保护局七年后加入了NC国家的统计学家和遗传学家。“如果两个人喝了同样的自来水,为什么一个人生病,而另一个人没有?”

答案可能位于遗传变异Reif研究中。但是,即使在他的指尖中的主要研究大学的所有计算能力累积了大量的数据并流失了报告的卷,那么电脑无法在科学中表现最重要的功能:思考。

David Reif,遗传学副教授
David Reif,遗传学副教授

“计算机并没有解决问题而不是在哪里以及如何看起来,”Reif说。“但它在没有无聊的情况下表演简单的任务。”

一旦计算机完成了突出显示有前途的关联的工作,赖夫就开始了解释数据的挑战性工作。毒性暴露导致身体疾病的遗传途径很少有明确的标志。但研究人员在大数据方面才刚刚起步。

如果你觉得统计学家主导医学和环境健康研究项目很奇怪,那么是时候更新你的想法了。在大数据时代,健康解决方案既可能来自传统临床试验,也可能来自分析。

“过去十年发生了变化,”生物信息学集群的负责人伯德说。“统计学家不再只是为你的实验提供帮助的人服务。他们现在是这门学科的领导者。”

这个故事的版本出现在2014年秋季问题上结果,在NC州的研究,创新和经济发展的二年步杂志。阅读完整的故事。

留下回应

您的电子邮件地址不会被公开。各个领域都需要。