立即释放
新的计算模型允许研究人员在通常不兼容的数据集上绘制,例如卫星图像和社交媒体帖子,以回答有关目标位置发生的事情的问题。研究人员开发了该模型,作为识别违反核不扩散协议的工具。
“我们的目标是制定一个工作框架,该框架使用各种传感器和数据来源的信息来确定这些潜在的核不扩散行为,”一份文件,电气和电脑教授的一篇论文的Hamid Krim说北卡罗来纳州立大学的工程和董事VISSTA实验室.“其中一些数据可能是常规数据,比如盖革计数器读数或来自卫星图像的多光谱数据。但这些数据来源中有很多可能是非传统的,比如社交媒体上的帖子。这些来源提供了各种各样通常不兼容的数据,比如Twitter帖子上的文本和Flickr上的图片。
“通过使这些不同的输入相互兼容,我们能够接受更广泛的数据输入,并以有意义的方式使用这些数据,最终可以帮助当局得出更可靠的结论,”克里米亚说。
研究人员表示,该模型可用于使用可以识别为来自目标区域的任何数据。例如,卫星图像清晰可识别,但它们也可能借鉴了来自相关区域的主动或被动地标记的社交媒体帖子。
那么问题就变成了:如何处理不兼容的数据?为了解释,我们将使用研究人员在论文中使用的代理问题:识别洪水。他们选择洪水,是因为洪水的数据没有分类,而核活动的数据是分类的。
这个过程的第一步是使用数学方程将每种类型的数据转换成有用的格式。例如,图像可能会在模型中运行以确定它们是否为洪水图像,而文本文章可能会在模型中运行以确定它们是否包含洪水引用。一旦这些数据流被转换成一种中立的格式——意味着它们表示泛洪或无泛洪——它们就可以相互比较,以回答一些基本问题,如:数据是否相互支持?
但这并不简单。例如,人们可能会推特关于正在发生数百英里之外的洪水,这可能会歪斜总体模型的任何计算。为了解决这个问题,研究人员纳入了占据他们绘制的数据的复杂性的数学元素。
克里姆说:“在防扩散执法的背景下,解决复杂性问题尤为重要。”“相关的数据输入可能包括特定类型的技术的照片,通过音频录制的对话中的参考信息,等等。像我们开发的模型需要足够灵活,以解释各种类型的数据和我们正在寻找的各种线索的可变性和复杂性。”
研究人员使用2013年发生在科罗拉多州的洪水数据测试了他们的模型,并能够解决多模态数据的不兼容性,以便准确估计洪水的位置。
该项目的后续步骤包括评估西方的核设施,以确定可能还适用于更多孤立的社会的设施,例如朝鲜。
“我们想要找到将信息从已知环境转移到隐藏环境的方法,”克里米亚说。“给定不兼容或不一致的数据,我们如何确定哪些信息和哪些模型可以从一个地方转移到另一个地方?”什么是正常的,什么不是?这不是一个容易的问题。”
本文,“融合异质数据:以遥感与社交媒体为例,“在线在线发布地球科学和遥感的IEEE交易.本文的第一作者是韩王,这是一个前博士后研究员,该研究人员在北卡纳斯德克萨斯大学的博士后。其他共同作者是Erik Skau,前博士。NC州的学生是洛杉矶阿拉莫斯国家实验室,宾夕法尼亚州立大学Guido Cervone的博士学位。
这项工作得到了美国能源部国家核安全管理局国防核不扩散研发办公室的支持,通过北卡罗莱纳州立大学的防扩散能力联盟(Consortium for Nonproliferation Enabling Capabilities at North Carolina State University),授权号为DE-NA0002576。
- 船员 -
编辑注:研究摘要跟随。
“融合异质数据:遥感与社交媒体案例”
作者: Han Wang, Erik Skau和Hamid Krim,北卡罗莱纳州立大学;Guido Cervone,宾夕法尼亚州立大学
发表: 7月17日,地球科学和遥感的IEEE交易
迪伊:10.1109 / TGRS.2018.2846199
摘要:数据异质性可以提出巨大的挑战来处理和系统地融合来自不同模式的低级数据,没有求助于启发式和手动调整和改进。在本文中,引入了一种新方法,用于融合测量数据,以检测和预测天气驱动的自然危害。该拟议的研究介绍了一种强大的理论和算法框架,用于在近实时融合异构数据。我们建立了一种灵活的信息融合框架,具有目标的最佳标准,用于说明,专门用于最大的熵原理和最小的努力,嘈杂的学习与嘈杂的标签。我们开发一种方法来解释用于解决内在传感器限制的多模数据数据和解决方案。在我们对兴趣的案例研究中,即洪水密度估计的研究,我们进一步表明,通过融合遥感和社交媒体数据,我们可以开发出良好的成立和可操作的洪水图。这种能力在环境危害(例如飓风或恶劣天气)影响非常大的区域的情况下是有价值的。相对于现有技术与这些数据一起使用,我们提出的信息理论解决方案是原则性的和系统的,同时提供任何一组异质传感器方式的联合利用,具有最小的假设前提。这种灵活性与定量和清楚地说出具有非常合理的计算成本的融合原理的能力。用2013博尔德科罗拉多洪水事件的多模数数据测试并证实了所提出的方法。
