在“大数据”上写这本书
国家统计局写了关于分析“大数据”的书-从网上和其他地方的商业、个人和其他数据的海洋中筛选出有用的信息。至少他们已经写过了一种关于采矿那大数据的预订。
Nagiza Samatova.,教授计算机科学在NC州,四个博士学位。学生是本月发布的一本书的共同编辑有兴趣学习如何分析大数据的人的操作方法。超过五十个其他本科生和研究生作为共同作者贡献。
这本书专注于“图表”,一个模型的计算机科学术语,显示实体之间的连接,这些实体是人还是发电站。如果它们所代表的网络足够小,则这些图可能是视觉。但对于大数据集,例如在Amazon.com购物的所有人,更容易创建数字,机器可读图。
这些数字图形可以是“开采”以识别各种应用程序的模式。例如,在线零售商可以挖掘一个图表建议产品可能对基于以前的购买可能感兴趣的产品,或者社交媒体平台可能会根据用户演示的偏好建议联系人和工作机会。
“This approach to analyzing large data sets – so-called ‘big data’ – is an important field in computer science, with applications in areas from climate modeling to data security to the business community,” says Kanchana Padmanabahn, an NC State Ph.D. student and co-editor of the book.“我们希望看到一本介绍性的书,通过图形挖掘来走人,所以我们决定自己创造它。”
Samatova首先向学生介绍了她的数据挖掘课程的想法。当学生对这个想法感兴趣时,Samatova鼓励他们帮助她开发这本书。
“我们的目标是,部分是为了创建一个可以在课堂外使用的书,”NC国家博士学位博士道,Arpan Chakraborty说。这本书的学生和共同编辑。“但我们也想提出数据采矿课程中的指导员可以使用的东西。”
萨马托娃的第一步是问学生,他们希望在书中看到什么,并利用他们的建议来组织内容。
“我们发现学生们希望确保这本书没有假设有多少读者已经知道了,”Padmanabahn说。学生 - 未来的所有共同作者或共同编辑 - 选择专注于具有现实世界的示例和应用程序的实际步骤,使读者能够了解如何使用图形挖掘的各种元素。
然后将学生分成群组,每个组都专注于图形挖掘的特定方面。最终,这些群体各自为最后一本书贡献了一章。这本书,“用r的实用图挖掘,作为数据挖掘和知识发现系列的一部分,由CRC出版社于7月23日出版。其他联合编辑是博士生约翰·詹金斯和前博士生威廉·亨德里克斯,他现在在西北大学任教。这项工作是在美国能源部的支持下完成的科学数据分析与可视化(SDAV)研究所和国家科学基金会的在理解气候变化的计算中的远征。
这本书应该在各地受益于计算机科学学生。但它肯定会让帮助创造它的学生受益。随着大数据分析的重要性越来越重要,寻找一份关于这本书的人更容易更容易。