跳转到主要内容
抽象的

21世纪的科技如何照亮19世纪的报纸

19世纪的男人肖像
图片样本来自图形报。

19世纪的期刊出现了爆炸式的增长。例如,仅英国的报纸数量就从1846年的550家跃升至60年后的2400多家。对人文学者来说,追踪如此大量的出版物中的信息是一项艰巨的挑战。

数字人文努力在创造工具方面取得了一些进展,让学者可以在所有文本中进行搜索。但是,当试图理解那一时期报纸上成千上万的图片时,挑战就变得更加复杂了。

这就是保罗Fyfe钱通用电气进来。Fyfe是北卡罗来纳州立大学的英语副教授,而Qian Ge是该校电气和计算机工程专业的博士生。他们一起做了一些探索性的工作计算机视觉将如何用于分析19世纪的报纸

一篇描述他们发现的论文,图像分析和19世纪插图报纸,已于去年10月在《纽约时报》上发表文化分析杂志

我们最近有机会从Fyfe的大脑中了解到更多关于这对不太可能的组合的知识,他们试图分析来自三份时代报纸的14万多张图片。

文摘:你在这个项目中提出了哪些研究问题或挑战?

保罗Fyfe:我们的第一个问题非常简单:你能用计算机视觉方法来分析这些历史材料吗?正如我们所发现的,许多图像分析工具都是为照片设计的。随着数字图像的激增,这是有道理的。但我们的大部分材料不是照片。它们是由雕刻的线条和舱口做成的雕刻品。计算机能识别和分类这些东西吗?如果有,怎么做?

我们的下一个问题更多地与数字人文研究有关。一般来说,很多研究历史材料的“大数据”方法都侧重于文本。但是,正如历史学家利兹·洛朗(Liz Lorang)所问的那样,“我们能对代表数字化文化记录的数百万张图像做些什么呢?”

我们的最后一个问题是关于19世纪的,可以说是第一次,由于插图报纸,数以百万计的图片流传开来。在这些插图中我们可以找到什么样的视觉模式?人们看到了什么?报纸页面上的文本和图像的相对数量是如何随时间变化的?

助教:在回答这些问题时,你的材料方法有什么新颖之处?

Fyfe:迄今为止,大多数大规模的数字人文研究项目都集中在文本上。我们的项目是大规模视觉材料新研究的一部分。它还尝试将计算机视觉技术不仅用于摄影图像,还用于历史版画,这也是一种创新。

在我自己的19世纪书籍和媒体历史领域,计算研究是非常新颖的。我们并不是要仔细分析一个例子及其意义,而是要同时研究数千个例子。这是一种不同的方法来理解文本、报纸和图像在更大范围内是如何工作的,而不是单一的读者。当然,这并不是一种更好的方法,而是对人文研究人员已经擅长做的事情的一种称赞。

最后,这是英语系和电子计算机工程系之间的一次新颖的合作。由…的活动促进的NC州的视觉叙事集群

助教:你认为这项工作的关键发现是什么?

Fyfe:我们发现了很多相关图像的聚类,这些图像之前没有作为一个群体进行过研究。例如,大量夜间犯罪的插图;一家以艺术复制品闻名的报纸出版了几十幅国际地图;成千上万的肖像画都是以同样的方式排版的。当新闻成为一种多媒体体验时,这些集群让我们思考视觉知识的模式。

我们还发现,随着时间的推移,插图报纸呈现图像的模式。例如,与木刻相比,半色调照片的数量越来越多;在一个页面上逐步混合文字和图像,而不是只包含其中一种或另一种的页面。

最后,重要的是要注意我们找不到的东西。至少,我们的技术无法识别图像的内容。我们必须根据像素的低层次测量来排序,而不是根据主题。此外,尽管我们处理了成千上万的插图,这些图像仍然只是19世纪视觉文化的一个相当狭窄的代表。即使是在大范围内工作,我们也知道我们必须限定我们的数据集代表或排除什么——更重要的是谁。

助教:这些发现如何为该领域未来的工作提供信息?

Fyfe:我认为,它向其他人文学者展示了一种潜力,那就是他们可以比我们以往更广泛地查阅资料。人们可能不得不扩大他们关于历史插图的意义和作用的争论范围。我希望它能鼓励其他人对这些材料尝试更多的计算机视觉方法,或者至少追求新型的跨学科合作。

留下一个响应

您的电子邮件地址将不会被公布。所有字段都是必需的。

  1. 亲爱的马特(也就是保罗·费夫):

    我对Paul的研究很感兴趣,他对报纸中的意象进行了大规模的定量分析,并在更近的层次上对文章中“事故”意象进行了深入的分析。

    20世纪90年代,我在墨尔本的莫纳什大学(Monash University)攻读博士学位,研究殖民时期澳大利亚插图报纸(出版时期,1853-96年)的图像题材范围,采用手工水平的定量分析方法。本质上,我记录了每一个双数年份的每一期(每月)的所有图片的标题,然后对大约7000张图片进行分类,包括全景、建筑、展览、商业、海运/通信等27个主题标题,然后归入“进步文化”;公民文化下的公民场合、休闲、肖像;风景、乡村、矿业、自然历史、自然灾害等属于边疆范畴。然后,根据三个时间段计算每个科目的百分比。在撰写博士论文时,我将论文中确立的形象主题范围与十九世纪下半叶澳大利亚殖民地的广义历史联系起来。并对图片新闻的性质和产生的制约因素进行了探讨。

    在我的研究接近尾声时,我意识到我的方法已经给了我一个初步的索引在论文中的意象。我申请了博士后奖学金,用我已经建立的方法追溯奇数年,然后把它们放在一起,建立一个完整的索引。在申请中没有成功,最后决定在业余时间自己做。其结果是一个约1500页的两卷索引,根据主题(使用上述相同的主题标题、地点(首先按群体,然后按地区)和最后的日期索引约12500张图像,这成为第一卷。在这个过程中,我记录了所有可用的信息再创造者(插图画家、摄影师、木刻师),以建立第二卷作为创造者的索引。这本书被私人出版,名为P. Dowling,《澳大利亚殖民画报图像索引》(2012年),印数为50份。已向机构和大学图书馆出售了大约30个。大英图书馆有一本书,是离北卡罗来纳州最近的一本。

    从那以后,直到今年,我一直在精神上休息,部分原因是对澳大利亚这里的论文缺乏兴趣感到沮丧,因为我是这个国家唯一的论文学者。

    我的最终目标仍然是发表我的博士论文,只是现在,由于对论文的大量思考,根据完成的索引,有很大的修改,希望明年开始。

    在此期间,保罗,你有兴趣读几篇我的文章和其他关于索引的材料吗?如果有,请把你的电子邮件地址发给我。

    期待您的回复,

    彼得