首页 / 热点聚焦 / 正文
中国商业广告数据库(CCAA):18700多张高画质广告图像的历史档案与研究资源

Time:2025年04月11日 Read:4 评论:0 作者:haiwenboyue

简介

什么是中国商业广告数据库(CCAA)?

CCAA 是一个专注于图像的研究型在线档案馆。它由数量超过多张且带有 44 个元数据的高画质数字广告图像构成。这些广告图像都被数字化在了中国五个最重要通商口岸城市的商业报纸的高质量微缩胶卷上,这五个城市及其对应的报纸分别是:上海的《申报》、天津的《大公报》、沈阳的《盛京时报》、汉口的《汉口中西报》、广州的《越华报》。华盛顿大学西雅图分校的亚洲语言图书馆收藏着这些档案资料。现在你可以通过浏览网站来查看和利用该项目的成果。

CCAA的目的

在最基础的层面上,我们想要回答的问题类似这样:在 1928 年,上海的消费者能够买到多少种来自外国的品牌商品?雪佛蘭的汽车;福特的汽车;達極的汽车;法本公司的化学肥料;英国卜内门公司的化学肥料;仁丹的保健品;補而多的保健品;兜安氏的保健品;珂路搿(高露洁)的牙膏;旁氏的冷霜;棕欖的香皂;三得利的威士忌;朝日的啤酒;桂格的麦片;阳光少女的葡萄干;凡士林;手电筒;电池;固特异的轮胎;纽约美孚石油公司的石油;纽约美孚石油公司的天然气产品;英美煙品牌;利华兄弟公司的利华洗衣皂;通用电气公司的产品,包括城市路灯发电机和家用风扇。这些只是我们所收集信息里非常小的一部分。这五个城市的广告包含着各式各样的商品,并且每一个做广告的公司都获得了收益。

我们可以提出一些更深入的问题,例如:从这一时期的中国商品广告里我们能够学到些什么?我们能轻易地发现这个档案中的许多广告描述了性别方面的规范和愿景。比如有某种日本药片能够帮助中国男性变得更加强壮,并且有很多商品的广告图片对由一对父母和两个孩子构成的现代小家庭进行了理想化的描绘。许多广告的内容是表现现代女性形象,并且运用了复杂科技,比如用柯达的相机拍照、驾驶福特的汽车以及聆听百代唱片,这些使她们成为了现代女性。将 CCAA 的收藏和其他数据来源结合起来,我们就能对阶级分层以及都市消费社会有更多的了解。有一项著名研究表明,英美烟草公司深入到农户家中搜集信息,这使得代理商能以较低价格销售并获得利润。将我们的材料与这些研究关联起来,就能理解阶级分层、商品市场和销售策略。

数字化和数据挖掘会让我们需要去问一些之前未考虑过的问题,而这些问题在成千上万的广告文本和卡通画中并不明显。例如,当这些品牌来自国外时,它们的广告如何迎合现代中国“特色”呢?又比如,许多外国品牌用中国名人推荐产品,那么这些品牌与民族主义是相符还是相悖呢?在中国发达城市制造新商品文化的过程中,是否回避了民族主义问题呢?所谓的中国价值在这一过程中是否发生了变化?人们买品牌商品而非普通商品时,从概念层面来看,不得不放弃些什么?用马克思的语言来讲,这些疑问使我们面临使用价值和交换价值的问题,而这正是社会商品化和社会分析的关键所在。从统计角度而言,我们能够提出问题并解答深藏在广告里最重要的概念是什么,以及这些概念之间的相对重要性。倘若我们能够研发出语境发现系统,那么我们就可以期盼在该系统进行搜索之后,获得一份文献,这份文献能为学者提供尽可能多的语境信息和环境,如此一来,学者就能够观察、探索、分析、关注以及拓展语境,进而进行解释。

数字人文为提问提供了特别的方法。我们试着用深度学习的方式来量化广告绘画,也就是“卡通”。由于已经具备绘画分析的技术,我们便可以利用此技术去知晓那些在早于广告的绘画中绘制了这些素描以及当代陈词滥调的艺术家们。这些广告和素描艺术反映了城市里的社会日常以及普通人的生活,然而却不倾向于售卖商品。广告是一种重要的商业艺术,但并非全部。数字档案库能让我们进行文本挖掘。文本挖掘提供了量化书写语言的方法,也揭示了书写使用的语言样式。尤其在早期广告中,书写文本有着重要作用。收集这些文字,意味着我们最终能够“挖掘”数据,还能将广告修辞与其他类型的文本进行比较。比较的对象包括现代中国文学、现代诗、中文的现代理论,也包括在此描述过程中产生的问题。换句话说,数字人文让中国城市中包括广告或商业艺术在内的新印刷媒介的形式、技术、混合媒介以及艺术传统成为可能。算法指导我们把新广告语言进行隔离并使其语境化。CCAA 收集中文的那个阶段与之前相比有了巨大的变化。全世界所有的本地语言都在创造新的词和语法来鼓励人们购买商品,而中国也不例外。数字人文基础设施开启了思考语言和语言变化的新途径。

最后,这些数据能告诉我们一种被文化历史学家称作“渴望”的抽象力量。通常在历史学家推测人类动机时,我们除了自身的决心外,几乎没有证据和东西能指导我们。但我们知晓过去的人们对不同的品质和物品有着热切的渴望。为何人们会购买一瓶比葡萄籽油贵十倍多但功能相同的凡士林牌罐装甘油呢?时尚对于商品文化至关重要。其核心在于一次性消费,以及具备购买和拥有具有短暂生命之物的意愿与能力。数字资料让我们能够具体地描述一些学者所称的有关商品的“情感结构”和“欲望制度”等内容。并且我们知晓,这些商品正是当时的人们在每天的广告中能够看到并且进行购买的。广告以及广告数据实现了数字化和统计处理,这帮助了所有的殖民现代历史学家解决了一个基本问题,那就是为什么现代人会购买寿命较为短暂的商品,并且之后又将它们丢弃呢?

是如何实现这些的?

商业广告的分类_分类广告商业广告区别_分类广告商业计划书

我们首先创建元数据。这表示在收集历史资料之后,我们对这些资料进行描述,并将其分类为自然或内在于图像的信息类别。比如,我们有关于人、车、房子、城市空间、动物等的分类。其中较为重要的是性或性别。现代广告迅速关注到利用可爱的女性形象来推销商品。有些商品广告不会将使用价值与妇女形象联系起来。即便没有女孩的图像,它们也会使用男性和女性情侣、父母和小孩以及核心或现代家庭的图像。这些信息汇总起来,就形成了我们所说的性别的元数据。元数据能够描绘大量或少量的证据,因为在这个过程中,材料的数量并非关键所在。然而我们收集了诸多材料,最终得到了五份报纸的广告,这些广告所描绘的案例跨越了一个多世纪。这些图像本身较为复杂,并且我们对其几十年的历史持续进行了研究,所以我们的研究过程也变得复杂起来。

我们把大量证据分解成元数据后,得到了一个“数据集”。这个数据集让内容分析成为可能,也就使得数据的算法计算成为可能,同时也让我们能够问数据更多这类的问题。例如,核心城市是在城市中进行商品交易,还是以都市核心周边的农村为目标?广告不只是一种实践,还是一套社会科学观点。那么在 5、60 年间,广告中的语言发挥了怎样的角色呢?由于它与中国当时正在发生的语言革命有一定关联,所以广告的语言是怎样变化的呢?这对于历史学家和其他人文科学研究者来说,都是非常重要的。数字档案允许我们考察的不只是一个品牌,而是一个公司所拥有的多个品牌,像通用电气、英美烟草公司以及福特公司等。并且,我们能够揭示广告市场潜在的本地差异。我们已经看到,在上海、天津和沈阳的广告市场中,当地方性广告呈现出性别化的人物形象时,其使用的语法和风格也各不相同。我们确实不清楚市场、市场制造者以及广告代理商对地方偏好是否敏感,也不清楚它们是怎样敏感的。如果没有数字档案库,我们就没有办法去估计或测量这种差异。将信息分散到元数据中,能够帮助我们测量地方主义。甚至在一百年以前,中国的都市,也就是“贸易口岸”,地域辽阔,有着极为复杂的地方历史系统。CCAA 的一个贡献是能够把图像转化为数据,并且能够发展文本挖掘,这样我们就可以推动内部的比较。

元数据是如何工作的?

元数据是 CCAA 的核心部分。CCAA 是一个以研究为主导,以图像为对象进行聚焦的在线档案馆。它致力于记录各种相关信息,包括广告插图或场景、品牌图标、语言和词汇,还有地图信息,例如街道名称和公司名称。经过漫长的学习与测试过程后,我们开始把基于都柏林数据标准定制的元数据标准运用到每一个广告的每一张数字图片里。我们持续地构建元数据的权威性、兼容性、一般性以及持续性。这些元数据包含以下几类:有关于图像内容的描述性数据;包含与图像相关的商品和广告业的语境信息数据;还有报纸的文献数据;以及关于数字文件的技术数据,例如图像的来源、报纸出版社的所在地、版权状态和所属机构。

描述性元数据主要对每张广告图像的文本和图像元素进行了描述。广告包含以下这些要素中的部分或者全部:有全文,有广告标题,有广告语,有人物形象或者动物,还有人物形象中的男性或者女性等。用元数据术语来讲,就是有标题、有关键词、有全文转录的文本以及对整个图像的一般性描述。我们定制的一些要素能帮助那些需要基本数据或信息的研究者,在他们点击和下载某个特定图像之前,快速地对整个数据库进行搜索。在未来研究中,我们会进一步深入研究广告图像中的视觉图表和全文,把它们转换为可进行文本挖掘的数据,这样就可能应用于新的、更高级的分析方法。

第二类元数据主要涉及生产和传播图像的商品与广告业的相关语境信息。我们觉得广告图像不仅是图像设计,同时也是文化产品;它既是经济商品,又是社会商品。就如同下面的图所展示的那样,我们运用了包含品牌/名称、商品类别、公司、代理机构、公司地址以及代理机构地址等在内的元数据。其中一些是从图像内容里直接提取出来的;一些是从外部资源获取后加入到元数据中的。例如,我们知晓怎样在每个广告中找到商品的品牌或名称,然而并非总能找到制造公司、发行机构或者制作广告且将其投放至报纸的广告代理商的相关信息。

我们借助代码表去解决这个问题,同时要确保数据的一致性。然而经验表明,代码自身需要时常进行更新和关注,因为在某些特定的报纸当中,在几十年的时间里,信息会由于新的拥有者以及本地市场的变化而发生改变。

我们用一组关键字去描述图像,像这样的一些类别:动物、植物、人形象的图像类别,其中包含女性/男性,老年/青年/中年人,外国人/中国人,儿童/婴儿等子类别;还有设计风格,像包装插图,情境插图和文本;以及文本信息,也就是生产公司的国籍和地点。这些关键词被统称为“主题”。网站具备相应的搜索功能,同时为 CCAA 用户提供了一个链接,通过该链接可以简单地访问全部信息。

第三类元数据给出了广告的核心环境相关信息。例如,CCAA 文献数据对广告所在报纸的出版信息进行了总结,这些信息涵盖了“期号”“刊号”“位置”“页码”“报纸出版商”“发行日期”“印刷厂”以及“编辑”。这些数据能为研究人员提供背景信息,还能帮助他们找到原始报纸,进而展开关于特定广告在一家或几家报纸上一年或多年内发布频率信息的统计分析。

技术数据对数字化和归档的技术过程进行了描述。每一张广告都有其唯一的身份号,即 ID,它能确保图像和元数据条目的对应性。“版权”指的是该图像的版权所属以及使用规定。CCAA 采用了知识共享协议,此协议允许用户在任何媒介以任何形式复制、传播数据库中的图片,不过必须署名,并且不能用于商业目的或者进行再创作。该部分数据说明了数字图像格式。

在哪里?

分类广告商业计划书_商业广告的分类_分类广告商业广告区别

CCAA 可在两个网站使用,一个是由莱斯大学图书馆保存和维护的存档站点,另一个是南京大学保存的蜉蝣项目的官方网站。项目图像包含不可公开访问的 TIFF 格式底图和可公开访问的可下载格式图片。该项目基于机构资料库,其图像及其元数据都存储并保藏在这个平台上。大学档案馆维护着数百个数据库,然而,正因为如此,很难符合 CCAA 的定制化要求。

第二个 CCAA 的 NJU 网站注重视觉方面,具备高价值的图形图像。它为开展社会历史、文化研究、知识史、社会学和统计学相关的研究与写作,提供了友好的接触那些在很大程度上被忽略了的资源的机会。CCAA 网站不只是拥有可搜索资源的网站,还吸引了全世界充满好奇的研究人员。每个单独的报纸都是 CCAA 系统中的一个集合。我们会持续对网站进行建设,这样用户就能创建图像库,能创建交互式地图,能创建广告时间轴,能创建交叉引用的动态链接,能进行可视化统计分析,还能看到每周更新的新闻等。这属于我们希望在接下来几年内扩大和发展的项目的一部分。目前,我们的目标是让图片能够被触及并且可以被搜索!我们期望你能充分运用这个资源,也请在你的出版物中引用该数据。同时,若你希望补充这个收藏,或者希望你的出版物被网站引用,那就联系我们吧!我们特别希望能够一起构建共享的数据资源,为蜉蝣资源研究贡献力量。在我们的商业广告档案中向用户发布并告知相关学术工作,这是推动并提升 19 世纪晚期 20 世纪初期中国日常生活学术研究的另一种方式。

以下为网站部分截图

相关文献:

陈静指出,数字档案化的广告如同蜉蝣一般。以中国商业广告档案库(1880~1940)为例,该情况刊载于《江海学刊》2017 年 02 期。

标签:
关于我们
海文博阅网,打造全方位的文化信息阅读平台,涵盖社会动态、历史人文、生活百科等广泛内容。我们为读者提供高质量的资讯和深度文章,让阅读成为获取知识、拓宽视野的桥梁。在这里,您可以随时随地畅游知识的海洋,感受阅读的魅力。
发文扫码联系站长微信
Copyright ©2021-2025 Comsenz Inc.Powered by©haiwenboyue 文章发布联系站长:dat818