列夫·马诺维奇 / 美国纽约城市大学研究生中心

陈国昊(译) / 上海大学上海电影学院

肖 爽(校) / 爱尔兰科克大学数字人文系

摘 要:文章将为“媒体分析”开发的方法语境化,放入历史框架中,并讨论其与“文化分析学”的相关性。对媒体和互动的大规模分析使非政府组织、大型和小型企业、科学研究和民间媒体能够就各种文化现象生成观点和信息。它们提供有关数字文化各个方面的定量分析数据,并有助于为数字应用程序(如搜索、推荐和上下文广告)设计程序组件。

对1830年至今的关键文本和命题进行调查,并概述出“数据社会思想”的发展。作者建议,尽管文化分析研究使用了数十种算法,但在它们背后只有少量的基本范式。可以将它们视为数据社会和人工智能社会的认知类型。三种最通用的范式方法是数据可视化、无监督机器学习和有监督机器学习。

作者将讨论文化分析研究面临的重要挑战。现在有了海量的文化数据,计算机可以快速进行复杂的分析,我们该如何看待文化呢?是只使用计算机方法来为19、20世纪人文范畴中业已建立的问题提供更好的答案,还是这些方法允许从根本上存在不同的新概念?

关键词:文化分析学 媒体分析学 人文范畴

一、媒体分析学和文化分析学

2000年代中期以来,全球数字文化已经进入一个新阶段,我称之为“媒体分析”(media analytics)。[1]对大量文化产品(cultural artefacts)、它们的在线“生命”以及人们与这些人工制品(artefacts)之间相互交流的计算分析重新定义了文化的动态和机制。这种分析现在被众多参与者使用——运营社交网络的公司、计划扩展服务范围的非政府组织、全球数百万家在线广告的小型企业,或者数百万使用社交媒体和网络分析工具及用仪表板来完善其在线帖子和自我展示并了解其社交和专业价值的人。譬如,我可以使用谷歌分析(Google Analytics)去理解访问者如何与我的网站上的所有页面进行交互。我还可以在academia.edu上查询自己的分数,该分数是通过比较我在这个网络上发表的文章和其他数百万学者、学生在网站上发表的文章的受欢迎程度而得出的。

媒体和互动的这种大规模分析还为数字文化的其他关键组成部分提供了支持,如搜索、推荐和上下文广告。例如,为了使其搜索服务成为可能,Google不断分析数十亿个网页的完整内容和标记。它查看网页爬虫可以到达的网络上的每个页面——其文本、布局、使用的字体、图像等,总共使用200多个信号(Google, 2016)。垃圾电子邮件检测依赖于对大量电子邮件文本的分析。亚马逊分析了数百万客户的购买情况以向他们推荐书籍。Netflix分析了数百万订阅者的选择,以推荐电影和电视节目。它还会分析所有产品的信息,以创建70,000多种类别。[2]诸如AdSense之类的上下文广告系统会分析网页内容,并自动选择要展示的相关广告视频。游戏公司捕获了数百万玩家的游戏行为,并以此来优化游戏设计。其他例子还包括自动翻译和建议人们关注或添加到社交网络上的朋友列表。

在计算机科学、数据科学、计算社会科学、数字人文科学、城市研究、媒介研究、数据可视化和数据设计等领域中,核心算法也同样为新的文化和社会研究提供了可能。由于这项研究使用大型文化数据集和数据科学来创建、管理和分析它们,并在所有这些机构和设计学科之间广泛传播,因此我一直在使用“文化分析学”(Cultural Analytics)这个总称来指代它。[3]

以下是文化分析学研究的一些示例:《走向艺术影响力的自动发现》[4]《衡量当代西方流行音乐的发展》[5]以及《流行电影的镜头时长、类别和加快的节奏》[6]。第一篇论文提出了一种自动发现艺术家之间影响力的数学模型,然后使用66位著名艺术家在几个世纪中创作的1,710幅名画的图像进行了测试。虽然发现一些影响与艺术史学家经常描述的影响相同,但该模型还揭示了之前未讨论过的艺术家之间的其他视觉影响。第二篇论文使用从1955年到2010年的464,411首歌曲的数据集来研究流行音乐的变化。该数据集包括“各种流行类型,包括摇滚、流行、嘻哈、金属或电子”。作者得出的结论是,随着时间的流逝,出现了“音高转换的限制”和“音色模板的均质化”,换句话说,音乐的变化性有所降低。第三篇论文分析了1912—2013年间创作的9,400部英语叙事电影,它们的平均镜头时长在逐步变化。

在本文中,我将讨论文化分析学研究的一些普遍挑战。既然我们拥有海量的文化数据,并且我们的计算机可以快速进行复杂的分析,那么我们应该如何看待文化?我们是否仅仅使用计算机就能更好地回答19、20世纪人文范畴中已经确立的问题,还是这些方法容许从根本上不同的新概念?

我认为这样的视角是必要的,因为当代文化自身是由相同或相似的方法驱动的。这就是今天使用计算方法和概念分析文化数据与20年前的关键区别。如今这些方法和概念正在推动数十亿人生活在日常的数字文化中。20世纪下半叶,当少数人文主义者和社会科学家使用计算机分析文化数据时,他们的当代文化主要是相似的、有形的和不可量化的。但是今天,作为学术研究人员,我们生活在社交网络、推荐系统、应用程序和界面都使用媒体分析的世界“阴影”中。正如我已经解释的那样,我将媒体分析视为媒介即现代技术发展的新阶段。此阶段的特点是对媒体和用户互动进行大规模算法分析,并将结果用于算法决策,例如上下文广告、推荐系统、搜索和其他类型的信息恢复、搜索结果和用户帖子的过滤、文件分类、剽窃检测、视频指纹识别、用户照片的内容分类、自动新闻制作等。

然而,我们还只是在初始阶段。考虑到算法在现代社会越来越多的功能中逐渐实现自动化,我希望至少具有“商业文化”(以惯例、类型期望和模板为特征)诸多形式的生产和定制也将逐渐实现自动化。因此,在未来,已经开发的数字发行平台和媒体分析将与第三部分“算法媒体生成”(algorithmic media generation)结合。(当然,自1960年以来,实验艺术家、设计师、作曲家和电影制片人一直在使用算法来创作作品,但是在将来,这很可能成为整个文化产业的新规范。)今天,我们已经可以在自动生成的新闻报道、关于算法建议的主题在线内容、一些电视节目的制作以及体育赛事期间的电视广播中看到这一点,例如多个机器人摄像机自动跟随并放大动态的人类表演。因此,如果我们想分析某些文化产品或经验的作者意图、意识形态和心理,那么这位作者可能不是人类,而是某种形式的人工智能,它结合了数据分析、机器学习和算法生成。

十年前,我们用来表示和推理世界与他者的关键文化技术已经包括自然语言、基于镜头的照片和视频影像、用于保存和访问信息的各种其他媒体、微积分、数字计算机和计算机网络。数据/人工智能社会的核心概念现在同样重要。它们构成了数据社会的“思想”——即以特定方式邂逅、理解和践行世界和人类规则。因此,即使你自身无意进行实际的文化分析研究,也仍然需要熟悉这些新的以数据为中心的文化技术(cultural techniques)。(“文化技术”的概念在最近的德国媒体理论中已得到广泛使用。[7])

尽管行业中的媒体分析和文化分析研究都使用了数十种算法,但在它们背后却只有少量的基本范式。我们可以将它们视为数据/人工智能社会的认知类型。最常见的三种是:数据可视化、无监督机器学习和有监督机器学习。其他功能包括特征提取、聚类、降维、分类、回归、网络科学、时间序列分析和信息检索。(其他人可能有不同的列表,具体取决于各自领域。)

二、数字社会思想的发展:时间线

考虑到“人工智能”“机器学习”和“数据科学”等术语在2010年代进入公众讨论范畴的速度之快和范围之广,许多人可能认为这些领域是非常新的。事实上,今天用于数据分析的几乎所有想法和方法都是在19世纪和20世纪发展起来的。为了说明这一点,我以统计学和计算数据分析的方法,构建了相关概念和方法的时间线。(删增内容是基于我自己在数据科学方面的经验,有意识地偏向于文化分析研究,而不是所有行业的应用。)

(一)19世纪

在大众的身体特征中观察到的正态分布:1830年代初期的Adolphe Quetelet。

社会物理学:1835年,Quetelet的著作《社会物理学》(Sur L’homme et le Développement de ses Facultés,英语译为《人类论》)概述了“社会物理学”的概念。Quetelet从早先使用过它的Compte那里挪用了这个术语。

社会学:1838年,得知Quetelet使用了他的概念,Compte引入了新的概念“社会学”(sociologie)。

标准差:Francis Galton,1860年末。

相关性:1846年的Aguste Bravais;Galton在1888年重新发现。

回归分析:1880年代的Galton。

直方图:1895年的Pearson。

回归分析:经过扩展和形式化处理——Udny Yule和Karl Pearson,1897—1903年。

统计假设检验理论基础:Pearson,1900年。

幂次法则:1896年,经济学家Vilfredo Pareto发表了他对“80-20法则”的观察,后来被称为“帕累托法则”;他举例说明了更一般的“幂次法则”,描述了当今网络文化和社交媒体中的许多现象,例如“长尾理论”。

(二)20世纪

主成分分析:1901年的Pearson。

因素分析:1904年,Charles Spearman。

多变量回归:第一次使用是在1900年代。

马尔可夫链:1906年,Andrew Markov开始致力于时间序列统计分析的理论和方法,后来称“马尔可夫链”。

网络分析:1930年代,Jacob Moreno开发了表示社交网络的方法;1950年代,用于网络分析的测量方法和概念被形式化。

神经网络:1957年,Frank Rosenblatt开发了用于分类的神经网络(“感知器”)。这项研究基于乌克兰裔美国科学家Nicolas Rashevsky开发的最早的神经网络模型。他的学生Warren McCulloch和Walter Pitts进一步发展了他的模型,并于1943年在Rashevsky的杂志上发表了著名文章。[8]

“软件”:1958年,John Tukey是第一个使用此术语的人。[9]

多维尺度分析(MDS):1950年代。[10]

支持向量机(SVM):1963年,Vladimir Vapnik和Alexey Chervonenkis(苏联)开发了最初的算法。Vapnik在1995年发布的一种算法版本成为最受欢迎的分类算法之一。

深度学习:1965年,Alexey Ivakhnenko和V. G. Lapa发布了第一个用于深度学习的工作算法。在2000年代后期,深度学习成为最流行的分类方法。Ivakhnenko通常被称为“深度学习之父”。

向量空间概念:1960年代末期,由Gary Salton为文本比较而开发。

探索性数据分析:1971年,Tukey开始发展探索性数据分析的思想。

统计编程语言:1976年,John Chambers等人在贝尔实验室开发了名为“S”的语言,它使探索性数据分析成为可能,因为它使研究人员可以从命令行执行各种统计和数据分析,并制作图表。[11]“R”语言后来从“S”语言发展而来。

反向传播:1986年,这种新的深度网络教学方法在David Rumelhart,Geoffrey Hinton和Ronald Williams于《自然》杂志上发表后开始流行。[12]

网页等级(PageRank):1996年,Larry Page和Sergey Brin开发了网页等级算法。这个想法提出得很早,可以追溯到1950年代文献计量学和科学计量学的创始人Eugene Garfield的工作(尽管网页等级并不是数据分析中的关键算法,但它对人们与信息和文化内容在线互动的方式产生了根本影响)。

物—物协同过滤(Item-item collaborative filtering):1998年,亚马逊发明并开始使用物—物协同过滤,这是一种推荐算法,可以根据人们对这些对象的评价来计算对象(例如书籍)之间的相似度。[13]

(三)21世纪

隐含狄利克雷分布(LDA):2003年,David Blei、Andrew Ng和Michael I. Jordan发布了文本文件中的“主题建模”模型,称为隐含狄利克雷分布。J. K. Pritchard、M. Stephens和P. Donnelly于1999年发表了最初的主题建模论文。

深度学习起步:当前的深度学习研究浪潮是由Geoffrey Hinton、Simon Osindero和Yee-Whye Teh于2006年出版的《基于深度置信网络的快速学习算法》开始。[14]结合使用可用于训练的更大数据,使用计算机集群和GPU,在线共享数据集和代码以及诸如ImageNet之类的竞赛,带来了非常快的进步。

将深度学习用于图像分类:2012年,Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton撰写的论文《具有深度卷积神经网络的ImageNet分类》显示出“深度学习优于其他图像分类方法”。[15]

总结这个时间表,我可以说,几乎所有与大规模文化计算分析相关的概念和方法都已经在1970年代中期发明了,尽管它们在文化产业和文化分析研究中的大量应用只有大约十年的时间。

三、我们想要“解释”文化

将文化过程和人工制品视为“数据”可以使我们提出有关文化的各种问题,而那些专业撰写、策划和管理文化的人今天通常不会问这些问题——因为此类问题有悖于对人文、大众媒体或艺术界里的文化、创造力、美学和品味的公认理解。例如,如果数据分析显示当代艺术家的作品尽管经济估值很高,但它们完全不是原创的,收藏家和博物馆会为其作品支付数百万美元吗?或者,数据分析所揭示的艺术界的趋势,是否可以像预测时尚界的趋势一样准确?

皮耶·布尔迪厄(Pierre Bourdieu)的《区隔》(Distinction, 1979)是社会科学中对文化数据最著名和最具影响力的定量分析。该分析中使用的数据来自对法国公众的调查。为了对此数据进行分析和可视化,布尔迪厄使用了最近开发的对应分析法,它类似于PCA,但适用于离散类别,以图形形式显示它们之间的关系。对于布尔迪厄而言,这种形式的数据分析可视化与他有关社会和文化的理论概念是一致的,这正是它在该书起着核心作用的原因。《区隔》是布尔迪厄最知名的著作,2012年布尔迪厄成为世界第二被引用最多的作家,仅次于米歇尔·福柯。[16]

布尔迪厄没有使用美国定量社会科学中最常用的方法——通过使用数学模型(例如线性回归)“解释”某些观察到的现象。但是,考虑到当今可用的文化数据的多样性和规模,也许现在运用这种方法可以产生有趣的结果。

如果我们仍采用定量社会科学的其他标准方法,并用它们“解释”看似难以捉摸、主观和非理性的文化世界,将会发生什么?例如,我们可以使用因子分析来分析世界范围内某一地区观众对来自众多国家/地区的音乐视频的选择和偏好,从而了解人们用来比较音乐家和歌曲的维度。或者,我们可以使用回归分析以及人口、社会和经济变量的组合来对“文化杂食者”(即喜欢精英文化和大众品味文化服务的人们)做出的选择进行建模。

在定量营销和广告研究中,调查人员一直都在询问与消费品和文化制品有关的类似问题。计算机科学家在分析社交媒体和网络数据时也会这么做,但这在人文科学中不会发生。实际上,如果你属于艺术或人文学科,那么这样的想法可能会让你感到非常不适,这就是为什么我们应该探索它们。

定量或计算方法在文化分析中的任何应用,其目的都不在于它是否最终成功(除非你从事媒体分析业务)。它可以迫使我们以新的方式审视主题,明确我们的假设,并精确定义我们的概念和我们想要研究的维度。

因此,至少作为思想实验,我们能够将定量社会科学的范式应用于文化。定量社会科学旨在提供社会现象的“解释”,以少量变量之间的数学关系表示(什么影响什么以及影响多少)。创建此类模型后,通常将其用于预测。此类“解释”的常用统计方法是回归模型、因子分析版本或将概率分布拟合到数据中。后者意味着确定观察到的数据是否可以使用简单的数学模型描述,例如高斯分布、对数正态分布、帕累托分布等。(在定量电影研究中,许多研究人员发现,20世纪好莱坞电影的镜头频率遵循对数正态分布。[17])

我们是否有兴趣尝试解释在文化中什么影响了什么,或者用数学模型预测它的未来?我们是否需要通过外部经济和社会变量来解释文化?例如,我们是否真的需要发现作者的传记占其作品“变化性”的30%?或者,年龄、位置和性别变量占Instagram帖子“变化性”的20%?即使我们发现一些变量的组合能够以95%的准确度预测某些用户的Instagram帖子的内容和样式,但在这个文化领域中真正重要的是我们无法预测的5%。

将回归模型应用于现实生活中的数据时,通常只能预测其中一部分数据,而不能预测所有数据。未被预测的部分通常被视为“噪声”,因为它不适合数学模型。实际上,在回归分析的标准表示中,添加到模型中以表示未预测数据的项,称为误差项或噪声。假设噪声部分是由于某些可能的随机变化造成的,这就给我们正在观察和建模的过程增加了干扰。但是,对于文化产品和经验而言,“噪声”部分可能是最重要的。

四、文化分析学的目标是研究模式吗?(是或否)

既然已经理解了以20世纪社会科学家对待社会的方式来看待文化的含义,那么我们真的要这样做吗?在文化分析学中,因为数学模型无法解释该问题,我们不希望使用简单的数学模型来“解释”大部分甚至某些数据,而仅将其余部分视为“错误”或“噪声”。而且我们不希望文化差异是均值的偏差。我们也不想假设特定类型的作品中的大部分作品遵循一种或仅几种模式,例如“英雄之旅”“黄金比例”或“二元对立”,或者每种文化都经历着相同的过程,正如19世纪某些艺术史学家所宣称的那样——三个或五个发展阶段。

我认为,我们应该研究文化多样性,而不是假设文化多样性是由某些类型或结构的变化引起的。这与定量社会科学的现代思想和它所适应的统计思想大不相同,18、19世纪统计学的历史发展使它从偏离均值的角度考虑观察到的数据。

这是否意味着我们只对差异感兴趣,并希望不惜一切代价避免任何还原?假定文化模式的存在,就是要接受我们在思考和分析数据时至少在做某种还原。否则,我们就无法比较任何东西,除非要处理极端的文化极简主义或连续性,艺术家要使其他一切都平等,并且只能改变单个变量,例如Sol LeWitt或一些极简主义音乐。

因此,文化分析学也可以定义为“对不同规模文化模式的定量分析”。但是,如果我们接受此定义,则需要立即在此定义中添加一个要点。尽管我们想在文化数据中发现不同规模的重复模式,但我们应始终记住,它们仅占人工制品及其接收的某些部分。除非它是另一种文化产品的100%复制品,或者是通过机械方式、算法方式制作成与他人相同的产品,否则每种表达和互动都是唯一的。在某些情况下,这种唯一性在分析中并不重要,但在其他情况下则十分重要,例如我们从Instagram自画像数据集中提取的面部特征,分析并显示出人们在特定城市和时期里如何表现自己的有趣差异。但是,当浏览Instagram时,我们乐此不疲地看着无尽的面孔和身体,因为他们每个都是独一无二的。

我认为,“文化分析学”的主要目标应该是详细绘制地图(并帮助我们思考这些地图),以在全球范围内创建起当代专业艺术品和一般用户生成的艺术品的多样性,即专注于众多艺术品之间的差异,而不仅仅是它们的共同之处。在19世纪和20世纪,缺乏适当的技术来存储、组织和比较大型文化数据集,这导致了归纳文化理论的普及。今天,我可以使用任何计算机来映射和可视化数千万个对象之间的数千个差异。我们不再有任何借口仅关注文化产品或行为共有的内容,并且以为这就是我们要做的,然后将其分类或视为一般类型的实例。因此,尽管我们可能不得不首先提取模式,只是为了绘制我们在一定规模下的当代文化生产和动态的初始图,但最终它们可能会在完全模糊的背景中消褪,因为我们只关注单个对象之间的差异。

五、没有范畴,我们还能思考文化吗?

以我的经验,这些理想说起来容易,做起来难。人脑和语言正在对机器进行分类,我们的认知不断处理感官信息并对其进行分类。我们观察到一种模式就像构造一个新类别:认识到某些事物或这些事物的某些方面具有某些共同点。我们可以学会思考没有范畴的文化吗?

我们如何摆脱人文学科的假设?(直到现在,仍旧“欠缺”对文化的思考和写作)即人文学科的研究目标是发现和解释一般文化类型,无论是“现代主义”“叙事结构”还是“自拍照”或“业余数码摄影师”。相反,我们如何学会更详细地了解文化,而无需立即寻找并注意到类型、结构或模式?

当然,首先我们需要足够大的数据样本,或者理想情况下所有艺术品。接下来,我们需要从足够多的维度来捕获这些艺术品的特征,包括它们在观众中的接收、使用以及流通。(我们还需要更系统地思考如何表示文化过程和互动——特别是当下,我们使用交互式数字文化媒体来代替历史静态物。)一旦有了这样的数据集,我们就可以使用各种有效的可视化技术来探索它们——探索性数据分析的结果——聚类分析的可视化,距离矩阵的可视化以及使用降维的可视化(PCA、t-sne等)。

但是这些“探索”的目标是什么?我们在测量和比较什么?作为结论,我想对这个问题做出一个回答。观察和分析文化意味着能够绘制和测量三个基本特征,即多样性、结构性(例如集群网络和其他类型的关系)和动态性(时间变化)。在文化环境中,我们可能期望许多作品遵循某些规范性美学或使用模板(例如,应用程序提供的Instagram过滤器,或成千上万的建议中描述和说明的主题),但我们还可以看到第四部分特点:变化性。例如,我们如果分析Instagram图片的样本,可以首先检测出现在许多帖子中的主题,然后查看与这些主题的偏差以及不遵循任何主题的图像。但是我们不想假设与类型(或平均值,或可以计算数据集的其他统计数据)之间的偏差是所有文化情况的必要度量。针对不同类型的媒体和文化领域,制定有关文化多样性、结构性、动态性和变化性的合适方案,本身就是一项重大的理论和实践任务。我认为这是未来几年文化分析的中心任务。

Can We Think Without Categories?

Lev Manovich

Abstract: In this article methods developed for the purpose of what I call “Media Analytics” are contextualized, put into a historical framework and discussed in regard to their relevance for “Cultural Analytics”. Large-scale analysis of media and interactions enable NGOs, small and big businesses, scientific research and civic media to create insight and information on various cultural phenomena. They provide quantitative analytical data about aspects of digital culture and are instrumental in designing procedural components for digital applications such as search, recommendations, and contextual advertising.

A survey on key texts and propositions from 1830 on until the present sketches the development of “Data Society’s Mind”. I propose that even though Cultural Analytics research uses dozens of algorithms, behind them there is a small number of fundamental paradigms. We can think them as types of data society’s and AI society’s cognition. The three most general paradigmatic approaches are data visualization, unsupervised machine learning, and supervised machine learning.

 I will discuss important challenges for Cultural Analytics research. Now that we have very large cultural data available, and our computers can do complex analysis quite quickly, how shall we look at culture? Do we only use computational methods to provide better answers to questions already established in the 19th and 20th century humanities paradigms, or do these methods allow fundamentally different new concepts?

Keywords: Cultural Analysis; Media Analysis; Humanities Paradigm

(编辑:姜文涛)

注释:

本文源自Mathias Fuchs, Ramón Reichert, “Rethinking AI. Neural Networks, Biometrics and the New Artificial Intelligence,”Digital Culture & Society (DCS), Special issue, vol. 4, no. 1, Bielefeld: TranscriptVerlag, 2018, pp. 17-28.

[1]Lev Manovich, “100 Billion Data Rows per Second: Media Analytics in the Early 21st Century,”International Journal of Communication, no. 12, 2018, pp. 473-488.

[2]Alexis C. Mardrigal, “How Netflix Reverse Engineered Hollywood,”The Atlantic, January 2, 2014, https://www.theatlantic.com/technology/archive/2014/01/how-netflix-reverse-engineered-hollywood/282679/.

[3]See Lev Manovich, “Cultural Analytics: Visualizing Cultural Patterns in the Era of ‘More Media’,”Domus, March 2009.

[4]Saleh Babak et al., “Toward Automated Discovery of Artistic Influence,” https://arxiv.org/abs/1408.3218, 2014.

[5]Joan Serrà et al., “Measuring the Evolution of Contemporary Western Popular Music,” https://www.nature.com/articles/srep00521, 2012.

[6]James E. Cutting, Ayse Candan, “Shot Durations, Shot Classes, and the Increased Pace of Popular Movies,”Projections, in The Journal for Movies and Mind, vol. 2, no. 9, 2015, pp. 40-62, http://people.psych.cornell.edu/~jec7/pubs/cutting&candanProj15.pdf.

[7]See Geoffrey Winthrop-Young, Ilinca Irascu, Jussi Parikka, “Cultural Techniques (Special Issue),”Theory, Culture & Society, vol. 30, no. 6, November 2013.

[8]Warren McCulloch, Walter Pitts, “A Logical Calculus of the Ideas Immanent in Nervous Activity,”The Bulletin of Mathematical Biophysics, vol. 5, no. 4, 1943, pp. 115-133, doi: 10.1007/BF02478259.

[9]John Tukey, “The Teaching of Concrete Mathematics,”The American Mathematical Monthly, vol. 65, no. 1, 1958, pp. 1-9.

[10]Warren S. Torgerson, Theory and Methods of Scaling, New York: Wiley; Paul E. Green, “Marketing Applications of MDS: Assessment and Outlook,”Journal of Marketing, vol. 39, no. 1, 1975, pp. 24-31.

[11]John Chambers, “Stages in the Evolution of S,” March 7, 2000, http://ect.bell-labs.com/sl/S/history. html, accessed August 29, 2016.

[12]David Rumelhart, Geoffrey Hinton, Ronald Williams, “Learning Representations by Back-Propagating Errors,”Nature, vol. 323, no. 6088, 1968, p. 533.

[13]Badrul Sarwar et al, “Item-Based Collaborative Filtering Recommendation Algorithms,” Proceedings of the 10th International Conference on World Wide Web (ACM), 2001, pp. 285-295.

[14]Geoffrey Hinton, Simon Osindero, Yee-Whye Teh, “A Fast Learning Algorithm for Deep Belief Nets,”Neural Computation, vol. 18, no.7, 2006, pp. 1527-1554.

[15]Alex Krizhevsky, Ilya Sutskever, Geoffrey Hinton,“ImageNet Classification with Deep Convolutional Neural Networks,”Advanced in Neural Information Processing Systems, vol. 25, 2012, http://papers.nips. cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks, accessed August 8, 2016.

[16]Nicolas Truong, Nicolas Weill, “A Decade after His Death, French Sociologist Pierre Bourdieu Stands Tall,”The Guardian, February 21, 2012, https://www.theguardian.com/world/2012/feb/21/pierre-bourdieuphilosophy-most-quoted.

[17]Jordan DeLong, “Horseshoes, Handgrenades, and Model Fitting: The Lognormal Distribution is a Pretty Good Model for Shot-Length Distribution of Hollywood Films,”Digital Scholarship in the Humanities, vol. 30, no. 1, 2015, pp. 129-136.

zh_CNChinese