计算广告学是一门正在兴起的分支学科,它涉及到大规模搜索和
文本分析、信息获取、
统计模型、机器学习、分类、优化以及微观经济学。计算广告学所面临的最主要挑战是在特定语境下特定用户和相应的广告之间找到“最佳匹配”。语境可以是用户在搜索引擎中输入的查询词,也可以是用户正在读的网页,还可以是用户正在看的电影,等等。而用户相关的信息可能非常多也可能非常少。潜在广告的数量可能达到几十亿。因此,取决于对“最佳匹配”的定义,面临的挑战可能导致在复杂约束条件下的大规模优化和搜索问题。
提出背景
2008年,第十九届ACM-SIAM学术讨论会上,
雅虎研究院资深研究员Andrei Broder首次提出了计算广告学(ComputationalAdvertising)的概念,他认为,计算广告学是一门由信息科学、统计学、计算机科学以及微观经济学等学科交叉融合的新兴分支学科。Andrei Broder只是提出了计算广告学的研究目标——实现语境、广告和受众三者的最佳匹配,并没有从学术的角度给计算广告学一个严谨的界定。 计算广告学作为一门新兴学科,在继承传统
广告学核心理论的同时,为了应对科学技术发展带来的新问题和新观念,将
计算主义理论和方法应用到广告学研究。计算主义认为,“整个世界都是由算法控制,并按算法所规定的规则演化的。宇宙是一部巨型的计算装置,任何自然事件都是在自然规律作用下的计算过程。现实世界事物的多样性只不过是算法的复杂程度不同的外部表现。”正如
伽利略所言:“自然界这本大书是用
数学语言所写”。如今,计算的方法已经渗透到宇宙学、物理学、生物学、经济学乃至社会科学等诸多领域。计算已经成为人们认识自然、生命、思维和社会的一种普适的观念和方法。而计算广告学其实质就是研究如何利用计算的方法求解广告活动中各类问题的一门学科。
计算广告学是一门
广告营销科学,以追求广告投放的
综合收益最大化为目标,重点解决用户与广告匹配的相关性和广告的竞价模型的问题。计算广告学涉及到
自然语言处理、
数据挖掘以及竞价营销、创意设计等诸多学科的融合。对于用户而言存在商务搜索广告、浏览页面投放广告、社区人群广告等多种形式。
计算广告学从互联网在线广告的实践当中产生,尤其是从
搜索营销广告投放的实践中,吸取了大量的营养。我们回顾一下搜索营销中,用户、
广告主、广告投放平台是一个什么样的关系,与传统广告模式有什么不同: 在
传统媒体的广告投放平台中,用户是被动的:一旦用户接触到媒体,只要广告展现出来,“广告消费[1]”即已完成。在
效果营销的广告模式中,用户具有选择“接受”(Click)与否的权利,且只有在用户接受的前提下,广告消费才得以完成。
因此在这个平台中,广告投放平台需要为用户提供最易于接受的广告,对于广告主的效果负责。广告投放平台需要综合用户、广告主及自身(广告投放平台)的利益,追求综合利益最大化
[2]。
但作为商业营销平台,在线广告投放商业模式中,尤其是搜索营销中,广告主之间存在一个竞价过程——这是一个博弈过程,营销平台以此逼近媒体流量价值的最大值。广告主在竞价过程中,逐渐追逐这个市场的均衡点。除了要提供给用户最符合其需求的广告外,这一商业竞价过程也是广告投放的一个核心内容。
作为在这样一个背景下产生的学科,我们定义计算广告学的概念如下:
计算广告学是一门
广告营销科学,以追求广告投放的
综合收益最大化为目标,重点解决用户与广告匹配的相关性和广告的竞价模型的问题。计算广告学涉及到
自然语言处理、
数据挖掘以及竞价营销、创意设计等诸多学科的融合。对于用户而言存在
商务搜索广告、浏览页面投放广告、社区人群广告等多种形式。
在这样一个定义下,我们尤其要关注:
■ 计算广告学是一门科学。之所以成为科学,“计算”本身就是很好的说明。无论是用户需求的描述和刻画,还是广告投放相关性的保证,以及商业竞价过程,都是以相关科学计算为基础的。虽然,在营销与创意优化等相关内容中,仍存在艺术的成分,但计算广告学首先是一门科学。
■ 计算广告学要解决的问题是广告投放的
综合收益的最大化,是用户与广告匹配的相关性和广告竞价模型。在这个过程中,诸多学科融合在一起,尤其是
自然语言处理、
数据挖掘以及竞价营销、创意设计等相关学科。
■ 计算广告学的主要实践场景是互联网在线广告,对于用户而言有商务搜索广告、浏览页面投放广告、社区人群广告等多种形式。目前比较成熟的是商务搜索广告、浏览页面投放广告;对于新型社区(如SNS、游戏社区等)的在线广告还在发展当中。
广告形式
计算广告的运作系统主要包括广告算法、广告、语境、受众(用户)四个方面,针对这四个方面当下的广告形式可归纳为三类:基于
文本分析、基于用户分析和基于用户参与。
基于文本分析的计算广告
近年来,文本分析成为
自然语言处理学科的一个热点研究问题,该学科一些应用研究学者相继将网页分析、文本倾向性分析、文本相似性分析、机器翻译等研究成果应用到网络广告实践中,其突出代表为百度竞价排名、Google AdSense、DoubleClick Contextual Ad。这三者虽然都是基于文本分析,而且它们有着相同的前提假设——用户喜欢与自身
信息需求相关的广告,但是这三者的系统原理却截然不同。百度竞价排名通过对用户搜索关键字与广告主竞拍关键字进行相似性计算,实现在搜索结果的最前面插入与用户搜索相关的广告。显然,百度竞价排名人为干预搜索结果有一定的误导用户之嫌。
Google为了保证搜索结果的公平性,较早放弃了
竞价排名广告,转向以站长加盟的形式实现在搜索目标页面投放与搜索词相似的广告,即Google AdSense。而Contextual Ad基于对用户所浏览网页的主题分析,从广告库中检索与主题相似的广告插入到网页指定位置,实现广告与语境的匹配。
基于用户分析的计算广告
如果基于内容分析的广告与语境相匹配是间接实现广告与用户相匹配的话,基于用户分析的计算广告便是直接寻找广告与用户的一致性。当前用户分析主要从IP、注册资料、
服务器日志、
Cookie、历史数据、浏览器行为等方面切入,其代表性的广告形式为电子商务个性化推荐广告和MediaV。个性化推荐广告可以看作是POP广告的一种智能化改进,根据用户的兴趣特点和购买行为,向用户推荐其感兴趣的商品。此定位过程是IP地位、信息检索、
协同过滤、
数据挖掘等多种算法组合计算的过程。而MediaV则是根据Cookie跟踪用户浏览历史,分析用户的兴趣取向,在用户登录某网页时,通过MediaV平台识别用户,投放与之兴趣相符的广告。
基于用户参与的计算广告
文本和用户行为都可以通过相关算法进行兴趣相似性分析,然而图像、视频这种多媒体数据在现有的
图像识别技术下,尚不能进行主题分析,因此需要借助人工参与。基于用户参与的计算广告系统其主要目的在于搭建一个用户、广告主、站长的联盟平台,如
Pixazza图片广告联盟和QiYi视频广告联盟。联盟广告系统以利益分成的方法吸引网民作为志愿专家参与广告创作活动中,专家浏览图片或者视频时发现
商品信息,则在相应位置插入广告兴趣点,并链接到之相对应的商品购买广告。与传统的视频插播广告不同的是,这种广告系统只有在用户指向广告兴趣点时才会
显示广告,一定程度上减轻了对用户浏览图片、视频的打扰。
全景观
计算广告学产生的行业背景是
互联网广告营销,我们从一个全局角度进行介绍。
■ 用户:互联网用户;用户在互联网上获取内容或服务,也是广告的受众。
■ Publisher:互联网内容或服务提供商,是互联网广告投放的媒介。用户在浏览其内容或使用其服务的时候,相应的在该媒体上完成广告信息的接收和操作。
■ Ad Network:广告联盟网络,是一个连接广告主advertiser和互联网媒体publisher的广告系统平台,一方面广告主提供市场营销工具甚至广告投放服务,另一方面为互联网媒体兑现部分广告的价值。
■ Advertiser:广告主,是营销的主体,他具有投放广告到用户的商业需求并期望用户通过广告的影响成为其产品或服务的消费者。
■ Ad Exchange:是一个在不同Ad Network之间实现广告与流量交换交易的平台;该平台能够在不同商业模式之间实现市场互通,进而完成广告市场的整合与利益最大化。
通常,一个广告主如果需要投放互联网在线广告,他需要选择一个Ad Network,并依据相关营销工具进行广告创意制作、投放计划管理和投放过程及效果监控。而事情的起点就是,把
广告计划建立起来,并付款——付款购买的是什么?是Ad Network为他带来的
潜在消费者——而体现就是Publisher的流量。所以,这个环节只有广告主的意愿还是不够的。Ad Network需要获取大量的流量位置用来投放广告——并在营销工具中告诉广告主,你的广告可以通过什么方式选定广告位置——其实也就是选定你的潜在客户。这些潜在客户的广告触受行为,才是
广告主真正要花钱购买的东西。另外一个视角,就是AdNetwork去建立一个
广告营销市场,它需要有强大的销售力量,找到所有它需要的广告主进行广告营销,并能够获取并梳理Publisher流量位置,告诉广告主它们的营销价值值得他付款。
到此处,对应于我们全景图的右边部分,可以看作一个阶段。
然后,AdNetwork将选择合适的广告投放平台,对广告主的广告进行分析并添加到广告投放系统中。现在一个用户在访问某个Publisher,通过其内容或服务获取相关信息。如果当前Publisher参与了该Ad Network的广告投放活动,用户的一次PV将触发一次广告投放操作——系统自动将用户的部分信息(一般是有利于广告投放的信息)作为输入发送到广告投放平台,并经过一个复杂的决策过程,优选出一批广告回传Publisher,以事先设计的样式进行广告展现。此时用户就看到了互联网在线广告。
这又是一个阶段。
这个时候依据在线广告不同的商业模式,广告主对于“用户”的“营销消费过程”还在不同程度的延续。如果是CPM——千次展现付费——则广告浏览本身已经形成费用;系统需要将这个浏览信息记录,并启动后续广告费用及报表相关的操作。如果是CPC——点击付费——则还需要看用户是否进一步点击了广告;如果用户没有点击,则广告展现分文不取,如果用户点击了,则需要将点击信息记录,并启动后续广告费用及报表相关操作。当然,还有其他更为复杂的商业模式,我们后面再详细展开。此时广告主的费用已经被扣减了,Publisher也应该拿到了自己应得的广告费用分成部分。
这是另外一个阶段。
从这样一个角度,我们看到的是这样三个方面:
■广告营销管理:涉及到Advertiser、Ad Network。
■广告投放:涉及到用户、Publisher、Ad Network。
■广告商业价值结算:涉及到用户、Publisher、Ad Network及Advertiser全部角色。
这三个方面是广告投放的核心过程。而且每一个方面中,都有极具挑战的内容——且对于广告市场和广告价值实现而言具有不可忽视的影响。
我们可以说一些例子来启发你思考。比如,在广告营销管理方面,一个广告主需要投放广告——我们假设是竞价词广告,那么你应该选择什么样的竞价词来优化你的效果和成本?在广告投放方面,广告投放平台如何把握用户潜在的需求?在广告
商业价值结算方面,如何有效判定一次广告消费不是作弊行为?
在一个更大场景上,也就是我们
全景图中Ad Exchange参与的部分,这个广告投放活动将更为复杂,后续再进行介绍。但到此处,我们就计算广告学的全景做了一个概要性介绍。
相关论文
《计算广告学:大数据时代的广告传播变革——以“互联网+”技术经济范式的视角》
载于《
现代经济探讨》2016年第2期,作者:
刘庆振,北京信息科技大学公共管理与传媒学院
摘要:计算广告学作为一门新兴的交叉学科,是在当前新旧技术经济范式转换的背景下产生的,它符合媒介融合时代的精准定制传播需求。计算广告学的核心精髓是实现广告、语境和消费者的精准匹配,大数据技术和双向互动平台是实现这一目标的两大基础支柱。现阶段,计算广告引发了定制化推荐、融合化传播、智能化调整、程序化购买等与传统广告传播业态截然不同的新模式。未来,计算广告学将会带来整个广告产业链的巨大变革,它也提出了对复合型计算广告人才的强烈需求。
《“互联网+”背景下计算广告技术体系的创新与应用》
载于《新闻界》2016年第2期,作者:刘庆振,北京信息科技大学公共管理与传媒学院
摘要:广告产业的进化与广告技术的创新有着十分密切的关系,每一次广告技术创新都会带来广告产业的新发展,计算广告新业态的产生也是技术创新的必然结果。而计算广告技术体系主要由当前“互联网+”背景下的通用技术体系和计算广告的具体技术体系两部分构成,通用技术体系使得具体技术体系具备了产生的条件,具体技术体系则满足了计算广告特定的需求从而使之成为一种产业现实。当然,计算广告的技术体系在定量研究方面推动了广告产业的进步,但是这并不意味着定性研究不再重要,二者的完美结合才是广告产业良性健康发展的保障。
相关书籍
《计算广告学》
主要内容
本书主要包括计算广告学的理论构建和前沿问题两大主体部分,理论创新指导产业前沿不断发展,应用创新不断归纳升华为基本理论。在这一整体框架下,每一主体部分又由数个关键主题构成。
广告学研究面临的本质问题是理论框架的不完整、不清晰、不成熟。为了使计算广告理念和技术的应用更广泛,我们需要总结、抽象、提炼一套有关计算广告的假设、思维、理念、共识、方法、路径,进而搭建一个完整的理论框架,形成一门关于计算广告的“学”。这将为整个广告学的研究和实践带来全新思想,并丰富广告学原有的学术体系。
作者
赵 磊 昌荣传媒集团程序化营销中心执行副总经理。
《计算广告学实践》
笔者(一元之权)在规划的一本书,从中可以初窥计算广告学的细节内容,把规划中的目录分享给大家,后续将逐渐在百科或文库中开放。
《计算广告学实践》目录:
计算广告学实践
写在前面的话
第一部分 定义与应用
1 绪论
2 计算广告学全景
3 在线广告商务模式
4 市场营销工具
第二部分 广告竞价理论
5 拍卖理论
6 广告竞价过程
7 广告竞价与博弈
第三部分 广告投放系统
10 其他广告营销系统
11 市场营销工具
12 广告投放系统中的挑战
第四部分 计算广告学技术
14 Query分析技术
15 文本分析技术
16 人群分析技术
17 广告排序技术
18 营销工具技术
第五部分 计算广告学未来
19 新媒体与新的用户群
20 新的博弈
脚注
[1]即表示广告主通过广告,购买了媒体流量——其实购买的是在媒体上活动的潜在客户。
[2]广告投放平台以综合利益最大化为追求目标,是产品和平台设计的基本理念。如果一味追求投放平台的收益,必然会损失市场的健康发展。
新闻资讯
计算广告学将成为数字商业的奠基学科
计算广告学是一个新兴的学科,由工业界驱动,逐步形成一个学科体系。近期互联网巨头在大学开设这样的课程,进一步推动了计算广告学的逐步完善,比如Yahoo在
斯坦福开设了计算广告学的课程。国内百度在清华、北邮、南大等学校讲授了类似课程。
计算广告学,顾名思义是计算驱动广告的学科,这是相对传统的广告而言的。在传统广告中如电视广告,广告主不清楚受众是谁,什么年龄层,看完广告之后什么感受。甚至是电视的收视率都无法精确统计,就更谈不上广告的投放效果了。而计算广告就表现出更多的智能:广告主可以了解目标客户在哪,谁看了广告,广告的效果等等,这些都可以粗略计算出来。针对计算广告学目前还没有一个相对官方的定义。我们看到
斯坦福大学对它的描述是:“计算广告学是一个综合学科,涉及大规模搜索、
文本分析、信息检索、
统计建模、机器学习、分类、优化和微观经济学。计算广告的核心问题是要找到在给定的环境下,用户与广告的最佳匹配。”这里的环境可以指代用户在搜索引擎中输入一个查询语句,或者用户阅读网页,或者是用户在
便携式设备上观看电影。
总体而言,计算广告学要优化整个广告系统,平衡广告主、服务提供商(可以是搜索引擎,或者新闻门户)以及用户的利益,使其达到最大化。因此针对广告的效果而言,是需要可以计算的。比如网络广告里面的点击率、
转换率等等,广告主可以通过计算广告学看到直接量化的广告投放效果,计算准确ROI。
对用户而言,他们大多数情况下只希望看到自己感兴趣的地广告。那么网络服务商首先要知道用户是谁,这个要通过用户的使用行为,日志数据挖掘,构建用户特征以及兴趣模型。当然这往往是一个很粗略的挖掘,并且用户的兴趣还会出现动态变化。所以有时候会需要对用户的网络使用行为进行实时计算,并即时调整,比如用户的搜索点击行为,就可以作为一个参考数据。如果用户对搜索第一页呈现的广告没有点击,就说明可能广告匹配没有做好;那么在翻到第二页的时候就可以根据之前的行为调整广告。当然这种技术对实时计算要求比较高。
其次是广告主与服务提供商之间的合作,这里面有博弈论、拍卖机制等相关科学问题。毕竟从
产业生态系统的角度来看,每个角色获得足够的利益才可以使整个产业链繁荣,每个角色如果获得过多的利益而损害了合作伙伴,最终都会影响到整个产业,也包括自己。比如搜索引擎的
竞价排名,对竞价的机制要进行科学的设计,根据博弈论的理论来说,没有机制约束的选择肯定不是最优的。在搜索竞价排名中,假设没有机制约束,排名第二的广告主希望略高于第三名的竞价,可以减少预算,同时也不会改变其展示的名次。以此类推第一名希望略高于第二名,第三名希望率高于第四名,那最终的结果就是大家的竞价趋近于0,这实际上就破坏了竞价排名的商业模式,对整个产业造成伤害。因此,竞价排名的机制设计至关重要,要充分平衡双方的利益。
此外,计算广告学还要涉及
自然语言处理、机器学习等相关学科。比如利用自然语言处理,才可以更好地识别网页的内容,理解上下文,这样才可以结合用户特征展示“最匹配“的广告。而机器学习更多的时候是在帮助完善这一匹配,不断调优系统。
从根本上来说,计算广告学之所以能够兴起,主要原因也来自于互联网公司的大数据能力。大数据解决了几个计算广告学相关的关键问题:
海量用户数据的挖掘
用户与广告特征提取与匹配
百度之所以在国内开展计算广告学相关课程,一方面
百度搜索引擎每天几十亿的搜索,强大的“
凤巢”推广系统;另一方面百度
网盟联合了24个行业、30万家网站,每天都要将大量的客户推广信息以文字、图片、动画等多种形式展现在目标人群浏览的网页上。一方面积累的大量的商业推广经验,同时也积累了以大
数据挖掘、
自然语言处理、机器学习等相关技术。如果将这些技术汇聚形成计算广告学,并向高校传播,这将是一个造福整个数字时代的事情:让有需求的客户找到商家,商家也可以更准确、更节约投放广告。并让更多的科技工作者加入这一领域,完善这个复杂的过程。计算广告将逐步取代传统广告粗放式的广播模式,减少信息的不平衡性并减少视觉污染,将成为
未来数字商业的基石。