计算广告学

来自计算思维百科
跳转至: 导航搜索

计算广告学是一门正在兴起的分支学科,它涉及到大规模搜索和文本分析、信息获取、统计模型、机器学习、分类、优化以及微观经济学。计算广告学所面临的最主要挑战是在特定语境下特定用户和相应的广告之间找到“最佳匹配”。语境可以是用户在搜索引擎中输入的查询词,也可以是用户正在读的网页,还可以是用户正在看的电影,等等。而用户相关的信息可能非常多也可能非常少。潜在广告的数量可能达到几十亿。因此,取决于对“最佳匹配”的定义,面临的挑战可能导致在复杂约束条件下的大规模优化和搜索问题。计算广告学是一门广告营销科学,以追求广告投放的综合收益最大化为目标,重点解决用户与广告匹配的相关性和广告的竞价模型的问题。计算广告学涉及到自然语言处理、数据挖掘以及竞价营销、创意设计等诸多学科的融合。对于用户而言存在商务搜索广告、浏览页面投放广告、社区人群广告等多种形式。

提出背景

2008年,第十九届ACM-SIAM学术讨论会上,雅虎研究院资深研究员Andrei Broder首次提出了计算广告学(ComputationalAdvertising)的概念,他认为,计算广告学是一门由信息科学、统计学、计算机科学以及微观经济学等学科交叉融合的新兴分支学科。Andrei Broder只是提出了计算广告学的研究目标——实现语境、广告和受众三者的最佳匹配,并没有从学术的角度给计算广告学一个严谨的界定。 计算广告学作为一门新兴学科,在继承传统广告学核心理论的同时,为了应对科学技术发展带来的新问题和新观念,将计算主义理论和方法应用到广告学研究。计算主义认为,“整个世界都是由算法控制,并按算法所规定的规则演化的。宇宙是一部巨型的计算装置,任何自然事件都是在自然规律作用下的计算过程。现实世界事物的多样性只不过是算法的复杂程度不同的外部表现。”正如伽利略所言:“自然界这本大书是用数学语言所写”。如今,计算的方法已经渗透到宇宙学、物理学、生物学、经济学乃至社会科学等诸多领域。计算已经成为人们认识自然、生命、思维和社会的一种普适的观念和方法。而计算广告学其实质就是研究如何利用计算的方法求解广告活动中各类问题的一门学科。 

定义

计算广告学是一门正在兴起的分支学科,它涉及到大规模搜索和文本分析、信息获取、统计模型、机器学习、分类、优化以及微观经济学。计算广告学所面临的最主要挑战是在特定语境下特定用户和相应的广告之间找到“最佳匹配”。语境可以是用户在搜索引擎中输入的查询词,也可以是用户正在读的网页,还可以是用户正在看的电影,等等。而用户相关的信息可能非常多也可能非常少。潜在广告的数量可能达到几十亿。因此,取决于对“最佳匹配”的定义,面临的挑战可能导致在复杂约束条件下的大规模优化和搜索问题。

计算广告学是一门广告营销科学,以追求广告投放的综合收益最大化为目标,重点解决用户与广告匹配的相关性和广告的竞价模型的问题。计算广告学涉及到自然语言处理、数据挖掘以及竞价营销、创意设计等诸多学科的融合。对于用户而言存在商务搜索广告、浏览页面投放广告、社区人群广告等多种形式。

计算广告学从互联网在线广告的实践当中产生,尤其是从搜索营销广告投放的实践中,吸取了大量的营养。我们回顾一下搜索营销中,用户、广告主、广告投放平台是一个什么样的关系,与传统广告模式有什么不同: 在传统媒体的广告投放平台中,用户是被动的:一旦用户接触到媒体,只要广告展现出来,“广告消费”即已完成。在效果营销的广告模式中,用户具有选择“接受”(Click)与否的权利,且只有在用户接受的前提下,广告消费才得以完成。

因此在这个平台中,广告投放平台需要为用户提供最易于接受的广告,对于广告主的效果负责。广告投放平台需要综合用户、广告主及自身(广告投放平台)的利益,追求综合利益最大化。

但作为商业营销平台,在线广告投放商业模式中,尤其是搜索营销中,广告主之间存在一个竞价过程——这是一个博弈过程,营销平台以此逼近媒体流量价值的最大值。广告主在竞价过程中,逐渐追逐这个市场的均衡点。除了要提供给用户最符合其需求的广告外,这一商业竞价过程也是广告投放的一个核心内容。

作为在这样一个背景下产生的学科,我们定义计算广告学的概念如下:

计算广告学是一门广告营销科学,以追求广告投放的综合收益最大化为目标,重点解决用户与广告匹配的相关性和广告的竞价模型的问题。计算广告学涉及到自然语言处理、数据挖掘以及竞价营销、创意设计等诸多学科的融合。对于用户而言存在商务搜索广告、浏览页面投放广告、社区人群广告等多种形式。

在这样一个定义下,我们尤其要关注:

计算广告学是一门科学。之所以成为科学,“计算”本身就是很好的说明。无论是用户需求的描述和刻画,还是广告投放相关性的保证,以及商业竞价过程,都是以相关科学计算为基础的。虽然,在营销与创意优化等相关内容中,仍存在艺术的成分,但计算广告学首先是一门科学。

计算广告学要解决的问题是广告投放的综合收益的最大化,是用户与广告匹配的相关性和广告竞价模型。在这个过程中,诸多学科融合在一起,尤其是自然语言处理、数据挖掘以及竞价营销、创意设计等相关学科。

计算广告学的主要实践场景是互联网在线广告,对于用户而言有商务搜索广告、浏览页面投放广告、社区人群广告等多种形式。目前比较成熟的是商务搜索广告、浏览页面投放广告;对于新型社区(如SNS、游戏社区等)的在线广告还在发展当中。

广告形式

计算广告的运作系统主要包括广告算法、广告、语境、受众(用户)四个方面,针对这四个方面当下的广告形式可归纳为三类:基于文本分析、基于用户分析和基于用户参与。

基于文本分析的计算广告

近年来,文本分析成为自然语言处理学科的一个热点研究问题,该学科一些应用研究学者相继将网页分析、文本倾向性分析、文本相似性分析、机器翻译等研究成果应用到网络广告实践中,其突出代表为百度竞价排名、Google AdSense、DoubleClick Contextual Ad。这三者虽然都是基于文本分析,而且它们有着相同的前提假设——用户喜欢与自身信息需求相关的广告,但是这三者的系统原理却截然不同。百度竞价排名通过对用户搜索关键字与广告主竞拍关键字进行相似性计算,实现在搜索结果的最前面插入与用户搜索相关的广告。显然,百度竞价排名人为干预搜索结果有一定的误导用户之嫌。Google为了保证搜索结果的公平性,较早放弃了竞价排名广告,转向以站长加盟的形式实现在搜索目标页面投放与搜索词相似的广告,即Google AdSense。而Contextual Ad基于对用户所浏览网页的主题分析,从广告库中检索与主题相似的广告插入到网页指定位置,实现广告与语境的匹配。

基于用户分析的计算广告

如果基于内容分析的广告与语境向匹配是间接实现广告与用户相匹配的话,基于用户分析的计算广告便是直接寻找广告与用户的一致性。当前用户分析主要从IP、注册资料、服务器日志、Cookie、历史数据、浏览器行为等方面切入,其代表性的广告形式为电子商务个性化推荐广告和MediaV。个性化推荐广告可以看作是POP广告的一种智能化改进,根据用户的兴趣特点和购买行为,向用户推荐其感兴趣的商品。此定位过程是IP地位、信息检索、协同过滤、数据挖掘等多种算法组合计算的过程。而MediaV则是根据Cookie跟踪用户浏览历史,分析用户的兴趣取向,在用户登录某网页时,通过MediaV平台识别用户,投放与之兴趣相符的广告。

基于用户参与的计算广告

文本和用户行为都可以通过相关算法进行兴趣相似性分析,然而图像、视频这种多媒体数据在现有的图像识别技术下,尚不能进行主题分析,因此需要借助人工参与。基于用户参与的计算广告系统其主要目的在于搭建一个用户、广告主、站长的联盟平台,如Pixazza图片广告联盟和QiYi视频广告联盟。联盟广告系统以利益分成的方法吸引网民作为志愿专家参与广告创作活动中,专家浏览图片或者视频时发现商品信息,则在相应位置插入广告兴趣点,并链接到之相对应的商品购买广告。与传统的视频插播广告不同的是,这种广告系统只有在用户指向广告兴趣点时才会显示广告,一定程度上减轻了对用户浏览图片、视频的打扰。

全景观

计算广告学产生的行业背景是互联网广告营销,我们从一个全局角度进行介绍。

在这个全景图中,我们先介绍角色概念: 

用户:互联网用户;用户在互联网上获取内容或服务,也是广告的受众。

Publisher:互联网内容或服务提供商,是互联网广告投放的媒介。用户在浏览其内容或使用其服务的时候,相应的在该媒体上完成广告信息的接收和操作。

Ad Network:广告联盟网络,是一个连接广告主advertiser和互联网媒体publisher的广告系统平台,一方面广告主提供市场营销工具甚至广告投放服务,另一方面为互联网媒体兑现部分广告的价值。

Advertiser:广告主,是营销的主体,他具有投放广告到用户的商业需求并期望用户通过广告的影响成为其产品或服务的消费者。

Ad Exchange:是一个在不同Ad Network之间实现广告与流量交换交易的平台;该平台能够在不同商业模式之间实现市场互通,进而完成广告市场的整合与利益最大化。

通常,一个广告主如果需要投放互联网在线广告,他需要选择一个Ad Network,并依据相关营销工具进行广告创意制作、投放计划管理和投放过程及效果监控。而事情的起点就是,把广告计划建立起来,并付款——付款购买的是什么?是Ad Network为他带来的潜在消费者——而体现就是Publisher的流量。所以,这个环节只有广告主的意愿还是不够的。Ad Network需要获取大量的流量位置用来投放广告——并在营销工具中告诉广告主,你的广告可以通过什么方式选定广告位置——其实也就是选定你的潜在客户。这些潜在客户的广告触受行为,才是广告主真正要花钱购买的东西。另外一个视角,就是AdNetwork去建立一个广告营销市场,它需要有强大的销售力量,找到所有它需要的广告主进行广告营销,并能够获取并梳理Publisher流量位置,告诉广告主它们的营销价值值得他付款。

然后,AdNetwork将选择合适的广告投放平台,对广告主的广告进行分析并添加到广告投放系统中。现在一个用户在访问某个Publisher,通过其内容或服务获取相关信息。如果当前Publisher参与了该Ad Network的广告投放活动,用户的一次PV将触发一次广告投放操作——系统自动将用户的部分信息(一般是有利于广告投放的信息)作为输入发送到广告投放平台,并经过一个复杂的决策过程,优选出一批广告回传Publisher,以事先设计的样式进行广告展现。此时用户就看到了互联网在线广告。

这个时候依据在线广告不同的商业模式,广告主对于“用户”的“营销消费过程”还在不同程度的延续。如果是CPM——千次展现付费——则广告浏览本身已经形成费用;系统需要将这个浏览信息记录,并启动后续广告费用及报表相关的操作。如果是CPC——点击付费——则还需要看用户是否进一步点击了广告;如果用户没有点击,则广告展现分文不取,如果用户点击了,则需要将点击信息记录,并启动后续广告费用及报表相关操作。当然,还有其他更为复杂的商业模式,我们后面再详细展开。此时广告主的费用已经被扣减了,Publisher也应该拿到了自己应得的广告费用分成部分。

从这样一个角度,我们看到的是这样三个方面:

广告营销管理:涉及到Advertiser、Ad Network。

广告投放:涉及到用户、Publisher、Ad Network。

广告商业价值结算:涉及到用户、Publisher、Ad Network及Advertiser全部角色。

这三个方面是广告投放的核心过程。而且每一个方面中,都有极具挑战的内容——且对于广告市场和广告价值实现而言具有不可忽视的影响。

新闻资讯

计算广告学将成为数字商业的奠基学科

计算广告学是一个新兴的学科,由工业界驱动,逐步形成一个学科体系。近期互联网巨头在大学开设这样的课程,进一步推动了计算广告学的逐步完善,比如Yahoo在斯坦福开设了计算广告学的课程。国内百度在清华、北邮、南大等学校讲授了类似课程。

计算广告学,顾名思义是计算驱动广告的学科,这是相对传统的广告而言的。在传统广告中如电视广告,广告主不清楚受众是谁,什么年龄层,看完广告之后什么感受。甚至是电视的收视率都无法精确统计,就更谈不上广告的投放效果了。而计算广告就表现出更多的智能:广告主可以了解目标客户在哪,谁看了广告,广告的效果等等,这些都可以粗略计算出来。针对计算广告学目前还没有一个相对官方的定义。我们看到斯坦福大学对它的描述是:“计算广告学是一个综合学科,涉及大规模搜索、文本分析、信息检索、统计建模、机器学习、分类、优化和微观经济学。计算广告的核心问题是要找到在给定的环境下,用户与广告的最佳匹配。”这里的环境可以指代用户在搜索引擎中输入一个查询语句,或者用户阅读网页,或者是用户在便携式设备上观看电影。

总体而言,计算广告学要优化整个广告系统,平衡广告主、服务提供商(可以是搜索引擎,或者新闻门户)以及用户的利益,使其达到最大化。因此针对广告的效果而言,是需要可以计算的。比如网络广告里面的点击率、转换率等等,广告主可以通过计算广告学看到直接量化的广告投放效果,计算准确ROI。

对用户而言,他们大多数情况下只希望看到自己感兴趣的地广告。那么网络服务商首先要知道用户是谁,这个要通过用户的使用行为,日志数据挖掘,构建用户特征以及兴趣模型。当然这往往是一个很粗略的挖掘,并且用户的兴趣还会出现动态变化。所以有时候会需要对用户的网络使用行为进行实时计算,并即时调整,比如用户的搜索点击行为,就可以作为一个参考数据。如果用户对搜索第一页呈现的广告没有点击,就说明可能广告匹配没有做好;那么在翻到第二页的时候就可以根据之前的行为调整广告。当然这种技术对实时计算要求比较高。

其次是广告主与服务提供商之间的合作,这里面有博弈论、拍卖机制等相关科学问题。毕竟从产业生态系统的角度来看,每个角色获得足够的利益才可以使整个产业链繁荣,每个角色如果获得过多的利益而损害了合作伙伴,最终都会影响到整个产业,也包括自己。比如搜索引擎的竞价排名,对竞价的机制要进行科学的设计,根据博弈论的理论来说,没有机制约束的选择肯定不是最优的。在搜索竞价排名中,假设没有机制约束,排名第二的广告主希望略高于第三名的竞价,可以减少预算,同时也不会改变其展示的名次。以此类推第一名希望略高于第二名,第三名希望率高于第四名,那最终的结果就是大家的竞价趋近于0,这实际上就破坏了竞价排名的商业模式,对整个产业造成伤害。因此,竞价排名的机制设计至关重要,要充分平衡双方的利益。

此外,计算广告学还要涉及自然语言处理、机器学习等相关学科。比如利用自然语言处理,才可以更好地识别网页的内容,理解上下文,这样才可以结合用户特征展示“最匹配“的广告。而机器学习更多的时候是在帮助完善这一匹配,不断调优系统。

从根本上来说,计算广告学之所以能够兴起,主要原因也来自于互联网公司的大数据能力。

参考文献

百度百科:计算广告学