计算传播学

来自计算思维百科
跳转至: 导航搜索

定义

计算传播学是计算社会科学的重要分支。它主要关注人类传播行为的可计算性基础,以传播网络分析、传播文本挖掘、数据科学等为主要分析工具,(以非介入地方式)大规模地收集并分析人类传播行为数据,挖掘人类传播行为背后的模式和法则,分析模式背后的生成机制与基本原理,可以被广泛地应用于数据新闻和计算广告等场景,注重编程训练、数学建模、可计算思维。

基础

计算传播学的分析基础在于人类传播行为的可计算性的基础。使用货币来衡量人类经济行为使得经济学具有可计算性,使用实验来做分组的比较使得心理学获得可计算性,使用比特作为信息量的度量单位使得计算机科学具有了可计算性,使用基因来分析生物的遗传和变异使得生物学具有可计算性,使用关系和矩阵来分析网络和语言分别使得网络科学和计算语言学具有了可计算性。可计算性可以使得学科在短期飞跃发展,分子生物学如此,计算机科学如此,网络科学如此,计算语言学如此,计算社会科学也因此被寄予厚望。人类传播行为可计算性的基础是什么?寻找传播学的货币和基因是计算传播学的首要任务。

网络科学以关系来度量物理世界和社会现实

网络科学以关系来度量物理世界和社会现实,而这些稳定的关系(表现为网络中的链接)可以成为人类传播行为可计算性的基础。人类传播行为本身的丰富性和复杂性为计算传播学研究提出了重要挑战。例如,因为传播现象包含了大量的交互行为,采用网络研究视角成为理解传播现象的必由之路。传播网络分析在传播学并不是什么新鲜的事物(可参见《传播网络理论》一书(Monge & Contractor, 2003)),但过去的传播网络分析主要局限于小数据,分析组织内和组织间的传播行为,其应用范围相对有限,亟需将其扩展为大规模人类传播行为的分析。

借助计算语言学作为传播内容分析的工具和方法

除了网络科学之外,计算传播学可以借助计算语言学作为传播内容分析的工具和方法。与传统语言学相比,计算语言学(又称为“统计语言学”),侧重于使用统计学工具和机器学习方法分析各种语料。因为互联网的发展,尤其是中文分词、语音识别、网络爬虫、网页排名、网页相关性计算、地图搜索、新闻分类、词汇聚类、搜索引擎反作弊、拼音输入法、搜索广告等功能的实现,计算语言学的地位越来越重要。传播内容分析是传播学研究的一个重要方面。词云分析、语义网络分析、情感分析、文本聚类、主题模型、机器翻译、语音识别等都可以广泛的应用到传播文本挖掘的应用当中来。

数据科学的发展恰好为计算传播学的发展提供了理想的工具

数据科学的发展恰好为计算传播学的发展提供了理想的工具。大规模的数字化指纹(digital traces)为人类传播行为分析奠定了基础。计算传播学是建立在丰富的人类传播行为的数据之上的,而收集和分析这些传播行为就成为了计算传播学的主要工作。因此,传播学亟需走出传统的研究套路,培养研究者抓取、分析、可视化大规模电子化数据的能力。数据科学是从数据当中提取知识的研究(Dhar, 2013),它囊括了包括信号处理、数学、概率模型、机器学习、统计学习、计算机编程、数据工程、模式识别、可视化、数据仓库、高性能计算等各个方面。因此,将数据科学的分析方法纳入计算传播学研究当中成为传播学发展的重要一步。

人类传播行为所隐藏的模式和法则

人类传播行为所隐藏的模式和法则是计算传播学研究的重要方向,而解释其背后的机制和原理则成为计算传播学研究的目标。网络科学为分析人类传播行为可供了更多的工具和模型。例如,人类传播行为开始成为人类动力学(human dynamics)关注的焦点。沿着网络中的链接出发,计算传播学正在尝试突破社会现实混沌的迷宫,从社会现实的数据出发,发掘社会系统内部的模式、法则、机制、原理。

作用

值得一提的是,除了学术研究之外,计算传播学教育将为数据新闻、计算广告产业提供后备人才。数据新闻突出了数据对于内容生产和传播的重要意义。它具体包括了计算机(数据库)辅助的新闻报道、信息图、可视化等方面。而计算广告学是由计算机科学和互联网广告产业共同催生的一个研究分支,它强调了通过设计算法达到将广告最好地展现给一个用户的目标。毫无疑问无论是数据新闻还是计算广告都与传统的传播学有着千丝万缕的关系。在初期阶段,计算机的发展促进了它们的涌现;随着计算传播学的发展,传播的视角同样可以反哺数据新闻和计算广告的发展。

毫无疑问,传播学因此将和计算机科学、物理学、网络科学、数学、计算语言学、生物学等多个学科开始交汇。例如,从数据的抓取开始,计算机科学家开始投入到这种大规模数据的挖掘工作中来。计算传播学研究者因此将更加注重编程的训练和数据科学的训练。只有这样,才能同其他学科实现有效的对话与合作。

参考文献

谷歌:计算传播学导论