郑二利 王颖吉: 人工智能时代的数据意识形态——基于大数据对价值观和行为活动影响的思考

选择字号:   本文共阅读 121 次 更新时间:2020-02-14 13:36:21

进入专题: 大数据   人工智能   数据意识形态   数据伦理  

郑二利   王颖吉  

  

好运11选5_[官网首页]   摘 要:在人人都无法脱离数据的大数据时代,大数据的影响不容小觑,它挑战了现代社会的既定秩序,也引发了新的社会问题。大数据给予未来世界无穷可能性,人们在欢呼大数据的美好前景时,也应该警惕新技术的威胁,理性看待大数据的影响。在大众传播领域,面对大数据技术,人是盲目和被动的,他的思想和行为会被诱导,会不经意间泄露自己的隐私,甚至侵犯他人的隐私。大数据技术把一切纳入算法中,大数据并不是完备的,算法也并不总是客观公正的,人们应该知道算法是否具有价值偏向、算法是谁的工具、它是为谁服务的。好运11选5_[官网首页]因此,人们需要了解大数据对人的价值观和行为活动的影响,了解算法渗透的意识形态性,警惕被数据和算法控制。说到底,数据既是社会商品,又是裹挟政治、经济、文化、资本等复杂权力关系的信息载体,它既关系到个体的虚拟身份认同,又关系到数据伦理的建构。

   关键词:大数据;人工智能;数据意识形态;数据伦理

   作者单位:郑二利,天津工业大学人文学院;王颖吉,北京师范大学新闻传播学院

  

   大数据与人工智能革命的基石是数据,放眼当下世界,大到全球经济走势,小到个人网上社交行为,各类数据一同汇入庞大的数据浪潮之中,数据之大与数据传播之快速都是前所未有的。大数据技术产生之后,人们推测未来是人工智能制造神话的时代,由于人工智能善于学习,能利用算法提取数据,形成有效分析模型,因此它能模仿人类,甚至替代、赶超人类。好运11选5_[官网首页]利用人工智能医学诊断、自动驾驶、识别图像和语音等,都有非常好的前景。有学者预言,到超人工智能阶段时①,人工智能会完胜人类。好运11选5_[官网首页]但是,人们在受益的同时,也应对其心存警惕。人类应该警惕自己对新技术的盲区,就在媒体欢呼大数据的美好前景时,大众在大数据面前往往显得盲目和被动。在大众传播领域中,大众的思想和行为常常被诱导,有时候不经意间泄露隐私,甚至侵犯他人隐私,大众对此却浑然不觉。因此我们应审视数据控制,并揭示其对人类观念和行为产生的影响。

   其实,技术的历次革命,都会挑战传统秩序,继而影响人类的观念和行为。工业革命推动了启蒙理性,撼动了西方世界的神学秩序和王权秩序。好运11选5_[官网首页]大数据革命必然也会挑战现代社会的既定秩序,引发新的社会问题,如人与机器的关系问题、数据伦理问题等。生物科学、计算科学的发展,未来仿生生命极有可能威胁人类世界,科幻电影、科幻文学都表述过这种担忧,即在未来某个时间点,机器人侵犯人类世界,毁灭性灾难来临。总之,科技给予未来世界无穷的可能性,同时也可能引发种种危险性。而当下,我们正生活在一个任何人都无法摆脱数据的大数据时代,我们在满怀期待的同时也应心存警惕,理性看待大数据的影响。好运11选5_[官网首页]本研究着重分析在传播领域中,大数据对人的价值观和行为活动产生的影响,兹从以下几个方面展开论述。

   一、大数据主义——一切纳入算法中

好运11选5_[官网首页]   大数据即广义的数据,它是一切可以用作数据资料的统称,即可以被收集、测量、分析,能进行可视化处理的信息或知识,包含产生于自然和人类世界中的文字、图片、音频、视频等,以及各种物质材料,甚至宇宙粒子。人类使用数据的历史非常悠久,“已故的图灵奖得主吉姆·格雷在其《事务处理》一书中提到:6000年前,苏美尔人就使用了数据记录的方法,已知最早的数据是写在土块上的,上面记录着皇家税收、土地、谷物、牲畜、奴隶和黄金等情况。”[1] 传统数据是手工记录、整理的数据,主要服务于数字记录与统计。大数据是智能计算机运算、分析的数据。大数据一方面指数据生产规模扩大、种类多样化,海量数据自动生产;另一方面指人工智能可以学习和分析大数据,代替人进行预判。

   如果说传统数据的主要职能是数字记录与统计,那么大数据的职能并不局限于此。大数据催生了人类对生命和世界的一种全新认识,即认为所有的生物都是算法生物,人和其他动物都是如此,也就是说,算法支配人和动物做出吃饭、睡觉、交友等行为。此外,当一切都是数据,甚至某些事物被概念化为数据时,那么一切都可以纳入算法的框架,而基于大数据的算法能描述包括自然、人类世界在内的一切。这样看来过去的金融、经济、政治等话题,其实都可以看成是基于数据管理和分析的算法问题。如以色列学者尤瓦尔·赫拉利谈到:“一般人看来,经济就是有农民种小麦,有工人做衣服,有顾客买面包和衣服。但在经济学家眼中,经济机制就是收集关于欲望和能力的数据,再转化为决策”[2] 。在政治领域中,“自由市场资本主义和苏联式国家控制共产主义也不是意识形态、伦理教条或政治制度上的竞争,而根本是不同数据处理系统间的竞争。资本主义采取分散式处理,而苏联式共产主义则是集中式处理。”[2]

   可见,大数据建构了数据化世界理念,一切需通过数据呈现,大数据能呈现一切。同时,人类的自主判断会减少,而更依附于算法的分析和预判。比如在总统选举中,媒体利用大数据分析和描述总统和选民属性,预测选举结果;在体育赛事中,利用大数据分析球队的进球指数,预判冠军球队……在过去的旅行中,旅途充满了不确定性,人们需要按照地图提前规划行程,并留心公路上的指示牌,随时规划路线,防止走错路。有了数字地图,这一切都迎刃而解了。数字地图利用大数据解决了所有问题,它实时采集、分析用户数据,并上传共享,它能分分钟为用户规划行程。用户不必再担心旅途的不确定性了,因为数字地图提供的服务更及时,它比用户自己规划得更精准。正因为大数据能消除不确定性,所以数据科学大行其道,它冲击了传统的政治、经济、文化等制度,并迫使其转型。数据经济已成为全球经济的重要组成部分,同时也成为传统行业转型的生长点,马云称其为“鼠标与水泥的结合”。文化领域同样受到数据科学的冲击,更倾向于依靠数据决策,如有的社交媒体利用大数据写稿。早在2015年9月10日,腾讯研发的机器人Dreamwriter写了首篇谈CPI增长的新闻稿,稿件内容是根据算法自动生成的。Dreamwriter能根据指令在0.5秒内生成图文并茂的新闻稿,这是新闻记者办不到的。

   在算法为王的时代,一切被纳入算法中,算法是否具有价值偏向、算法能否得出客观公正的结论、大数据是否一定是完备的数据等,这些都会左右算法的结果,进而影响人的观念和行为。算法是基于系统方法描述解决问题的指令,普通人几乎完全不了解算法的原理,而这恰恰就是盲区。今日头条的智能总工程师曾说,算法加加减减就能改变情绪,能把快乐的情绪通过算法加减变成悲伤的情绪。头条算法工程师的说法揭示了算法会被人为干预的事实,看来它并不总是客观、公正的。或许正因此,2018年初今日头条宣布公开算法,今日头条的做法是为了树立客观公正的市场形象,告诉大众他们不会干预算法,今日头条的算法没有价值偏向。不过,让算法公开透明并不能保障客观、公正,因为数据体量大并不意味着数据是完备的。如果数据有问题,那么分析的结果也是有问题的,这也是需要警惕的。正如一位美国学者所说:“大数据不仅意味着有更多好的分析,也意味着有更多坏的分析。要知道,即便是专家大牛也有掉链子的时候。如果一些不好的数据被心怀叵测的可疑人员添油加醋地利用,事情会变得更糟糕;不过,即便是动机纯洁的分析人员稍有不慎也会上当受骗。在这个充满数据的世界中,消费者得有一幅火眼金睛才行啊!”[3] 显然,大数据是非常复杂的,我们不能低估它的复杂性,尤其应该关注它是为谁服务的,它是谁的工具。在数据分析过程中,不仅仅数据在起作用,支撑数据的理论、定义数据的方式,都参与了数据管理与计算,都能干预算法。如果定义方式发生变化、数据理论发生变化,那么数据分析结果也会出现变化,这也应了头条工程师那句话,在算法加加减减之间,主导情绪变化。如搜索引擎中的头条、资讯平台中的头条,都有很强的导向性,百度就曾陷入为“莆田系”医院打广告的丑闻中。

   当然,对每天裹挟着我们的各种社交媒体、资讯平台来说,大数据技术是其最得力的助手,在他们那里,庞大的客户数据就是资本,资本可以衍生权力和利益。对于普通大众来说,减少依附性,并对这一切保持理性变得非常重要。

   二、数据管理与控制:隐形的权力争夺

   在移动互联网普及的大背景下,数据量呈指数级增长,现实就是海量数据的堆积。显然,大数据的意义不只是体量大,关键还在于它的价值,即信息量大。香农在20世纪建构了信息论,用信息熵度量信息量的大小,解决了信息量无法测量的问题。“香农指出,信息量与不确定性有关系:假如我们需要搞清楚一件非常不确定的事,或是我们一无所知的事情,就需要了解大量的信息。信息的度量就等于不确定性的多少,这样香农就把熵和信息量联系起来了。”[4] 信息熵代表不确定性,信息熵越大,不确定性越大,减少不确定性需要引入的信息量越大。

   信息熵可以用来定义大数据时代的世界观[4] 。依据量子力学的观点,世界是测不准的,充满了不确定性。要降低世界的不确定性、减少信息熵,还需要引入更多的信息。大数据信息量大,更有利于消除不确定性。阿尔法狗打败了棋王李世石,就是因为它存储了足够多的围棋对弈数据,包括李世石下棋的数据,阿尔法狗有效利用大数据减少了棋局中的不确定性。引入更多信息消除不确定性,我们既需留意算法揭示的数据规律,也需警惕算法渗透的意识形态观念。因为算法是理论与数据的结合,它隐含着设计者的意图,设计者的意图支配计算的结果,这就导致结果出现价值偏向。就拿我们常见的搜索引擎来说,它们常常把商业广告放在首页中最醒目的位置,这种搜索结果明显是人为干预过的,也就是说,搜索引擎的算法体现了设计者的意图,即效益至上。

   事实上,在大众传播领域中,数据信息并不能完全自由流通,也就是说数据信息虽然量大,但是并不完备。政治、经济等权力体系常常干涉数据信息流通,并试图占有、制造或阻碍信息。影视传媒公司操控数据的丑闻值得关注,有些制片方为了牟取票房暴利,在影片上映前刷票、锁场,通过伪造售票数据营造抢票信息,进而误导观众。制片方为了利益,不惜违规制造虚假数据,因为对他们来说,数据就是资本,控制数据就能控制观众。这里,数据控制的落差提出了全新的挑战,正如美国学者丹·席勒说:“大数据一方面,它会赋予那些靠信息获利的垄断资本更大的权力;另一方面,其他人却在毫不知情的情况下被剥夺掉一部分权力。这会造成更大的权力落差,预计将来会成为一个政治问题。”[5]

   当大数据关系到资本、权力时,数据争夺就变得更激烈了。也就是说,权力和财富的争夺有时表现为争夺和控制数据。对普通大众来说,更应该警惕被大数据隐含的资本和权力所操控。尼尔·波兹曼曾在《技术垄断》中谈到,“我们强大的意识形态工具就是我们的语言”[6] ,因为人常常被深锁在自己语言的边界里,理解其对世界和人的描述。而浑然不觉那些边界外的人有着怎样的世界。同理,大数据时代,人们常常被深锁在数据结构中,依据数据思维、判断、抉择,甚至算法完全代替人做出选择,而人们对其中隐含的权力关系却浑然不觉。简言之,数据信息并不是客观、中立的,它有主动施为性,能导向人的价值判断和行为选择。

数据本身是中性的,而且庞大的数据堆积是没有意义的。为了实现数据的价值,必须把数据关联起来,并使其成为一种结构化的存在。在庞大的数据洪流中,有被关联的数据,也有不发生关联闲置的数据。管理和使用大数据需要数据挖掘技术,数据挖掘就是在一定范围内设定关键词,通过语法、词法、修辞分析,建立模型,处理数据。“在谷歌,至少有四成的工程师天天在处理数据。由于大数据的原始数据常常是没有固定格式、显得杂乱无章的,因此使用大数据的第一步是对数据的过滤和整理,去除与要解决的问题无关的维度,将与问题有关的数据内容进行格式化的整理,以便进一步使用。”[4] 不管是传媒业还是互联网、金融等行业,(点击此处阅读下一页)

    进入专题: 大数据   人工智能   数据意识形态   数据伦理  

本文责编:frank
发信站:500万彩票_[开户赠金](http://taiyanglei.com),栏目:天益学术 > 哲学 > 科学哲学
本文链接:http://taiyanglei.com/data/120158.html
文章来源:《新闻与传播评论》2019年第1期

0 推荐

在方框中输入电子邮件地址,多个邮件之间用半角逗号(,)分隔。

500万彩票_[开户赠金](taiyanglei.com)网站为公益纯学术网站,旨在推动学术繁荣、塑造社会精神。
凡本网首发及经作者授权但非首发的所有作品,版权归作者本人所有。网络转载请注明作者、出处并保持完整,纸媒转载请经本网或作者本人书面授权。
凡本网注明“来源:XXX(非500万彩票_[开户赠金]网)”的作品,均转载自其它媒体,转载目的在于分享信息、助推思想传播,并不代表本网赞同其观点和对其真实性负责。若作者或版权人不愿被使用,请来函指出,本网即予改正。
Powered by taiyanglei.com Copyright © 2020 by taiyanglei.com All Rights Reserved 500万彩票_[开户赠金] 京ICP备12007865号 京公网安备11010602120014号.
易康网

页面底部区域 foot.htm