如果你能控制信息过载会怎样?
波士顿大学各学院和新濠影汇线上赌场研究人员之间的开创性合作获得了100万美元的NSF拨款,用于解决媒体超载问题

郭磊(左起)普拉卡什·伊什瓦尔、德里·维贾亚和玛格丽特·贝特克。 西德尼·斯科特摄
在新闻文章、推特、脸谱网表情包、在线视频、Reddit帖子以及我们日常接触的所有其他媒体来源之间,如今似乎不可能在不超载的情况下获得信息,或者在不陷入绝望的混乱状态下保持联系。
但是,如果有一种机器或机制可以接收所有的信息——文字、图片、帖子和视频,甚至是几十种不同的语言——并以某种方式理解这一切呢? 更好的是,如果这台机器可以测量公众对任何给定事件的情绪,找出不同媒体对事件的报道方式,并解读两者之间的关系,那会怎么样?
这是波士顿大学新濠影汇线上赌场研究人员之间突破性合作的目标,他们是艺术与科学学院计算机科学教授Margrit Betke、工程学院电气与计算机工程和系统工程教授Prakash Ishwar、传播学院新兴媒体新濠影汇线上赌场研究助理教授Lei Guo和艺术与科学学院计算机科学助理教授Derry Wijaya。 2018年9月,波士顿大学团队从美国国家科学基金会获得了100万美元的四年新濠影汇线上赌场研究经费,以推进他们的工作。
这项新濠影汇线上赌场研究本身是这个不寻常故事的一部分,因为新濠影汇线上赌场研究人员来自波士顿大学不同的学校。
讲座。 一个火花。
这些看似不可能的合作者如何找到彼此的背景故事要追溯到哈里里计算新濠影汇线上赌场研究所的一个演讲厅。 2015年11月,当时刚刚加入波士顿大学的郭作为哈里里青年新濠影汇线上赌场研究员(Hariri Junior faculty Fellow),在那里做了一场座上座下的演讲,内容是使用“大数据”方法分析在线交流。 郭新濠影汇线上赌场研究媒体如何影响公众舆论(反之亦然),她解释了她是如何使用计算机帮助分析有关2012年总统选举的7700万条推文的,奥巴马总统在那次选举中击败了共和党人罗姆尼。
在此之前,媒体新濠影汇线上赌场研究传统上是手工完成的,学生和学者们费力地仔细新濠影汇线上赌场研究和分类文本。 郭想证明计算机可以帮助理解那些数据宝库,比如那些选举推特,这些数据太大了,无法用手解析。
Betke在观众席上,她被迷住了。 “我当时坐在那里想,‘哇,这太令人兴奋了!但贝特克新濠影汇线上赌场研究的是计算机视觉,而不是文本。 她没有看到她的计算机科学专业知识如何应用于郭正在新濠影汇线上赌场研究的政治问题。
这可能是故事的结局,但贝特克的新濠影汇线上赌场研究生迈赫鲁什·萨梅基(GRS ' 17)对郭的谈话同样兴奋,甚至更渴望寻求合作。 Betke回忆起Sameki坚持说:“我们就不能想点什么东西把这两个领域连接起来吗?”
几个月后,当新濠影汇线上赌场研究人员在哈里里新濠影汇线上赌场研究所的另一个活动——波士顿大学数据科学日(BU Data Science Day)上偶遇时,这个想法仍在酝酿之中。
该团队还将包括新濠影汇线上赌场研究机器学习的Ishwar,也就是说,创建可以“学习”基于一组示例做出决策的计算机算法。 “机器学习帮助我们扩大大数据的处理和分析,”Ishwar说。 “它永远不可能完全取代人类的专业知识——至少在不久的将来不会——但它是一种催化剂,可以帮助、加速和放大基于人类专业知识的数据分析。”
他们很快发现,他们的领域比他们想象的有更多的共同点。
“有些机器学习工具实际上适用于这两个领域:在图像中寻找模式,在文本中寻找模式。 这使我们能够共同努力。”
但这个团队并不完整。
缺失的部分
“我们需要一个真正擅长自动分析文本的第四个人,”Betke回忆道。 这个人就是德里·维贾亚(Derry Wijaya),他于2018年9月加入波士顿大学。 Wijaya是自然语言处理方面的专家,也就是说,让计算机程序理解普通的语音和文字,而不是计算机代码,他对可以学习多达100种语言的多语言系统特别感兴趣,即使输入最少。 贝特克说:“我们拥有一支来自不同背景的完美团队,他们的专业知识是一个很好的组合。”
该新濠影汇线上赌场研究所所长、中科院计算机科学教授阿泽尔•贝斯特夫罗斯(Azer Bestavros)表示,这个故事恰恰说明了哈里里新濠影汇线上赌场研究所想要培养的那种有计划的意外发现。 贝斯特夫罗斯说:“计算机科学不再仅仅是工程计算设备和平台,它实际上是将我们的思维方式和做事方式整合到每一个学科中所产生的创新。” 他说:“该新濠影汇线上赌场研究所的愿景是通过将计算机科学家与跨越学科领域的机会联系起来,实现这一目标。”
除了让新濠影汇线上赌场研究人员接触到数据科学的可能性的项目外,哈里里新濠影汇线上赌场研究所还充当了一个“孵化器”,分发小额种子资金。
And so, in 2016, with another presidential contest looming, Guo, Ishwar, Betke, and their collaborators applied for and won a Hariri Research Award to develop their techniques and apply them to tweets and YouTube videos 关于选举. The year after that, they parlayed that success into a b谷歌新濠影汇线上赌场研究奖. 他们的目标是:打造一个更好的谷歌信息流,可以自动纳入不同的观点,并作为“回音室效应”的解毒剂,这种效应只会让读者看到反映和重申他们现有观点的故事。
新濠影汇线上赌场研究奖励
100万美元的NSF拨款是该项目迄今为止最大的一笔拨款,将分三个阶段展开:首先是数据收集——收集成千上万的新闻报道、主要照片、视频剪辑、评论、推特等; 然后,利用亚马逊的土耳其机器人(Mechanical Turk)等众包劳动力,以及传播新濠影汇线上赌场研究人员的分析工作,他们将开始手动分析图书馆中相对较少的媒体选择。 他们会以一些基本的问题开始——这篇文章是关于什么的? 谁在里面? 在哪里发生的?然后进行更棘手的判断,比如这个项目主要是积极的还是消极的; 最后,利用机器学习,他们将开始“训练”计算机,使其对图书馆中的媒体做出类似人类的判断。
其他一些大数据新濠影汇线上赌场研究利用人工智能从新闻报道中挑选出人物。 这款游戏的独特之处在于,它将首次尝试确定一些更微妙的东西:故事的特定视角或框架。
郭说:“例如,要分析一起大规模枪击案,就需要从很多角度来讨论。” 同样的事件可以成为一篇人文新闻、一篇政策评论或一份经济影响报告。 郭说:“我们这个领域的框架分析通常是由学生程序员或新濠影汇线上赌场研究人员手动完成的。” “我们想看看机器学习的极限。”
新濠影汇线上赌场研究小组希望在他们的分析中加入图像和视频将有助于计算机更准确地判断帧。 例如,一篇人情味新闻的头条可能是一张或几张脸,而一篇关于新立法的新闻的头条可能是白宫的照片。
新濠影汇线上赌场研究人员还将新濠影汇线上赌场研究世界各地讲述故事的方式有何不同。 贝特克说:“我们希望美国以外的人使用的镜架与美国人使用的镜架不同。”
即使在进行分析之前,包含100种不同语言媒体的数据集也将成为新濠影汇线上赌场研究语言的新濠影汇线上赌场研究人员的第一个工具,Wijaya说:“拥有一个数据集实际上对进一步新濠影汇线上赌场研究非常重要,可以突破可能的界限。”
贝斯特夫罗斯说,哈里里新濠影汇线上赌场研究所在那里把想要突破界限的新濠影汇线上赌场研究人员联系起来。 “你如何赋予他们权力,或者放大他们的作用?”他问道。 “你把他们彼此联系起来,帮助他们孵化自己的想法。”
评论与讨论
波士顿大学缓和评论,以促进知情的、实质性的、文明的对话。 辱骂、亵渎、自我推销、误导、语无伦次或离题的评论将被拒绝。 版主在正常营业时间(EST)有新濠影汇赌场,只能接受用英语写的评论。 统计数据或事实必须包含引文或引文链接。