互联网

当前位置/ 首页/ 新闻频道互联网 正文

通过人工智能在线发现错误信息

我们生活在一个信息太多的时代 - 无休止的状态更新,模因,转贴,信息图表,报价和标签通过我们的社交媒体提供每日滚动,旨在表达观点,鼓励团结,提供信息,改变思想或原因争议。

问题是,普通的在线浏览器/社交媒体用户没有时间或资金来调查显示在他们的Feed上的所有内容的合法性或来源。正是这种脆弱性让不太谨慎的内容生成者利用这些漏洞来传播错误的信息,其结果可能是从一点点的鸡蛋面对尴尬到彻头彻尾的改变生活或可能致命的后果。

对于加州大学圣巴巴拉分校的计算机科学家威廉王,这种混乱的泥沼是探索的肥沃土壤。王先生认为,深度学习技巧,当部署在文字和超链接网络上的在线帖子和新闻文章时,可以帮助我们解决一些批判性思维。这个概念是他为期三年的项目“Dynamo:动态多渠道错误信息建模”的核心。

“所以现在的问题是,给定一个帖子,你会怎么能够理解这是否是专门误导或如果这是一个真正的帖子,”王说,“而且,由于网络的结构,可以识别的传播错误的信息以及与标准或非标准文章相比会有什么不同?“

一个很高的订单

这是一项艰巨的任务,特别是在社交媒体领域,它已经在合法的,已建立的新闻网站和可疑网站之间展开了竞争,这些网站尽力看官方,或者在用户退回并质疑来源之前吸引用户的情绪他们的信息。

然而,由于自然语言处理 - 王的专长 - 这些帖子和文章中的文字可用于揭示有关其创作者和传播者的信息,例如他们的关系,意识形态和发布的激励,以及他们的目标受众可能是谁。该算法可以浏览匿名用户在Twitter和Reddit等平台上发布的数百万条新闻文章,并检查文章的标题,内容和链接。目的是不仅要了解它们背​​后的实体,还要了解它们在整个网络中传播的模式。

我们很多人认为网站是理所当然的,随意转发或重新发布错误信息,这就是它如何传播,级联和病毒传播,”王说。“我们要问的一些最重要的问题是:模式是什么?有什么激励措施?”

为了找到答案,他和他的团队提出了一个学习机制,该机制除了内容本身是真还是假之外,还可以解释为什么某些故事会被重新发布或转发。一路上,王说,他们可以弄清楚谁参与了错误信息的传播,以及在这个过程中可能出现的模式。他补充说,图像也将成为数据集的一部分。

后来,研究人员计划将他们工作的其他方面与错误信息整合在一起,例如clickbait,它使用吸引人的,通常是耸人听闻的标题来诱使读者点击一个链接,最多将它们发送到一个狡猾的网站,或者最坏的情况下,窃取他们的信息。

“Clickbait主要是低质量的文章,确实可能包含大量的错误信息和虚假信息,因为它们必须夸大,”王说。与计算机科学博士一起 学生Jiawei Wu开发了一种称为“强化协同训练”的方法,该方法采用了一种有效的系统,用于标记数百篇文章,然后用于训练机器学习分类器,以标记它认为可能是巨大的clickbait,百万字的数据集。

“然后我们采取这些新标记的实例并重新训练分类器,”王说。“这个迭代过程允许我们随着时间的推移收集更多的标签数据,”他补充说,这提高了工具的准确性。

使用人工智能来理解和发现我们每天发送的文本潮汐模式,可以让我们深入了解我们如何有意或无意地传播错误信息。

“这真的是自然语言处理和机器学习的美妙,”王说。“我们有大量不同格式的数据,问题是:如何将非结构化数据转化为结构化知识?这是深度学习和数据科学的目标之一。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。