• 首页 > 科技正文
  • 部分AI系统已学会欺骗人类 甚至能瞒过安全测试

  • 2024-05-22 11:32:20作者: 张梦然 来源: 中国网科技
  •   有些人工智能(AI)系统已学会了欺骗人类,即使是经过训练的、“表现”出有用且诚实的系统。10日发表在《模式》杂志上的一篇文章中,研究人员描述了欺骗性AI的风险,并呼吁政府制定强有力的法规尽快解决这个问题。

      【总编辑圈点】

      论文第一作者、美国麻省理工学院人工智能安全研究员彼得·朴说,开发人员对导致AI出现欺骗这种不良行为的原因,还没有很好的理解。但总的来说,AI欺骗之所以出现,是因为基于欺骗的策略,是在给定的AI训练任务中一种能得到良好反馈的方式,换句话说,欺骗可帮助AI实现目标。

      研究人员分析了文献,重点关注AI系统传播虚假信息的方式。通过欺骗,AI系统地学习了如何去操纵他人。

      研究人员在分析中发现的最引人注目的例子是Meta公司的CICERO。这是一个专注于《外交》游戏的AI系统,《外交》是一款涉及建立联盟征服世界的游戏。Meta声称训练 CICERO “在很大程度上是诚实和乐于助人的 ”,且在玩游戏时“从不故意背刺 ”人类盟友。但该公司与《科学》论文一起发布的数据显示,CICERO并不那么“忠厚”。

      研究人员发现这款AI或已成为欺骗大师。虽然Meta成功地训练其在《外交》游戏中获胜,但Meta未能训练它诚实地获胜。

      AI系统在游戏中作弊看似无害,但它将导致欺骗性AI在能力上出现突破,未来可能会演变成更高级的欺骗形式。一些AI系统甚至学会了欺骗旨在评估其安全性的测试。在一项研究中,数字模拟器中的AI生物会“装死”,以骗过旨在消除快速复制AI系统的重要测试。

      人类需要尽快对未来AI和开源模型的更高级欺骗技能作好准备。随着它们的欺骗能力越来越先进,其对社会构成的危险将变得越来越严重。如文中所称,它们会顺利通过人类开发人员和监管机构强加的安全测试,引导人类进入一种“虚假的安全感”。如果欺骗性AI进一步完善这种令人不安的技能,人类可能会完全失去对它们的控制。

    (责任编辑:毕安吉)

    猜你喜欢:

  • 高端制造成引资高地 硬科技成关注焦点
  • 智能算力规模已超通用算力
  • 国产大飞机C919累计获得订单超千架
  • “三无”电子烟化身“可乐罐” 吸引未成年人“入
  • 智能时代看电视反而更麻烦了?
  • 平台定价应规则透明、逻辑一致
  • 技术突破、国产化加速 A股芯片板块有望迎来估值修
  • 工业信息安全产业保持高景气度
  • 来深圳光明科学城论坛,听大咖分享科技信息开辟产业
  • OPPO Reno10系列开售,销量创新高,2499元起长焦人像
  • 柔烘精洗,小天鹅本色系列洗烘套装让冬季衣物处理不
  • 云计算守护苏宁818方案揭秘:云资源调度、安全云双
  • F5发布全新AI驱动的应用和API安全功能 全方位护航
  • 大气污染防控形势严峻,TCL卧室新风空调多重防护保
  • 羊毛柔烘获世界制造业大会科技创新奖,小天鹅民族品
  • TCL新风空调618增氧减压挑战赛火热进行中,参与人数
  • 推荐阅读
    频道排行
    中国财经消费网   |    合作:gkjnet@qq.com
    Copyright © 2019-2023 CJ18.COM.CN All Rights Reserved 中国财经消费网 版权所有