• 首页 > 科技正文
  • 通义推出数字人李白,化身“语文老师”进学校教诗词

  • 2024-09-20 14:27:11 发布于:北京市  来源: 中国网科技
  •   9月10日,记者获悉,通义推出数字人李白,基于通义大模型打造,集合通义多模态技术实力,不仅在外貌上还原唐代诗人李白的中年形象,更在眼神、言谈举止间融入对李白诗词意境的理解与艺术再现。打开通义App,输入“李白”,便能和数字人李白开启一场即兴对话,既能吟诗作对,也可聊聊科技发展。

      数字人李白刚上线,便于近期引入杭州刀茅巷小学,化身新学期一位特别的“语文老师”上了一堂公开课。“您写过的最长的诗是哪一首?”“《蜀道难》背后有什么故事?”……通义数字人李白引发了学生们的极大互动兴趣。面对一个个的好奇提问,李白不仅有问必答,而且引经据典,与学生们诗词接龙。


      这种寓教于乐的方式使语文课变得更加有趣且高效。杭州市刀茅巷小学语文老师王敏蕾表示,“平时的语文课堂中就是课本,还有多媒体教学,像数字人一起参与,我觉得小孩子不仅从数字人身上感受到不一样的课堂以外,还能学到课本以外的知识。”

      和需要大量视频作为训练数据,对真实人物进行复刻的传统数字人不同,通义推出的李白数字人,只需要一张图就可以生成具有全身动态的数字人,在这背后,是阿里通义大模型能力的“六剑客”。


      大脑来自通义的模型Qwen,其语⾔理解、知识、代码、数学及多语⾔等多项能⼒显著领先。表情跟自然呼吸态来自EMO模型,最大化地保留模型创造力,使人脸表现力大大提升。肢体动作上,通义采用了强控制方法AnimateAnyone,用针对人体建模的骨架图片来驱动人物动作,也是曾爆火全网的“全民舞王”背后的技术。

      语言模型来自通义语音实验室的CosyVoice技术,基于海量数据训练的生成式语音大模型,能够实现1-3句话声音克隆。为了让数字人有更好的实时对话能力,数字人李白还采用了VideoReTalking技术,它可以根据音频自动匹配嘴型。

      未来,视觉语言大模型VL(Vision-Language)也将被应用在数字人交互领域,在情感识别、虚拟现实交互上提供更优质的互动体验。未来打开摄像头,用户便能与李白打破时空结界、体验身处一世的实时视频通话。

      “李白是中国传统文化的一张名片,数字人李白让这位跨越千年的文学巨匠以全新的形态‘活’在当下,与全球观众互动,激发更多人对古典文学的兴趣与热爱。”通义数字人产品经理龙慧表示,未来,从线上教学到虚拟旅游,数字人将在教育、文化旅游、数字娱乐等多个领域展开广泛应用的计划。

    (责任编辑:谭梦桐)

    猜你喜欢:

  • 高端制造成引资高地 硬科技成关注焦点
  • 智能算力规模已超通用算力
  • 国产大飞机C919累计获得订单超千架
  • “三无”电子烟化身“可乐罐” 吸引未成年人“入
  • 智能时代看电视反而更麻烦了?
  • 平台定价应规则透明、逻辑一致
  • 技术突破、国产化加速 A股芯片板块有望迎来估值修
  • 工业信息安全产业保持高景气度
  • 来深圳光明科学城论坛,听大咖分享科技信息开辟产业
  • OPPO Reno10系列开售,销量创新高,2499元起长焦人像
  • 柔烘精洗,小天鹅本色系列洗烘套装让冬季衣物处理不
  • 云计算守护苏宁818方案揭秘:云资源调度、安全云双
  • F5发布全新AI驱动的应用和API安全功能 全方位护航
  • 大气污染防控形势严峻,TCL卧室新风空调多重防护保
  • 羊毛柔烘获世界制造业大会科技创新奖,小天鹅民族品
  • TCL新风空调618增氧减压挑战赛火热进行中,参与人数
  • 推荐阅读
    频道排行
    中国财经消费网   |    合作:gkjnet@qq.com
    Copyright © 2019-2024 CJ18.COM.CN All Rights Reserved 中国财经消费网 版权所有