7月30日,2024京东云峰会在上海举行。会上,京东云言犀数字人3.0 平台全新升级发布,平台融合了京东言犀大模型及多模态人机交互技术,具备零幻觉、零样本、高可控等特性,为企业和个人用户提供个性化、风格化、小时级的数字人定制解决方案,助力电商直播、文旅服务、金融客服等千行百业场景应用,开启下一代智能人机交互。
言犀数字人3.0 实现个性化风格化数字人生成
京东探索研究院院长、京东科技人工智能业务负责人何晓冬博士表示,大模型的核心人机交互介质是智能体、数字人、具身智能,分别满足了云、端、线下不同场景的交互需求,共同构建起下一代智能交互的完整触点。
作为大模型率先落地的几个产业,言犀数字人在技术、效果和商业化上率先冲线,完成了最大规模的产业实践,引领数字人行业从技术突破到商业化跨越。今年4月,采销东哥AI数字人引发4000万人围观,引爆数字人热潮。在京东618,言犀数字人携手5000个品牌稳定开播,直播累计时长超过40万小时,累计观看人次超过1亿,互动频次超过500万次,格力董明珠等21位总裁数字人在京东直播间集结“出道”,开启了行业首个总裁数字人大规模实践。
全新发布的言犀数字人3.0 平台,基于京东言犀大模型及多模态交互能力,实现了从单一产品到智能平台化的跨越。支持企业和个人用户根据自身需求,实现小时级、个性化、风格化的数字人生成。全新升级后,平台上线100+个性化角色,50+行业特定属性场景,实现零配置下覆盖90%的常见问询,商品推荐应答准确率超90%,让个性化、可定制的数字人角色,在多元复杂场景下都能提供优质用户服务。
以建促用,“用”是关键。在电商直播领域,京东云言犀数字人表现正在超越行业80%的主播,为满足直播的多样化需求,从形象妆造、动作神态、情绪语气等方面打造个性化角色,满足不同行业的定制需求,并创新性地打造了双人直播、试妆直播、换装直播、实景直播、多语种直播等创新直播玩法,带来新颖的观看和购物体验。
电商直播是数字人迈向大规模商业化的拐点,但数字人的应用潜力不止于此。不局限于电商直播场景,言犀数字人还活跃在文旅、金融、政务等千行百业,提供导览、导购、咨询、个人助理等服务。京东云打造的花木兰数字人已正式入职大同文旅,名胜古迹如数家珍、支持中英双语,向世界推介大同。京东云联合江西新余打造的仙女数字人,成为仙女湖的最佳代言人。京东金融服务数字人,已累计服务了超500万用户,满意度超90%。言犀数字人,正成为连接现实世界与数字世界的桥梁,开启下一代智能交互的无限可能。
智能进化 多模态大模型开启下一代智能交互
为了让技术在严肃商业场景可用,京东云言犀团队坚持打造接近“零幻觉”的产品,并在内外部实践中反复应用、反复迭代,形成技术与应用协同进化的正向飞轮。通过大模型技术优化,不断减少训练数据,进一步降低数字人制作成本,提高易用性。
技术生长,不断进化。一年来,京东不断升级言犀大模型的能力,如今言犀大模型已经从语言走向多模态,拥有语言、语音、图像、视频、数字人等更多模态能力。语言大模型上,支持模型自进化和低比特高精度量化的推理技术,模型显存节约70%;语音大模型,20万小时的海量语音数据训练,支持零样本语音合成与跨语种语音合成,准确识别中/英/泰/印尼/越南等外语以及中国20种方言,自研MOE识别框架,显著缩减训练时长,并提供多规格的参数模型,适配不同产业场景需求。
图像大模型上,提供产业级的文生图能力,支持中文原生的图像生成,高达4K以上的超高分辨率图像生成,以及定制多风格图像生成;视频大模型上,自研的4D并行模型框架大幅提升生成长度和清晰度,支持生成长达 32 秒的1080p 高清视频;数字人大模型上,针对行业中视频生成的幻觉问题,支持生成高稳定、高可控的“零幻觉”数字人,并实现零样本实时推理,进一步提升了数字人的表现力。
新一代的数字人长出智慧,凭借丰富的直播及行业通用知识库,结合大模型自学习能力,能够实现对用户问题的实时、自动回复,保持精准解答。依托更专业丰富的行业知识,细粒度行业知识细分级文本生成、大模型知识库生成与自迭代、客户偏好预测商品精准推荐等功能,商品推荐应答准确率超90%,提升交互的智能化水平。
门槛更低,成本更低。为了让企业用户和个人用户“用得起、用得上、用得好”,言犀数字人可支持部分CPU部署,商家可以通过云端一键开播,无需本地电脑配置,即可实现上百个直播间同时开播,降低了开播门槛。
从数字人的应用一角,我们可以瞥见京东言犀大模型正快步跑进千行百业。京东云坚持让大模型一边训一边跑,在产业应用中探索大模型的实用价值,言犀数字人将成为连接现实世界与数字世界的桥梁,开启智能交互的全新时代,让生活更智能、更便捷、更美好。