具身智能,作为人工智能领域的前沿分支,聚焦于构建能够通过集成感知与交互机制,在物理环境中实现动态适应与实时互动的智能系统及机器人平台。

9月26日,由36氪主办的“2024具身智能大会”以“让AI通向物理世界”为主题,在上海盛大开幕,世优科技出席2024具身智能大会圆桌对话,展示世优科技智能数字人领域最前沿的创新成果,探讨AIGC及具身智能技术的发展与场景应用等话题,同时,世优科技入选36氪“2024具身智能创新应用案例”。

01 让AI从数字世界走向现实世界

此前,人工智能主要以数字形式存在,缺乏视觉、触觉、听觉等感官体验,及对话、情感、情绪变化等交互体验,难以有效应对现实世界的各种情况。

数字人是虚实融合世界的具身智能体,尤其近年来多模态大模型和混合现实设备的快速发展,推动数字人完成更多的数字任务,成为日益重要的智能体。通过赋予AI“视觉身体”,与现实产生交互,使AI从数字世界走向现实世界,被认为是迈向通用人工智能的重要一步。

世优科技致力于打造以自然对话为核心的数字人交互系统,和以AI数字人为核心的智能化生产模式,尤其是基于AI Agent打造的全新的数字人多模态交互平台——世优波塔,让数字人从“能听会说”到“能理解会分析”,真正实现了从“人机交互”到“人人交互”,契合企业、品牌等应用场景。

世优波塔AI数字人的独特技术优势,在于对数字人的口型、表情及动作生成和融合的技术升级,使得交互体验更加流畅自然,已经达到了行业领先水平,此外还通过摄像头采集人的位置、姿态、情绪信息,让智能体能够有更多的感知和更细腻的反馈。

02 将AI数字人与具身智能相融合

“我们可以和具身智能装置形成无缝的衔接,把卓越的体验带给用户,最终让数字世界与物理世界构成无缝交融的精彩体验。”在2024具身智能大会现场,世优科技劉鎧源表示。

“具身智能”最大的特质就是能够以人的视角去自主感知物理世界,用拟人化的思维路径去学习,从而做出人类期待的行为反馈,以此方式主动与环境互动。

人和AI通过文本、视觉、语音、动作进行多模态交互,AI感知环境进行行动,交互式AI就成为了智能体。世优科技以数字人形象为载体,让AI技术驱动下的数字人变成像人一样的员工,AI数字人不仅能够承担起繁琐的劳动密集型任务,还能在数据处理、模式识别等高度专业化领域发挥其无可比拟的优势,从而释放人类的智力资本,使之投入到更具策略性、创新性和思维深度的工作中。

依赖世优科技累积的大规模、高质量的3D数据训练,对于提供真实人物、场景、行业的展示,丰富的交互体验和决策支持至关重要。通过“AI+3D”数据集的结合,世优科技提供包含2D、3D、文本、声音等多模态的感知数据,涵盖真实场景数据、仿真数据,未来将在具身智能领域达到具有高质量、多样化和大规模的数据集,持续推动人工智能向更高层次的智能化、自主化迈进。

03 开启AI新世界的里程碑

目前,世优科技的AI数字人正逐步成为企业的“金牌员工”和用户的“专属助理”,帮助更多企业更好地完成数智化转型,本次入选36氪“2024具身智能创新应用案例”,正是对世优科技在人工智能及智能体领域成果的肯定。

世优科技正逐步实现数字人技术、人工智能模型的创新与融合应用,为各领域场景提供解决方案,更好解决成本、体验以及效率的提升问题,实现降本增效,覆盖商业、文旅、金融、教育、3C电子等众多行业应用场景。

例如,在企业展厅中,数字人可担任专业导览员,以生动形象的方式为参观者介绍企业产品、技术和文化,提升企业形象和品牌价值。在学校,数字人可作为智能教师助手,为学生提供个性化的学习辅导和互动体验,助力教育机构提升教学质量。

具身智能体技术正从理论走向实践,加速落地,大模型与具身智能等AI技术的兴起,并非人工智能的终点,而是AI新世界的里程碑。

世优科技希望能为每一个组织、每一位用户打造智能数字分身,可以和具身智能装置形成无缝的衔接,用技术想象力把更卓越的体验带给用户,最终让数字世界与现实世界构成无缝交融的精彩体验。共同推动具身智能的产业蓬勃发展,引领智能行业产业化变革。