{{detailStore.author.is_follow?'已关注':'关注'}}
管理
商汤绝影:引领智能汽车交互革新,打造以人为本的超级智能体
文章

在2024年世界人工智能大会(WAIC)上,商汤绝影携一系列基于「日日新5.5」原生多模态大模型打造的智能驾驶和智能座舱产品亮相,展现出其在智能汽车领域的前沿技术实力,引领了一场以“以人为本”的智能汽车交互革命。

商汤绝影通过自主研发的多模态大模型,不仅在智能驾驶领域取得了重大突破,还推动了智能座舱交互体验的革新,加速智能汽车向超级智能体的进化。

商汤绝影的多模态大模型具有将语音、文字、图像、手势、视频等多种模态信息进行高效融合的能力,为用户提供了更加自然和丰富的交互体验。

相比以往模型先将语音转化为文字,再结合图像进行分析的传统方式,商汤绝影的多模态大模型能够一次性接收所有模态输入,统一处理后再输出相应模态的信息,大大减少了信息的丢失和延迟,显著提升了交互的效率和质量。

在智能驾驶方面,商汤绝影展示了其可解释、可交互的自动驾驶大模型DriveAGI,该模型基于多模态大模型打造,不仅提升了车辆对复杂交通环境的理解和应对能力,还能向用户解释其驾驶决策的推理过程,增强了系统的透明度和可信度。

DriveAGI能够在无图情况下,仅凭搭载的7个摄像头,就实现城区复杂道路、乡村小路等场景的一镜到底实车演示,证明了其在端到端自动驾驶领域的领先地位。

此外,DriveAGI还具备强大的可交互性,用户可以通过语音或手势指令控制自动驾驶行为,例如在自动驾驶状态下,驾驶员可通过语音指令让系统直接左拐,系统将根据当前路况执行这一指令,体现了智能化的灵活性和人性化。

智能座舱方面,商汤绝影发布了行业首个车载生成式交互界面「随心界面」(FlexInterface)和「随意操控」(AgentFlow)等车载AI Agent应用,通过AI技术彻底改变了用户与车载系统的交互方式。

FlexInterface基于AI大模型的即时生成和修改交互界面的能力,能够根据用户需求和环境变化自动生成匹配主题的界面,提供个性化体验。

AgentFlow则通过大模型的推理能力,模拟人类点击操作,实现对APP和网站的直接操作,用户仅需使用自然语言就能让AI自主选择多个工具完成复杂任务,无需额外研发适配,极大地提升了操作便捷性和车载系统功能范围。

商汤绝影在智能汽车领域的技术创新和产品落地,得益于其在多模态大模型上的深厚积累和行业领先的部署能力。

商汤绝影在行业内率先实现了原生多模态大模型的车端部署,其车载端侧8B多模态模型首包延迟低至300毫秒以内,推理速度达到40Tokens/秒,覆盖主流算力平台,为智能汽车交互革新提供了强有力的技术支撑。

同时,商汤绝影的自动驾驶小巴在WAIC 2024上成为唯一承担接驳任务的L4级别自动驾驶小巴,展示了其在高阶自动驾驶领域的实力。

商汤绝影在智能汽车领域的发展,不仅体现在技术创新和产品落地,更在于其对未来智能汽车发展方向的深刻洞察。

智能汽车正逐渐进化为超级智能体,而多模态大模型是这一进程中的核心驱动力。商汤绝影作为智能汽车领域的核心供应商,正以其多模态大模型为核心,加速智能汽车交互方式的革新,推动智能汽车向超级智能体的进化,引领一场以“以人为本”的智能汽车交互革命,开启智慧出行的新篇章。

写评论
积分赞赏
点赞
评论区
  • 编辑
  • {{is_favourite ? '已收藏' : '收藏'}}
  • {{is_personal_top ? '取消主页置顶' : '个人主页置顶'}}
  • 举报
  • 加入黑名单
  • 删除
  • 取消置顶
  • 置顶推荐
    • 6小时
    • 12小时
    • 24小时
    • 3天
    • 一周
    • 长期
  • {{digest?'撤销精华':'设为精华'}}
回到顶部
  • 全部评论{{detailStore.commentnum}} 条
  • 只看作者
  • 最热
  • 最新
  • 最早

「待审核」

{{ comment.relativeTime }} 已被赞赏 {{comment.integral}} 积分 回复

暂无相关评论

发表一下个人看法吧