X 智能社区

    {{score?`上周社区出行值 ${score}`:''}}{{rank?'  |   全站排名:':''}}{{rank}}

    新出行自动驾驶主题精品板块,本版块采用先审后出机制,旨在收录自动驾驶精品内容。

    社区版主:
    签到日历
    连续签到{{userStore.user_info.sign_info?.sign_day || 0}}
    • 发文章
    • 发动态
    • 发点评
    • 推荐
    • 单Orin能做城区NOA吗?
    • 智能座舱我会玩
    全部话题
    动态

    智能座舱进入“端到端”时刻...和大家聊聊座舱大模型| 今天到访商汤。 大多数人好奇,智驾端到端,那下半场座舱会带来什么? 高通下代芯片规划算力是 200+TOPS,能够支持 4-5 个 7B(亿)的参数模型,座舱的“端到端”时刻也马上到来。 未来座舱多模态大模型会变成多个应用智能体,智能体和智能体之间可以交流、推理,满足用户不同需求,和如今的智驾系统 1 + 系统 2 相同。 也是同样端到端,这时候最大的改变就是系统从过去的被动接受人类指令,变成更类人的主动交互、和人一样丝滑交流。 商汤多模态流式交互前段时间比较火,多模态就是集成了多种交互信息,比如声音、文本、图像和视频等等,实时交互,具有推理性。 这种交互模式有几个特点,比如多任务的适应性强,能够在一个模型中处理多种任务,并且根据不同上下文调整行为和输出,其次是具备记忆力。 跑在座舱上有几个好处,多模态那可以利用舱内的 DMS/OMS 摄像头,结合车内场景来调动舱内的状态场景理解能力更强,而且大模型的交流会更类人。 具备记忆力的优势是比如乐道的「小乐识人」,就是用了商汤的方案。可以基于人脸数据自动存储个性化数据,叫小乐后就会记住你的使用习惯、座椅位置等等。 现在商汤有两种座舱模型: 车端的座舱模型参数大概是 2.1B/8B ,8295 可以支持 2.1B ,8B 的参数得 Orin 才可以 。几十 B 甚至到 100B 以上就得上云端算力。 而我们现在车上大部分语言跑的都是单模态,只懂语音,模型也很小,小于 1B ,主要做车控识别。 而且过去语音都是有很多个小模型堆叠一起,然后翻译成文本再分类,但会常常识别不清晰,或者识别错了,要么识别不了。 未来多模态的大模型,就是可以通过舱内视频+语音+场景等方式结合,识别更加准确、也有更拟人化的识别,而且还有时序的记忆。 比如在车里掉了一顶帽子,语音会告诉你“你之前掉在了后排的座椅上。” 比如丢了手机,语音会说”昨天早上十点有个长发的女生把手机落在前排座椅了” 但不同模型体量带来的方向不同。 云端前期投入不高,但后期量产成本很高,多模态的语音、图片、视频等算力需求很大。 车端相反,前期投入高,比如要大算力芯片。但后期推理成本低。

    飞机先生
    新闻

    卓驭将基于 NVIDIA DRIVE Thor 开发智能驾驶解决方案

    陈大个同学
    动态

    正在将之前通勤录下来的很多例子剪辑一个集锦,主要是针对接管的例子,一面剪一面唠两句。 我的智驾视频其实有个特点不知道大家有没有发现,就是到目前为止都极少提及一些技术性用词,例如最火热的“端到端”,接下来这个也是一句不提。因为确实没办法将一些行为能力绝对有把握地和你想象中的技术术语关联起来。如果在官方更新文案里面有的那当然会鹦鹉学舌在版本环节提一嘴,但对应到具体一个例子的表现,真的暂时没能力有证据进行论述“这就是 XXX 技术造成的成果”。 比方说上次理想的泊车跑出马路,我就觉得挺有“端味”的,但因为失败了就被辟谣说没有应用端到端。而且,往往会看到这个版本说:这很丝滑,端到端牛逼。但回想起上一版本列举的例子表述也是:很丝滑,牛逼。再往上一个版本的视频考古一下发现也是说很丝滑。那么这几个很丝滑的区别在哪里呢?主观上觉得其实也没问题,但把内里的技术术语进行关联,就有点麻烦 .... 所以,我还是那个吃瓜群众,不懂你里面用的啥技术,仅是看看吃瓜路上有哪些表现就好了,买个车还得学技术多累啊!剪着剪着,发现这次选的几个例子,5.3 到 5.2 表现的区别也不会很大。其实环境因素对于接管的影响还是远高于新版本能力上限的差异,好,我这就改改词儿 .......

    双擎会铁皮
    动态

    《对话周光|元戎量产端到端后的深聊...》 这次和光哥聊了很多,有几个很有意思的讨论,和大家分享: 1|端到端对人才架构的影响 原本是人去看数据,然后归纳出这些规律出来,其实规律就是算法。 现在正在发生的人工智能2.0,是靠机器去看数据,然后统计出来它详细的分布,应该是更多的资源是花在算力、数据上,新一代核心人才不需要那么多。 2|端到端的的定义 在我们看来整个的定义是全程可求导,就是说你的输入输出是可求导的。 端到端是去冲上限,下限就是 rule base 兜底,甚至 rule base 都可以往 AI 进化,因为小模型它是可确定的,它的上限灵活也可以更拟人。 其实 AEB 也是一种 AI safety,只不过它是前向的 AI safety。 3|现在类比GPT是什么水平? 我觉得就是 GPT2 的水平,GPT2 到 3.5 再到 4 是暴涨期,就是未来两三年的事。但 GPT4-5 可能不一定还是暴涨期,后面有个停滞期。 4|技术扩散 没有技术是不扩散的。 我觉得端到端是给了一个 universal solution for robotics and autonomous driving( 机器人和自动驾驶的通用解决方案),是通用的。 不需要去细分无人驾驶、机器人具身,就跟语言模型一样。GPT 能做律师,也能做数学,也能做语文,现在的趋势就是往通用走,没有区别的,都是为 physical AI。 5|Orin / Thor 的看法 Orin 出来快 4 年了,到今天也没有榨干,还可以深挖。 其次芯片是比较明确的,成本下降也是明确的,你相信黄氏定律就行。现在 Orin 的平替也有很多,然后 Thor 也是确定的,这个芯片其实在未来的三年是确定的。 现在过了预埋硬件喊口号的时候,反而是算法决定了你的硬件架构。 比如打一个普通游戏,你装个 2080 跟 4080 是没有区别。但是你今天的时候打黑悟空,你可能 2080 跟 4090 区别就很大,这个是你的架构决定,现在预埋 Thor 也不一定能够全国都可开。 6|淘汰赛 今天很多大牛都是物理数学背景,基本上没有纯编程的。编程跟 AI 这是两个概念,曾经可能大家觉得在编程比赛拿金牌的是 AI 高手,其实现在都知道这是完全不同。 现在整个技术架构、所有的人才背景其实都要经过一大轮的洗盘,而且市场也没有那么多人才,也不一定会给你这个时间。 未来 2-3 年是淘汰赛,可以理解这一个万米跑比赛,赛道是 400 米一圈,别人只要超过你一圈,你就会被甩开了,就被淘汰。 7|Robotaxi Robotaxi 是一个 business model ,L4 是个技术路线,让自动驾驶承担网约车的工作,这商业模式非常健康。L4不等于不需要 Robotaxi。Robotaxi 没有理由不做。

    飞机先生
    • {{default_recommend=='new'?'按最新':'按回复'}}
    • 热门
    • 精华
    • 闲置
    更新 {{manage.unread}} 条内容

    双擎会铁皮
    2024-10-01

    一大早就得顶着朝阳开车出门,途径很多日常路段,感觉有一种东西逐步逝去而引不起注意,那就是无数曾经的“智驾体验点”…… 以前经过这些路段,提前就会特别注意,甚至都准备好拍摄机位录下来,然后剪个视频分享一下感受。随着智驾系统能力迭代,特别是最近提升得越来越快,很多以往觉得有点考验的路段已经变得平庸而不值一提。今天我开智驾经过了几段以往关注的路,甚至有点瞌睡感了。而现在想展示智驾新的能力上限又得去寻找更有难度的场景,以往曾经的“专属体验点”就这样无声无息地“逝去”。

    小鹏G9 小鹏G6 小鹏X9 我的小鹏XNGP体验 我的XNGP用车日常 带电出行的假日生活

    HenryLEE
    2024-09-30

    我想提一个问题,就是目前的端到端自动驾驶技术能不能记忆驾驶路线,比如说我有一条路是端到端可以开着走的,但是不顺畅,能不能越开它越顺畅,然后我自己开一下,端到端自动驾驶走一段,让车辆记得这个路线,然后进行不断的优化呢?

    我记得此前有一段时间,各家自己都搞了一个叫记忆领航的功能,就是针对常用路线做智能辅助驾驶,然后现在全部又转到这个端到端的智能驾驶,每一次升级之后我能够明显感觉到这个车子它有一些进化。但是还是不够成熟和完善。

    我在网上搜索了一下,但是还是存在困惑。

    如果这两个技术可以结合起来,那不是更好?

    @贺磊 @飞机先生

    双擎会铁皮
    2024-09-29

    【E2E 奏起平淡的晨曲|XOS 端到端共创版 1.0 上班体验】发一段平淡的行车视频,这段视频的看点是啥?看点就是平淡,这是今天早上我开小鹏 X9 上班从小区车库门口一直到主干道的录像,这也是第一次用 XOS 端到端共创版上班。平时这段路还会有一些“值得关注”的地方,例如从 55 秒开始那个有路障并且标线混乱的拐弯,但今天哪怕刚好遇到有车掉头以及行人在旁边擦身而过也都平淡如水,完全无感通过。这个版本的纵向控制真的提升很大,期间遇到红绿灯刚好转灯的时候停下来也非常顺滑,大家也可以留意一下屏幕上车速的数字变化非常平顺,停车也不点头。

    智驾平淡无感才是最终极的状态,让你用得懒洋洋的,无需过于关注它的驾驶行为,越无波澜越是优秀。横路汇出路口的时候它还是有点迟疑,我踩了两脚电门催促了一下,除此之外,从小区出来到主干道整个过程,我毫无参与感,这个非常好!

    小鹏X9 小鹏G6 小鹏G9 小鹏端到端共创版体验 我的XNGP用车日常 我的小鹏XNGP体验

    HiEV
    2024-09-27

    迈向千T算力时代,最强智驾芯片Thor量产前夜

    采访、撰稿 | 德新 Dude编辑 | 德新2022年秋天的GTC大会上,NVIDIA发布了新一代车载计算平台「DRIVE Thor」,最高可提供每秒2000万 查看全文

    智能驾驶这件事

    双擎会铁皮
    2024-09-27

    昨天专门去闯晚高峰,终于拍下晚霞中的 SR 视频,我先截几张视频截图 ...... 看着颇有几分浪漫的感觉!然后一位朋友说:理工男的浪漫总是藏在一些意想不到的地方!!
    哈哈,突然觉得有条件去使用 SR 视觉来营销智能驾驶,估计窝鹏真的是独此一家吧??可能有些人还是不太理解,会拿着一些带地图渲染合成的画面,周围楼房立交都有 3D 效果的那种跟这种纯感知 SR 相比,这当然是有区别的。

    麻了麻了感觉近日都变成跑去参加 XOS 5.3 SR 摄影大赛了,有点“不务正业”,你看看头部高级大 V 们都在天天秀端到端,等我再去看看推送了没 ....

    小鹏X9 小鹏G6 小鹏G9 小鹏天玑XOS 5.3.0 我的XNGP用车日常 我的小鹏XNGP体验

    置顶 {{item.data.title}}

    来自#{{item.data.theme_info.title}}{{item.data.theme_info.number?`本周共 ${item.data.theme_info.number} 人参与,话题内容折叠显示`:'话题内容折叠显示'}}

    {{item.data.theme_info.number?'查看全部':'立即参与'}}

    {{item.data.author.username}}{{item.data.author.user_honour}} 置顶
    {{item.data.create_time}}{{item.status==1 ? ' · 待审核':''}}{{item.data.author.car_model_name?` · ${item.data.author.car_model_name}`:''}}

    首页推荐 社区推荐 置顶推荐 精华
    NO.{{i+1}}热度 {{item.hot_total}}
    收录于周榜 TOP {{item.week_rank}} 收录于日榜 TOP {{item.day_rank}}
    视频文章

    {{item.data.title}}

    {{item.data.title}}

    {{item.data.title}}

    {{item.data.duration}}

    +{{item.data.imgs_url.length - 9}}

    ¥{{item.data.price}} ¥{{item.data.original_price}} 包邮 分类/{{item.data.garage_category_name}} 状态/{{item.data.garage_condition_name}}

    +{{item.data.imgs_url.length - 9}}

    {{item.data.series.name}} {{item.data.model ? item.data.model.name : ''}}

    个人评分{{item.data.contents.fraction}}

    点评:

    {{item.data.title}}

    {{related.theme.title}}

    {{item.data.title}} {{item.data.membernum}}人参与讨论

    参与讨论

    近期热议