第386章 马斯克内心OS:已老实(5 / 8)

投票推荐 加入书签 留言反馈

  在人工智能领域,多数据不等于好数据。
  我们当然可以往模型里灌更多输入,但信息要有信息熵,要有对理解世界有用的信号。
  激光雷达在高速公路上,或者高度规则化的场景下可能有用,但在日常城市驾驶,它反而会让系统依赖一个捷径,不去构建真正的世界模型。
  你提到大语言模型,对,规模很重要。
  但语言模型的前提是人类语言本身就包含了整个世界的复杂性,视觉输入也一样,视觉包含了驾驶所需的全部复杂性。
  如果我们加进激光雷达,神经网络可能会依赖‘简化的答案’,而不去学习真正困难但关键的部分。
  所以,这不是偷懒。
  恰恰相反,纯视觉是更难的路线,需要更强的网络,更大的算力,更聪明的训练,激光雷达是捷径,但走捷径你到不了终点。”
  马斯克摊手笑道:“如果你愿意在你的车顶上装一堆传感器,造一辆‘科研用的高价玩具’,当然可以。
  但如果你想让全世界几千万辆车都能自动驾驶,就必须走视觉路线,规模化的未来只有一条路。”
  林燃说:“多模态多模态,如果连视觉和传感器的数据都没有办法融入到同一个世界里,那又谈什么多模态。
  如果我们真的追求的是简单的,单一的,人是怎么理解世界,人工智能或者机器人就应该要怎么理解世界,这是一种傲慢,人类也不应该有汽车、有飞机、有火车,人类就应该只依赖双腿,不断磨炼自己的双腿。
  现在的大模型,也不应该用各种结构化、非结构化的数据进行训练,它不但能对话还能输出画面、动画。
  从数据到图像再到动画,llm的大模型输出的越来越多元,反而自动驾驶还抱着原教旨主义的人工智能,认为就应该只有视觉。
  现在如果我们有一个框架,能够把激光雷达的数据融入到整个模型里,真正意义上实现广义的自动驾驶,埃隆,你会认为你是错的吗?”林燃问道。
  马斯克对于前面都已经习惯了,这些反驳的观点,他在后台、在推特上,甚至在特斯拉内部都能时常看到。
  特斯拉打死不用激光雷达真的纯粹是第一性原理吗?又或者是网友们说的那样节约成本吗?
  其实都不是,最开始是因为成本,最开始激光雷达贼贵,贵到离谱,所以你不可能光是一颗激光雷达就要大几万美元的成本。
  所以最开始特斯拉就制定了纯视觉的自动驾驶方案。
  后来你已经在这条技术路线里下了血本,庞大的沉没成本让特斯拉没有办法,再调头去搞什么摄像头和多传感器融合的技术路线,谁知道华国这么快就能把激光雷达的价格打下来啊。
  怎么也想不到,这才三年过去,被你们打成两百美元不到的真·白菜价。
  大家都是真金白银下去,华为也没有办法做纯视觉方案一个道理。
  沉没成本不是那么好放弃的。
  林燃接着说道:“正好,择日不如撞日,待会深红科技和华为联手打造的,搭载全球首个准l5级别的自动驾驶技术的车就会停在楼下,邀请你去尝试一下,看你能否改变态度。”
  马斯克喃喃道:“l5?”
  自动驾驶分成l1到l5,l3是指自动系统能够完成部分驾驶任务,司机能够把任务交给系统,但要做好随时接管的准备。
  华国主流基本都停留在这个阶段,只是说因为权责划分,大家只敢在宣传的时候说我这是l2.99999无限9循环。
  l4是指特定条件下的纯自动驾驶,萝卜快跑、加州的waymo就属于这个级别,在特定区域内的全自动驾驶。
  l5则是指没有条件限制的自动驾驶,系统在所有条件下完成所有驾驶任务。
  林燃点头:“当然。” ↑返回顶部↑

章节目录