BotQ 说明了什么:人形机器人量产不是把样机复制一万遍

BotQ 最值得看的,不是 Figure 宣布自己能造多少台人形机器人,而是它把“人形机器人量产”这件事从样机复制,压回了制造系统问题。

如果只看数字,BotQ 很容易被读成一条公司新闻:第一代产线年产能 12,000 台,Figure 03 产线从每天 1 台拉到每小时 1 台,120 天内吞吐提升 24 倍,已经交付 350 多台 Figure 03。这些数字当然重要,但对做机器人系统的人来说,真正有用的问题是另一个:

人形机器人量产不是把一个能跑的 demo 复制一万遍,而是把架构、供应链、测试、返修、软件版本和现场数据闭环一起做成可重复系统。

这篇不把 BotQ 写成“Figure 又领先了”的热闹稿。我们只借它拆一件事:一台 humanoid 从 prototype 走向 fleet,制造侧到底先卡在哪里。

先给结论:BotQ 说明 Figure 在换战场

Figure 02 更像一台用来证明工业工位部署的机器人。BMW 那轮部署里,Figure 披露过 10 小时班次、90,000+ 零件上料、1,250+ 小时运行、参与 30,000+ 台 X3 生产,并把 cycle time、placement accuracy、intervention 作为关键 KPI。

Figure 03 的意义不只是下一代外形或家庭场景。它更像 Figure 把机器人重新按量产、运维和 fleet data 目标设计了一遍。BotQ 这条线正好暴露了这个转向:Figure 不再只证明“机器人能不能干活”,而是在证明“这类机器人能不能被稳定制造、测试、维修、升级和持续运行”。

所以看 BotQ,第一层不要问“它是不是已经能替代工人”。更好的问题是:

  • Figure 有没有把 prototype 里不适合量产的结构改掉?
  • 关键件是不是能批量一致地装出来,而不是每台靠工程师手调?
  • 每台机器人出厂前有没有足够硬的 EOL 和 burn-in 测试?
  • 现场故障能不能回流到设计、供应链、软件和服务系统?
  • 产线吞吐提升后,质量、返修和 fleet 运维有没有同步跟上?

现场 first-look 表:看 BotQ,不要先看年产能数字

先看到什么信号先判哪一层第一组证据今天先别下什么结论
年产能、每小时一台、交付数量很亮眼产线吞吐 / takt timecycle time、工站瓶颈、在制品排队、返工比例、良率是否随吞吐下降不要把产能公告直接等同于可稳定交付 fleet
从 CNC 原型件切到注塑、压铸、冲压、MIM架构可制造性 / DFM零件数、装配步骤、模具投入、关键公差、替代工艺后的可靠性数据不要只说“降本”,也不要忽略前期模具和验证成本
供应链能覆盖电机、执行器、电池、传感器、电子件关键件供应链 / 一致性来料检验标准、供应商良率、批次追溯、关键 SKU 的替代策略不要把“能买到零件”当成“能批量造机器人”
EOL、burn-in、功能测试数字很多出厂测试 / 早期失效拦截first-pass yield、EOL 覆盖项、热稳态测试、multi-limb stress、失败根因闭环不要只看测试数量,要看有没有拦住真实现场失效
机器人开始进入客户现场、家庭、内部数据采集和研发 fleet服务闭环 / fleet 运维OTA、fleet management、field service、召回流程、故障到设计修改的回流速度不要把“部署更多台”直接当成能力成熟,先看服务成本有没有被压住

这张表的用法很简单:以后看到 Figure 或其它 humanoid 公司报产能,不要第一反应争“是不是吹”。先把它拆成吞吐、架构、供应链、测试和运维五层。任何一层不成立,规模都会把问题放大。

BotQ 的第一层变化:Figure 03 是为制造重做的,不只是为家庭重做

Figure 在 BotQ 页面里讲了一个很关键的点:Figure 02 使用了大量高复杂度、高公差、慢速 CNC 加工流程,这对原型阶段有价值,但不适合高产量。到了 Figure 03,Figure 改用注塑、压铸、金属注射成型、冲压等更适合规模生产的工艺,并强调某些过去需要一周以上 CNC 加工的零件,现在可以通过模具在 20 秒内制造。

这不是单纯“工艺更先进”。它背后的工程判断是:量产不是等样机定型后再交给制造团队,而要在架构阶段就减少零件数、减少装配动作、减少慢工艺、减少只能靠专家手感装出来的接口。

对小团队也一样。第一版 humanoid 原型可以接受机加工、3D 打印、临时支架、手工线束和工程师现场补救。但只要你想做 5 台、20 台、50 台,问题就变了:

  • 零件数越多,装配时间和装配差异越难控。
  • 工艺越依赖慢加工,迭代和备件成本越难控。
  • 线束、连接器、热路径和维修入口越临时,后续返修越痛。
  • 每台都要单独调参,说明设计还没有进入可复制状态。

所以 BotQ 给读者的第一条启发不是“你也要建工厂”,而是:从第一台样机开始,就要记录哪些结构未来无法复制。

第二层变化:供应链不是采购清单,是质量边界

Figure 说 humanoid 没有成熟供应链,所以他们几乎从零设计执行器、电机、传感器、电池包和电子系统,并把执行器、手、电池和总装等核心技术更多放在内部。它还提到机器人有三十多类独特 commodity,包含电机绕组、柔性 OLED、精密光学等不同工艺。

这段对做机器人系统的人很现实。人形机器人不像普通软件产品,也不像单一机械设备。它的供应链问题不是“买不到某个件”这么简单,而是:

  • 同一执行器批次之间的摩擦、温升、噪声、回零偏差是否一致;
  • 电池包、BMS、母线、线束和连接器在高动态动作下是否稳定;
  • 传感器、相机、触觉和近场感知组件是否能跨批次标定;
  • 手部、腕部、 forearm 这类高密度子系统是否能维修;
  • 替代件是否会悄悄改变热、EMI、安装空间或软件参数。

Figure 02 在 BMW 的复盘里提过 forearm 是关键硬件失效点之一,Figure 03 重新设计 wrist electronics,取消分配板和动态线缆,让每个 wrist motor controller 直接和主计算机通信。这个例子很有代表性:现场可靠性问题最后经常不是“控制算法再聪明一点”能解决,而是要回到布线、热、连接器、PCB 分布和维护路径。

第三层变化:MES / PLM / ERP / WMS 不是大厂仪式感

BotQ 页面里最容易被忽略的一段,是 Figure 提到他们为制造建立 MES、PLM、ERP、WMS,尤其是自研 MES。Figure 的说法是,MES 会把生产过程整合到实时数字生态里,跟踪零件、装配效率、质量控制、IoT 设备、genealogy 和每个组件的测试数据。

这听起来像工厂管理软件,但对 humanoid 很关键。因为机器人不是一个单件产品,它是大量机械、电气、传感、执行器、软件版本和校准状态叠在一起的系统。如果没有 genealogy,一台机器人现场出问题时,团队很难回答:

  • 这台机器用了哪一批执行器?
  • 哪个工站装过、谁返修过、换过什么件?
  • EOL 哪些项目通过,哪些项目边缘通过?
  • 软件版本、参数版本、标定版本和硬件版本是否匹配?
  • 同类故障是不是集中在某个供应商、某个批次、某个工艺改动之后?

没有这套链路,量产后的故障复盘会退化成“这台不稳定”“那批好像有问题”“先换一版软件试试”。这就是 humanoid 最危险的地方:系统太复杂,任何没有证据链的经验判断都会把问题推远。

第四层变化:EOL 和 burn-in 要证明“早期故障被拦住了”

Figure 在 2026 年 4 月的产能爬坡文章里披露了更具体的测试信号:超过 50 个 in-process inspection points、EOL first-pass yield 超过 80% 且每周改善、电池线 99.3% first-pass yield、500+ 电池包、9,000+ 执行器、10+ actuator SKU、每台机器人出厂前超过 80 项功能验证测试,还包括 multi-limb stress 和 burn-in,比如深蹲、肩推、慢跑等全身动作,循环次数达到 thousands,用来逼出早期失效。

这些数字不能直接证明“机器人已经成熟”,但它们说明 Figure 在尝试把质量问题前移到产线,而不是等客户现场爆出来。

测试层真正要拦什么可观察证据不能替代什么
来料检验供应商批次差异、坏件进入总装、关键件规格漂移incoming inspection、批次良率、供应商质量趋势不能替代整机级热、电、力学验证
过程检验装配错误、扭矩 / 间隙 / 线束路径 / 标定漏项工站记录、扫码追溯、in-process inspection points不能替代长时间真实任务运行
EOL 功能测试出厂前明显功能缺陷、传感器 / 执行器 / 通信异常功能验证项、first-pass yield、失败项分布不能证明现场长尾已经解决
burn-in / stress早期失效、热问题、运动链薄弱点、保护触发边界循环次数、温度、电流、fault code、失效时间线不能替代客户现场的任务边界验证
fleet 运行回流低频边缘故障、服务成本、OTA 风险、召回边界field service、fleet management、OTA、召回和维修记录不能替代发布前质量门槛;它是反馈,不是免检

这张表也适合小团队:就算你没有 BotQ,也应该有自己的 mini-EOL。哪怕只有 3 台样机,也要知道每台出厂前测了什么、没测什么、哪些测试只是“看起来会动”,哪些测试真的拦住了现场失败。

第五层变化:fleet 不是展示规模,而是故障学习机器

Figure 在产能爬坡文章里把 production scale 和 fleet operations 连在一起:更多机器人会进入内部研发、数据采集、家务任务、商业场景;更大 fleet 产生更多 Helix 数据;更多真实运行帮助它们发现小规模时看不见的失败,并建立 diagnostics、fallback ladders、long-tail edge-case 处理、field service、fleet management 和 OTA。

这里要保持两层判断。

第一层,Figure 的方向是对的。humanoid 能力不是只靠单台 demo 训练出来的,必须靠 fleet hours 暴露低频故障、收集失败样本、压服务流程、回流硬件和软件。

第二层,fleet 本身也会放大成本。机器人越多,版本管理、召回、现场服务、备件、数据标注、隐私、安全、远程接管和 OTA 风险都会一起增加。一个很大的 fleet 如果没有服务闭环,可能不是资产,而是持续制造噪声的复杂系统。

所以看 Figure 的 production ramp,最值得跟踪的不是下一个数字,而是这些问题:

  • EOL first-pass yield 是否继续上升,还是靠返工把数字堆起来;
  • field service 是否能把根因定位从“几天”压到“分钟级”;
  • fallback ladders 是否真的减少人工接管,而不是掩盖失败;
  • OTA 是否有回滚、灰度、版本兼容和现场责任边界;
  • 家庭和商业场景的数据是否能分层治理,而不是全部倒进一个大池子。

如果你自己在做 humanoid,BotQ 能直接借鉴什么

小团队不需要照搬 BotQ,也照搬不了。真正能借鉴的是制造思维提前进入开发流程。

第一,给每台样机建立 genealogy。 不要只记录“第 3 台”。要记录执行器批次、电池包、主控、线束版本、固件、标定文件、返修历史和每轮测试结果。没有 genealogy,就没有真正的复盘。

第二,把 EOL 当作开发任务,不是交付尾声。 第一版可以很简陋,但必须固定下来:通电、关节零位、通信、传感器、急停、母线、电池、热、基本动作、日志记录、保护触发。每次新增能力,都要问是否需要新增 EOL 项。

第三,先降低装配差异,再谈算法泛化。 如果 3 台机器人同一参数表现不同,先别急着扩大训练。先看机械间隙、摩擦、线束拉扯、标定偏差、执行器热状态和传感器安装角度。

第四,别把产能当成熟度。 真正成熟的信号不是“能造更多”,而是造得更多之后,故障没有指数级变难定位,返修没有吞掉研发时间,软件版本没有把现场搞乱。

第五,提前设计服务入口。 人形机器人不是坏了就换新的消费电子。它会在现场摔、卡、过热、误抓、掉线、触发保护。服务入口、远程诊断、备件、日志回放和安全接管必须是系统的一部分。

这篇的边界:BotQ 还没有证明什么

BotQ 是一个重要信号,但它不等于 Figure 已经完成了人形机器人商业化闭环。至少还有几件事不能被产能数字直接证明:

  • 每小时一台不等于每台都能在真实家庭或客户现场低成本运行。
  • first-pass yield 改善不等于长期可靠性已经成熟。
  • 更多 fleet data 不等于 Helix 自动获得泛化能力。
  • 机器人参与造机器人,不等于产线已经高度自治。
  • Figure 03 的生产设计,不等于家庭场景的安全、隐私和失败恢复已经过线。

但 BotQ 仍然值得写进 Figure 专题,因为它把问题从“机器人能不能演示”推进到了“机器人能不能被制造成 fleet”。这一步对任何做人形机器人的团队都绕不过去。

站内继续读

来源 / 继续核查

Share this article

Send it to someone following humanoid robotics, embodied AI, or deployment trends.