BotQ 最值得看的,不是 Figure 宣布自己能造多少台人形机器人,而是它把“人形机器人量产”这件事从样机复制,压回了制造系统问题。
如果只看数字,BotQ 很容易被读成一条公司新闻:第一代产线年产能 12,000 台,Figure 03 产线从每天 1 台拉到每小时 1 台,120 天内吞吐提升 24 倍,已经交付 350 多台 Figure 03。这些数字当然重要,但对做机器人系统的人来说,真正有用的问题是另一个:
人形机器人量产不是把一个能跑的 demo 复制一万遍,而是把架构、供应链、测试、返修、软件版本和现场数据闭环一起做成可重复系统。
这篇不把 BotQ 写成“Figure 又领先了”的热闹稿。我们只借它拆一件事:一台 humanoid 从 prototype 走向 fleet,制造侧到底先卡在哪里。
先给结论:BotQ 说明 Figure 在换战场
Figure 02 更像一台用来证明工业工位部署的机器人。BMW 那轮部署里,Figure 披露过 10 小时班次、90,000+ 零件上料、1,250+ 小时运行、参与 30,000+ 台 X3 生产,并把 cycle time、placement accuracy、intervention 作为关键 KPI。
Figure 03 的意义不只是下一代外形或家庭场景。它更像 Figure 把机器人重新按量产、运维和 fleet data 目标设计了一遍。BotQ 这条线正好暴露了这个转向:Figure 不再只证明“机器人能不能干活”,而是在证明“这类机器人能不能被稳定制造、测试、维修、升级和持续运行”。
所以看 BotQ,第一层不要问“它是不是已经能替代工人”。更好的问题是:
- Figure 有没有把 prototype 里不适合量产的结构改掉?
- 关键件是不是能批量一致地装出来,而不是每台靠工程师手调?
- 每台机器人出厂前有没有足够硬的 EOL 和 burn-in 测试?
- 现场故障能不能回流到设计、供应链、软件和服务系统?
- 产线吞吐提升后,质量、返修和 fleet 运维有没有同步跟上?
现场 first-look 表:看 BotQ,不要先看年产能数字
| 先看到什么信号 | 先判哪一层 | 第一组证据 | 今天先别下什么结论 |
|---|---|---|---|
| 年产能、每小时一台、交付数量很亮眼 | 产线吞吐 / takt time | cycle time、工站瓶颈、在制品排队、返工比例、良率是否随吞吐下降 | 不要把产能公告直接等同于可稳定交付 fleet |
| 从 CNC 原型件切到注塑、压铸、冲压、MIM | 架构可制造性 / DFM | 零件数、装配步骤、模具投入、关键公差、替代工艺后的可靠性数据 | 不要只说“降本”,也不要忽略前期模具和验证成本 |
| 供应链能覆盖电机、执行器、电池、传感器、电子件 | 关键件供应链 / 一致性 | 来料检验标准、供应商良率、批次追溯、关键 SKU 的替代策略 | 不要把“能买到零件”当成“能批量造机器人” |
| EOL、burn-in、功能测试数字很多 | 出厂测试 / 早期失效拦截 | first-pass yield、EOL 覆盖项、热稳态测试、multi-limb stress、失败根因闭环 | 不要只看测试数量,要看有没有拦住真实现场失效 |
| 机器人开始进入客户现场、家庭、内部数据采集和研发 fleet | 服务闭环 / fleet 运维 | OTA、fleet management、field service、召回流程、故障到设计修改的回流速度 | 不要把“部署更多台”直接当成能力成熟,先看服务成本有没有被压住 |
这张表的用法很简单:以后看到 Figure 或其它 humanoid 公司报产能,不要第一反应争“是不是吹”。先把它拆成吞吐、架构、供应链、测试和运维五层。任何一层不成立,规模都会把问题放大。
BotQ 的第一层变化:Figure 03 是为制造重做的,不只是为家庭重做
Figure 在 BotQ 页面里讲了一个很关键的点:Figure 02 使用了大量高复杂度、高公差、慢速 CNC 加工流程,这对原型阶段有价值,但不适合高产量。到了 Figure 03,Figure 改用注塑、压铸、金属注射成型、冲压等更适合规模生产的工艺,并强调某些过去需要一周以上 CNC 加工的零件,现在可以通过模具在 20 秒内制造。
这不是单纯“工艺更先进”。它背后的工程判断是:量产不是等样机定型后再交给制造团队,而要在架构阶段就减少零件数、减少装配动作、减少慢工艺、减少只能靠专家手感装出来的接口。
对小团队也一样。第一版 humanoid 原型可以接受机加工、3D 打印、临时支架、手工线束和工程师现场补救。但只要你想做 5 台、20 台、50 台,问题就变了:
- 零件数越多,装配时间和装配差异越难控。
- 工艺越依赖慢加工,迭代和备件成本越难控。
- 线束、连接器、热路径和维修入口越临时,后续返修越痛。
- 每台都要单独调参,说明设计还没有进入可复制状态。
所以 BotQ 给读者的第一条启发不是“你也要建工厂”,而是:从第一台样机开始,就要记录哪些结构未来无法复制。
第二层变化:供应链不是采购清单,是质量边界
Figure 说 humanoid 没有成熟供应链,所以他们几乎从零设计执行器、电机、传感器、电池包和电子系统,并把执行器、手、电池和总装等核心技术更多放在内部。它还提到机器人有三十多类独特 commodity,包含电机绕组、柔性 OLED、精密光学等不同工艺。
这段对做机器人系统的人很现实。人形机器人不像普通软件产品,也不像单一机械设备。它的供应链问题不是“买不到某个件”这么简单,而是:
- 同一执行器批次之间的摩擦、温升、噪声、回零偏差是否一致;
- 电池包、BMS、母线、线束和连接器在高动态动作下是否稳定;
- 传感器、相机、触觉和近场感知组件是否能跨批次标定;
- 手部、腕部、 forearm 这类高密度子系统是否能维修;
- 替代件是否会悄悄改变热、EMI、安装空间或软件参数。
Figure 02 在 BMW 的复盘里提过 forearm 是关键硬件失效点之一,Figure 03 重新设计 wrist electronics,取消分配板和动态线缆,让每个 wrist motor controller 直接和主计算机通信。这个例子很有代表性:现场可靠性问题最后经常不是“控制算法再聪明一点”能解决,而是要回到布线、热、连接器、PCB 分布和维护路径。
第三层变化:MES / PLM / ERP / WMS 不是大厂仪式感
BotQ 页面里最容易被忽略的一段,是 Figure 提到他们为制造建立 MES、PLM、ERP、WMS,尤其是自研 MES。Figure 的说法是,MES 会把生产过程整合到实时数字生态里,跟踪零件、装配效率、质量控制、IoT 设备、genealogy 和每个组件的测试数据。
这听起来像工厂管理软件,但对 humanoid 很关键。因为机器人不是一个单件产品,它是大量机械、电气、传感、执行器、软件版本和校准状态叠在一起的系统。如果没有 genealogy,一台机器人现场出问题时,团队很难回答:
- 这台机器用了哪一批执行器?
- 哪个工站装过、谁返修过、换过什么件?
- EOL 哪些项目通过,哪些项目边缘通过?
- 软件版本、参数版本、标定版本和硬件版本是否匹配?
- 同类故障是不是集中在某个供应商、某个批次、某个工艺改动之后?
没有这套链路,量产后的故障复盘会退化成“这台不稳定”“那批好像有问题”“先换一版软件试试”。这就是 humanoid 最危险的地方:系统太复杂,任何没有证据链的经验判断都会把问题推远。
第四层变化:EOL 和 burn-in 要证明“早期故障被拦住了”
Figure 在 2026 年 4 月的产能爬坡文章里披露了更具体的测试信号:超过 50 个 in-process inspection points、EOL first-pass yield 超过 80% 且每周改善、电池线 99.3% first-pass yield、500+ 电池包、9,000+ 执行器、10+ actuator SKU、每台机器人出厂前超过 80 项功能验证测试,还包括 multi-limb stress 和 burn-in,比如深蹲、肩推、慢跑等全身动作,循环次数达到 thousands,用来逼出早期失效。
这些数字不能直接证明“机器人已经成熟”,但它们说明 Figure 在尝试把质量问题前移到产线,而不是等客户现场爆出来。
| 测试层 | 真正要拦什么 | 可观察证据 | 不能替代什么 |
|---|---|---|---|
| 来料检验 | 供应商批次差异、坏件进入总装、关键件规格漂移 | incoming inspection、批次良率、供应商质量趋势 | 不能替代整机级热、电、力学验证 |
| 过程检验 | 装配错误、扭矩 / 间隙 / 线束路径 / 标定漏项 | 工站记录、扫码追溯、in-process inspection points | 不能替代长时间真实任务运行 |
| EOL 功能测试 | 出厂前明显功能缺陷、传感器 / 执行器 / 通信异常 | 功能验证项、first-pass yield、失败项分布 | 不能证明现场长尾已经解决 |
| burn-in / stress | 早期失效、热问题、运动链薄弱点、保护触发边界 | 循环次数、温度、电流、fault code、失效时间线 | 不能替代客户现场的任务边界验证 |
| fleet 运行回流 | 低频边缘故障、服务成本、OTA 风险、召回边界 | field service、fleet management、OTA、召回和维修记录 | 不能替代发布前质量门槛;它是反馈,不是免检 |
这张表也适合小团队:就算你没有 BotQ,也应该有自己的 mini-EOL。哪怕只有 3 台样机,也要知道每台出厂前测了什么、没测什么、哪些测试只是“看起来会动”,哪些测试真的拦住了现场失败。
第五层变化:fleet 不是展示规模,而是故障学习机器
Figure 在产能爬坡文章里把 production scale 和 fleet operations 连在一起:更多机器人会进入内部研发、数据采集、家务任务、商业场景;更大 fleet 产生更多 Helix 数据;更多真实运行帮助它们发现小规模时看不见的失败,并建立 diagnostics、fallback ladders、long-tail edge-case 处理、field service、fleet management 和 OTA。
这里要保持两层判断。
第一层,Figure 的方向是对的。humanoid 能力不是只靠单台 demo 训练出来的,必须靠 fleet hours 暴露低频故障、收集失败样本、压服务流程、回流硬件和软件。
第二层,fleet 本身也会放大成本。机器人越多,版本管理、召回、现场服务、备件、数据标注、隐私、安全、远程接管和 OTA 风险都会一起增加。一个很大的 fleet 如果没有服务闭环,可能不是资产,而是持续制造噪声的复杂系统。
所以看 Figure 的 production ramp,最值得跟踪的不是下一个数字,而是这些问题:
- EOL first-pass yield 是否继续上升,还是靠返工把数字堆起来;
- field service 是否能把根因定位从“几天”压到“分钟级”;
- fallback ladders 是否真的减少人工接管,而不是掩盖失败;
- OTA 是否有回滚、灰度、版本兼容和现场责任边界;
- 家庭和商业场景的数据是否能分层治理,而不是全部倒进一个大池子。
如果你自己在做 humanoid,BotQ 能直接借鉴什么
小团队不需要照搬 BotQ,也照搬不了。真正能借鉴的是制造思维提前进入开发流程。
第一,给每台样机建立 genealogy。 不要只记录“第 3 台”。要记录执行器批次、电池包、主控、线束版本、固件、标定文件、返修历史和每轮测试结果。没有 genealogy,就没有真正的复盘。
第二,把 EOL 当作开发任务,不是交付尾声。 第一版可以很简陋,但必须固定下来:通电、关节零位、通信、传感器、急停、母线、电池、热、基本动作、日志记录、保护触发。每次新增能力,都要问是否需要新增 EOL 项。
第三,先降低装配差异,再谈算法泛化。 如果 3 台机器人同一参数表现不同,先别急着扩大训练。先看机械间隙、摩擦、线束拉扯、标定偏差、执行器热状态和传感器安装角度。
第四,别把产能当成熟度。 真正成熟的信号不是“能造更多”,而是造得更多之后,故障没有指数级变难定位,返修没有吞掉研发时间,软件版本没有把现场搞乱。
第五,提前设计服务入口。 人形机器人不是坏了就换新的消费电子。它会在现场摔、卡、过热、误抓、掉线、触发保护。服务入口、远程诊断、备件、日志回放和安全接管必须是系统的一部分。
这篇的边界:BotQ 还没有证明什么
BotQ 是一个重要信号,但它不等于 Figure 已经完成了人形机器人商业化闭环。至少还有几件事不能被产能数字直接证明:
- 每小时一台不等于每台都能在真实家庭或客户现场低成本运行。
- first-pass yield 改善不等于长期可靠性已经成熟。
- 更多 fleet data 不等于 Helix 自动获得泛化能力。
- 机器人参与造机器人,不等于产线已经高度自治。
- Figure 03 的生产设计,不等于家庭场景的安全、隐私和失败恢复已经过线。
但 BotQ 仍然值得写进 Figure 专题,因为它把问题从“机器人能不能演示”推进到了“机器人能不能被制造成 fleet”。这一步对任何做人形机器人的团队都绕不过去。
站内继续读
- Figure AI 是什么:从 Figure 01、Figure 02 到 Figure 03,看一家人形机器人公司的系统路线
- Figure 01、Figure 02、Figure 03 有什么不同
- Figure AI 在 BMW 和物流场景里到底验证了什么
- 人形机器人小批量制造准备怎么做
- 人形机器人测试工装怎么搭