人形机器人小批量制造准备怎么做：从 BOM 冻结、执行器一致性到 EOL 测试的实作指南

这篇文章要解决的问题是：当你的人形机器人已经不只是“能动一次”的 demo，而是准备进入 5 台、20 台、50 台的小批量样机阶段时，硬件团队到底该先补哪几件事，才能避免后面被一致性、热衰减、供电波动、装配返工和维护成本拖死。它适合已经做出原型、正准备做第二版或小批量试制的团队。最关键的工程判断是：制造准备的核心，不是先追产量，而是先把 BOM、执行器参数、供电保护、EOL 测试和可维护性做成可重复的系统。

这篇适合谁

已经有 humanoid 原型，准备做第二版整机或小批量试制的团队
正在为执行器、控制器、电池、线束和结构件建立统一版本的工程负责人
发现“每台都能装出来，但每台表现都不一样”的项目
希望把研发样机推进到可交付试点，而不是继续停留在展会 demo 的团队

先纠正几个很常见的误区

误区一：能装配出来，就算具备制造能力。 真正卡人的不是能不能装，而是装完以后参数是不是一致、温升是不是可控、返修路径是不是清楚。
误区二：先冲产量，测试和标定以后补。 如果 EOL 测试和校准流程不先定，产量越高，返工和现场故障越难收拾。
误区三：BOM 只是采购清单。 对 humanoid 来说，BOM 还是接口合同、热设计假设、线束路径和维护策略的载体。
误区四：执行器参数抄 datasheet 就够了。 真机里真正影响控制器参数和热边界的，往往是绕组、阻抗、散热条件和装配偏差。

关键实现判断
如果一台人形机器人还不能做到“同一份 BOM、同一套装配步骤、同一套校准脚本、同一套 EOL 测试，就能稳定得到接近一致的行为表现”，那它还处在原型工程阶段，不算进入真正可放大的制造准备阶段。

第一步：先冻结的不是整机方案，而是版本边界

进入小批量前，最先该冻结的是版本边界，而不是把所有设计都锁死。你至少要明确四层版本：

结构版本：关节壳体、减速器、安装孔位、外壳、线束走线点是否冻结。
电气版本：电池、电源母线、保险、控制板、连接器、传感器线束是否冻结。
固件版本：执行器控制参数、热保护阈值、编码器方向、零位流程是否冻结。
测试版本：EOL 动作脚本、温升测试、供电跌落保护、日志字段是否冻结。

如果这四层还是随手改，你做的不是试制，而是在产线上继续研发。

Berkeley Humanoid Lite 这类开源项目把 BOM、CAD、打印件和 release 变更记录分开维护，这种做法很值得借鉴。因为它逼着团队把“零件是什么”“怎么装”“这版改了什么”分开说清楚，而不是把所有变化塞进一份口头经验里。

第二步：先把执行器一致性做出来，再谈整机一致性

人形机器人最先失控的常常不是整机，而是关节。只要执行器之间的零位、摩擦、绕组参数、热状态和限流逻辑不一致，你后面看到的很多“控制不稳”其实都只是硬件离散度太大。

更稳妥的做法是把执行器当成单独产品线管理，至少做下面几件事：

建立每个关节型号的参数卡，包括减速比、连续电流、峰值电流、温升阈值、零位方向、编码器偏置。
装配后对每颗执行器做通电检查、相序确认、零位校准和空载电流基线记录。
把相电阻、相电感、编码器噪声、温升曲线等关键参数记录到序列号。
在整机控制器里按关节型号分组限流，而不是整机一把梭地给统一参数。

Berkeley Humanoid Lite 在电机表征文档里专门测绕组类型、相间电阻和电感，这一点很重要。因为 sim-to-real gap 不只是仿真问题，很多时候也是你根本没有把真实执行器参数量出来。

第三步：供电设计要按“最坏瞬态”做，不要按平均功耗做

很多团队做第一版样机时喜欢看平均功耗，但 humanoid 真正容易翻车的是瞬态。双腿起步、双臂同时加速、跌倒恢复、抓取卡滞，这些都会让母线电流和电压在很短时间里出问题。

更实用的做法是：

把主要工况拆成站立、起步、行走、抓取、恢复、急停六类。
对每类工况记录母线电压、电池电流、每关节峰值电流和控制板温度。
为欠压、过压、再生能量回灌和保险动作设置明确阈值，不要靠“先跑跑看”。
把长线缆压降、连接器发热和接地回路一起算进去。

ODrive 的硬件配置文档里明确把欠压、过压、正向/反向电流限制和主动功率限制当成必须配置项，这个思路非常对。对人形机器人来说，供电保护不是附加项，而是动作边界的一部分。FRC roboRIO 的 brownout 分级保护也很值得借鉴，它把“低压时先降级哪些功能、再关闭哪些输出”写成明确规则，而不是等整机随机重启后再找原因。

第四步：热管理别只看电机，还要看控制器、线束和壳体

小批量阶段常见的错觉是：电机扛得住，整机就扛得住。实际上热问题经常先出在控制器、电源板、连接器和壳体散热路径上。

mjbots 在 thermal modeling 文章和控制器产品说明里把“无额外冷却”和“有热管理”分开给连续电流能力，这很值得照抄。因为很多项目的连续能力不是被峰值电流限制，而是被热阻和散热路径限制。

建议你至少把热问题拆成三层：

热源：电机铜耗、MOSFET 损耗、减速器摩擦、DC/DC 转换损耗。
热路径：壳体导热、热界面材料、风道、壳内堆叠、线束遮挡。
热保护：降额阈值、停机阈值、恢复阈值、日志告警。

如果你只做“超过温度就停”，却不做降额区间和日志记录，那现场看到的通常只是“偶发无力”“动作变慢”“关节发飘”，非常难排查。

第五步：EOL 测试必须覆盖“能动”“能稳”“能追责”三件事

人形机器人出厂前的 EOL 测试，不能只测关节会不会转。最低限度要覆盖三层：

能动：每个关节方向正确、编码器正常、零位可重复、急停有效。
能稳：标准动作脚本下不过流、不过热、不 brownout，关键关节误差在阈值内。
能追责：测试结果和日志绑定到整机序列号、关节序列号、固件版本、BOM 版本。

我建议至少准备三段固定脚本：空载关节扫描、整机标准动作循环、10 到 20 分钟热稳态测试。这样你才知道一台机器人是“能启动”，还是“能稳定工作”。

第六步：从一开始就按返修和维护来设计装配

如果一颗髋关节电机坏了，要拆半台机器人才能换，那你不是在做产品化，而是在做一次性艺术品。

装配设计里最值得优先保证的是：

常坏件能否在 15 到 30 分钟内拆换
换件后是否需要全机重新标定
线束、连接器、保险和传感器能否快速定位故障
左右对称件是否尽量共用
备件、替代件和版本兼容关系是否写进文档

很多团队以为维护性是后期运营问题，其实它直接决定研发迭代速度。你返修一次要半天，控制、学习和测试团队的节奏都会一起被拖慢。

现场 first-look 决策表：小批量试制一乱，先压回哪一层

小批量制造最容易失真，不是因为团队不知道要做 BOM、标定和 EOL，而是现场一乱就把“装配问题、批次问题、控制问题、热问题、返修问题”混成一句“这台不稳定”。下面这张表只做第一轮收口：先把症状压回责任层，再决定今天要不要继续装更多台、换供应商或改控制参数。

现场症状	先判哪层	第一证据	先停手
同一版连续装 5 台，表现差异很大有的能跑，有的刚上电就报警	BOM / 装配版本边界	BOM revision 替代件记录装配工位记录线束与连接器批次	别继续扩大装配数量别把差异先归因于控制参数
关节空载都能转，整机一跑就有几台发飘零位、摩擦和温升表现不一致	执行器一致性	执行器序列号零位偏置空载电流相电阻 / 相电感温升曲线	别先统一洗 gait 参数别用一台样机的参数套全批次
EOL 都显示通过，现场半小时后才掉线或降额出厂测试和真实工况脱节	EOL 覆盖 / 热稳态	EOL 脚本版本 10–20 分钟热稳态记录母线电压控制板温度降额触发日志	别只看通电自检通过别把短脚本当成交付验收
一换供应商或替代件，故障开始随机出现 datasheet 看着接近，整机行为变了	替代件验证 / 接口合同	接口差异清单安装边界驱动兼容性参数重标定结果回归测试记录	别按“规格差不多”放行别同时替换多层物料
返修后能修好，但下一次没人知道改过什么同类问题反复回到现场	返修追溯 / 维护闭环	整机序列号关节序列号维修动作记录换件前后校准结果复测日志	别只靠工程师口头经验别把返修成功当成问题闭环

这张表的作用不是替代完整制造体系，而是先阻止小批量阶段最贵的误判：一边继续装更多台，一边还不知道差异来自版本、执行器、EOL、替代件还是返修记录。责任层没压住前，产量越高，噪声复制得越快。

最容易翻车的地方

只冻结 CAD，不冻结固件参数和测试脚本
执行器装得出来，但相序、零位、摩擦差异没人记录
平均功耗没问题，瞬态工况却频繁欠压或回灌
热保护只有停机阈值，没有降额和日志
EOL 只测通电，不测连续动作和热稳态
整机序列号存在，但关节、BOM、固件版本对不上
返修需要大拆，导致现场问题越来越难闭环

怎么验证你真的进入了“可制造准备”阶段

不要问产线摆出来没有，先问下面五个问题：

连续装 5 台，关键动作性能偏差是否在可接受范围内。
任一关节异常时，能否通过日志、序列号和测试记录追到具体批次和版本。
标准热稳态测试后，是否知道哪些关节在先降额，哪些控制板先过热。
急停、掉压、过流和编码器异常，是否都有明确降级策略。
现场返修后，能否在有限步骤内恢复到可验证状态。

如果这些问题回答不了，说明你只是做出了多台原型，还没有形成真正的制造准备能力。

下一步怎么做

如果你正在把 humanoid 从 demo 推向试点交付，我建议下一步按这个顺序补：

先补执行器参数卡和序列号追踪。
再补母线供电保护、热降额和日志字段。
然后补 EOL 自动测试和 10 到 20 分钟热稳态脚本。
最后再谈夹具、节拍优化和更高产量的装配效率。

顺序不要反。因为没有参数一致性、保护策略和测试闭环，扩产只会把问题更快地复制出来。

延伸阅读与参考来源

Berkeley Humanoid Lite Docs: Getting Started with Hardware / Releases / Motor Characterization
ODrive Documentation: Hardware Configuration, Thermistors, Over Temperature Current Limiting
mjbots: Thermal modeling for moteus and motors, moteus r4.11 controller cooling guidance
WPILib: roboRIO Brownout and Understanding Current Draw