这篇文章要解决的问题是:当你的人形机器人已经不只是“能动一次”的 demo,而是准备进入 5 台、20 台、50 台的小批量样机阶段时,硬件团队到底该先补哪几件事,才能避免后面被一致性、热衰减、供电波动、装配返工和维护成本拖死。它适合已经做出原型、正准备做第二版或小批量试制的团队。最关键的工程判断是:制造准备的核心,不是先追产量,而是先把 BOM、执行器参数、供电保护、EOL 测试和可维护性做成可重复的系统。
这篇适合谁
- 已经有 humanoid 原型,准备做第二版整机或小批量试制的团队
- 正在为执行器、控制器、电池、线束和结构件建立统一版本的工程负责人
- 发现“每台都能装出来,但每台表现都不一样”的项目
- 希望把研发样机推进到可交付试点,而不是继续停留在展会 demo 的团队
先纠正几个很常见的误区
- 误区一:能装配出来,就算具备制造能力。 真正卡人的不是能不能装,而是装完以后参数是不是一致、温升是不是可控、返修路径是不是清楚。
- 误区二:先冲产量,测试和标定以后补。 如果 EOL 测试和校准流程不先定,产量越高,返工和现场故障越难收拾。
- 误区三:BOM 只是采购清单。 对 humanoid 来说,BOM 还是接口合同、热设计假设、线束路径和维护策略的载体。
- 误区四:执行器参数抄 datasheet 就够了。 真机里真正影响控制器参数和热边界的,往往是绕组、阻抗、散热条件和装配偏差。
如果一台人形机器人还不能做到“同一份 BOM、同一套装配步骤、同一套校准脚本、同一套 EOL 测试,就能稳定得到接近一致的行为表现”,那它还处在原型工程阶段,不算进入真正可放大的制造准备阶段。
第一步:先冻结的不是整机方案,而是版本边界
进入小批量前,最先该冻结的是版本边界,而不是把所有设计都锁死。你至少要明确四层版本:
- 结构版本:关节壳体、减速器、安装孔位、外壳、线束走线点是否冻结。
- 电气版本:电池、电源母线、保险、控制板、连接器、传感器线束是否冻结。
- 固件版本:执行器控制参数、热保护阈值、编码器方向、零位流程是否冻结。
- 测试版本:EOL 动作脚本、温升测试、供电跌落保护、日志字段是否冻结。
如果这四层还是随手改,你做的不是试制,而是在产线上继续研发。
Berkeley Humanoid Lite 这类开源项目把 BOM、CAD、打印件和 release 变更记录分开维护,这种做法很值得借鉴。因为它逼着团队把“零件是什么”“怎么装”“这版改了什么”分开说清楚,而不是把所有变化塞进一份口头经验里。
第二步:先把执行器一致性做出来,再谈整机一致性
人形机器人最先失控的常常不是整机,而是关节。只要执行器之间的零位、摩擦、绕组参数、热状态和限流逻辑不一致,你后面看到的很多“控制不稳”其实都只是硬件离散度太大。
更稳妥的做法是把执行器当成单独产品线管理,至少做下面几件事:
- 建立每个关节型号的参数卡,包括减速比、连续电流、峰值电流、温升阈值、零位方向、编码器偏置。
- 装配后对每颗执行器做通电检查、相序确认、零位校准和空载电流基线记录。
- 把相电阻、相电感、编码器噪声、温升曲线等关键参数记录到序列号。
- 在整机控制器里按关节型号分组限流,而不是整机一把梭地给统一参数。
Berkeley Humanoid Lite 在电机表征文档里专门测绕组类型、相间电阻和电感,这一点很重要。因为 sim-to-real gap 不只是仿真问题,很多时候也是你根本没有把真实执行器参数量出来。
第三步:供电设计要按“最坏瞬态”做,不要按平均功耗做
很多团队做第一版样机时喜欢看平均功耗,但 humanoid 真正容易翻车的是瞬态。双腿起步、双臂同时加速、跌倒恢复、抓取卡滞,这些都会让母线电流和电压在很短时间里出问题。
更实用的做法是:
- 把主要工况拆成站立、起步、行走、抓取、恢复、急停六类。
- 对每类工况记录母线电压、电池电流、每关节峰值电流和控制板温度。
- 为欠压、过压、再生能量回灌和保险动作设置明确阈值,不要靠“先跑跑看”。
- 把长线缆压降、连接器发热和接地回路一起算进去。
ODrive 的硬件配置文档里明确把欠压、过压、正向/反向电流限制和主动功率限制当成必须配置项,这个思路非常对。对人形机器人来说,供电保护不是附加项,而是动作边界的一部分。FRC roboRIO 的 brownout 分级保护也很值得借鉴,它把“低压时先降级哪些功能、再关闭哪些输出”写成明确规则,而不是等整机随机重启后再找原因。
第四步:热管理别只看电机,还要看控制器、线束和壳体
小批量阶段常见的错觉是:电机扛得住,整机就扛得住。实际上热问题经常先出在控制器、电源板、连接器和壳体散热路径上。
mjbots 在 thermal modeling 文章和控制器产品说明里把“无额外冷却”和“有热管理”分开给连续电流能力,这很值得照抄。因为很多项目的连续能力不是被峰值电流限制,而是被热阻和散热路径限制。
建议你至少把热问题拆成三层:
- 热源:电机铜耗、MOSFET 损耗、减速器摩擦、DC/DC 转换损耗。
- 热路径:壳体导热、热界面材料、风道、壳内堆叠、线束遮挡。
- 热保护:降额阈值、停机阈值、恢复阈值、日志告警。
如果你只做“超过温度就停”,却不做降额区间和日志记录,那现场看到的通常只是“偶发无力”“动作变慢”“关节发飘”,非常难排查。
第五步:EOL 测试必须覆盖“能动”“能稳”“能追责”三件事
人形机器人出厂前的 EOL 测试,不能只测关节会不会转。最低限度要覆盖三层:
- 能动:每个关节方向正确、编码器正常、零位可重复、急停有效。
- 能稳:标准动作脚本下不过流、不过热、不 brownout,关键关节误差在阈值内。
- 能追责:测试结果和日志绑定到整机序列号、关节序列号、固件版本、BOM 版本。
我建议至少准备三段固定脚本:空载关节扫描、整机标准动作循环、10 到 20 分钟热稳态测试。这样你才知道一台机器人是“能启动”,还是“能稳定工作”。
第六步:从一开始就按返修和维护来设计装配
如果一颗髋关节电机坏了,要拆半台机器人才能换,那你不是在做产品化,而是在做一次性艺术品。
装配设计里最值得优先保证的是:
- 常坏件能否在 15 到 30 分钟内拆换
- 换件后是否需要全机重新标定
- 线束、连接器、保险和传感器能否快速定位故障
- 左右对称件是否尽量共用
- 备件、替代件和版本兼容关系是否写进文档
很多团队以为维护性是后期运营问题,其实它直接决定研发迭代速度。你返修一次要半天,控制、学习和测试团队的节奏都会一起被拖慢。
最容易翻车的地方
- 只冻结 CAD,不冻结固件参数和测试脚本
- 执行器装得出来,但相序、零位、摩擦差异没人记录
- 平均功耗没问题,瞬态工况却频繁欠压或回灌
- 热保护只有停机阈值,没有降额和日志
- EOL 只测通电,不测连续动作和热稳态
- 整机序列号存在,但关节、BOM、固件版本对不上
- 返修需要大拆,导致现场问题越来越难闭环
怎么验证你真的进入了“可制造准备”阶段
不要问产线摆出来没有,先问下面五个问题:
- 连续装 5 台,关键动作性能偏差是否在可接受范围内。
- 任一关节异常时,能否通过日志、序列号和测试记录追到具体批次和版本。
- 标准热稳态测试后,是否知道哪些关节在先降额,哪些控制板先过热。
- 急停、掉压、过流和编码器异常,是否都有明确降级策略。
- 现场返修后,能否在有限步骤内恢复到可验证状态。
如果这些问题回答不了,说明你只是做出了多台原型,还没有形成真正的制造准备能力。
下一步怎么做
如果你正在把 humanoid 从 demo 推向试点交付,我建议下一步按这个顺序补:
- 先补执行器参数卡和序列号追踪。
- 再补母线供电保护、热降额和日志字段。
- 然后补 EOL 自动测试和 10 到 20 分钟热稳态脚本。
- 最后再谈夹具、节拍优化和更高产量的装配效率。
顺序不要反。因为没有参数一致性、保护策略和测试闭环,扩产只会把问题更快地复制出来。
延伸阅读与参考来源
- Berkeley Humanoid Lite Docs: Getting Started with Hardware / Releases / Motor Characterization
- ODrive Documentation: Hardware Configuration, Thermistors, Over Temperature Current Limiting
- mjbots: Thermal modeling for moteus and motors, moteus r4.11 controller cooling guidance
- WPILib: roboRIO Brownout and Understanding Current Draw