Chapter 4: Tedrake 계보 — 접촉, Drake, Sim-to-Real

개요

large-data 전략은 물리 법칙을 버리는 전략이 아니라 learned policy가 들어갈 안전한 접촉 공간을 좁히는 전략이다. 이 장은 그 문제를 제조 셀의 데이터 계약으로 다시 쓴다. ^[1]와 ^[19]가 보여주는 대규모 로봇 데이터의 약속은 중요하지만, 제조에서는 episode가 품질 판정과 연결될 때만 가치가 생긴다.

삽입, 누름, 닦기, 조립처럼 접촉이 긴 작업은 VLA가 바로 action을 내는 문제가 아니다. fixture, force limit, guarded motion, collision zone, clamp state, rollback condition이 policy 앞뒤에 있어야 한다. 이때 데이터는 카메라 프레임만이 아니라 손의 선택, force/torque, tactile patch, controller mode, 작업자 개입, 검사 결과를 함께 담는다. ^[3]와 ^[4]는 사람 데이터가 로봇 실행으로 넘어갈 때 어떤 신호가 사라지는지 보여준다.

이 장을 읽고 나면... - 제조 조작 문제를 모델 성능이 아니라 데이터 계약으로 설명할 수 있다. - 2지/흡착/custom/5지 손의 선택이 수집 비용과 실패 관측성을 어떻게 바꾸는지 말할 수 있다. - 논문, 회사 발표, 생산 현장 claim을 evidence tier로 분리할 수 있다. - 첫 제조 PoC에서 반드시 기록할 replay set과 QA trace를 설계할 수 있다.

핵심 지도

판단 축	데이터로 남겨야 할 것	제조 셀에서의 결정
작업 분포	SKU, lot, fixture, 접촉 이벤트, 검사 결과	같은 policy로 묶을지, 셀별 policy로 나눌지 결정 ^[1]
하드웨어	gripper, hand, tactile/force channel, calibration 상태	2지, 흡착, custom hand, 5지 손의 비용을 비교 ^[19]
운영 로그	override, stop, rework, scrap, cycle time	재학습 trigger와 rollback 기준을 설정 ^[3]

그림으로 보는 장의 논지

그림 4.1. Model-predictive guardrails around learned behavior. 출처: 로컬 서베이 자산 재사용 또는 저자 작성.

그림 4.2. Domain randomization as only one part of sim-to-real. 출처: 로컬 서베이 자산 재사용 또는 저자 작성.

그림 4.3. Simulation and real-cell validation loop. 출처: 로컬 서베이 자산 재사용 또는 저자 작성.

접촉 모델은 데이터 절약 장치다

접촉 모델은 데이터 절약 장치다의 핵심은 공정 변수를 학습 가능한 형태로 남기는 것이다. ^[1]는 대규모 데이터가 embodiment와 task family를 넓힐 수 있음을 보여주지만, 제조 셀은 그보다 좁고 엄격하다. 같은 물체를 집어도 fixture tolerance, 표면 오염, cycle time 압박, 검사기의 reject code가 달라지면 사실상 다른 데이터 분포가 된다.

여기서 삽입, 누름, 닦기, 조립처럼 접촉이 긴 작업은 VLA가 바로 action을 내는 문제가 아니다. fixture, force limit, guarded motion, collision zone, clamp state, rollback condition이 policy 앞뒤에 있어야 한다.라는 구체 시나리오를 보면, 사람의 시연만으로는 충분하지 않다. ^[19]처럼 사람-로봇 전환을 쉽게 만드는 인터페이스가 있어도, 접촉 힘과 실패 이유가 빠지면 policy는 다음 release에서 같은 실수를 반복한다. 따라서 episode schema는 observation, action, contact state, QA outcome, operator note를 같은 key로 묶어야 한다.

증거 수준도 분리해야 한다. ^[3] 같은 논문은 재현 가능한 benchmark와 방법론을 제공하는 반면, 회사 발표는 실제 배포 방향을 알려주지만 데이터 권리와 운영 metric은 제한적으로 공개한다. 제조사는 둘을 같은 표에 넣되 같은 무게로 읽으면 안 된다. peer-reviewed 또는 arXiv 근거, 공식 기술 페이지, press/media claim, 미검증 watchlist를 나누어야 한다.