#transformer-reinforcement-learning
총 1건 · 1/1 페이지
-
허브 버킷을 이용한 1조 파라미터 배포: TRL의 델타 가중치 동기화
Shipping a Trillion Parameters With a Hub Bucket: Delta Weight Sync in TRL