AI
·
News
검색
전체
공식
커뮤니티
#distributed-training
총 1건 · 1/1 페이지
전체
24시간
7일
30일
전체
🇰🇷 한국어 본문
전체
High(60+)
⭐ Must-read(75+)
최신순
점수순
표시
20개
30개
50개
100개
Hugging Face Blog
·
7일 전
번역
허브 버킷을 이용한 1조 파라미터 배포: TRL의 델타 가중치 동기화
Shipping a Trillion Parameters With a Hub Bucket: Delta Weight Sync in TRL
#large-language-models
#model-optimization
#distributed-training
#delta-sync
#transformer-reinforcement-learning
#parameter-efficiency