#model-optimization

총 2건 · 1/1 페이지

전체 24시간 7일 30일

전체 🇰🇷 한국어 본문

전체 High(60+) ⭐ Must-read(75+)

최신순 점수순

Hugging Face Blog · 7일 전 번역

허브 버킷을 이용한 1조 파라미터 배포: TRL의 델타 가중치 동기화

Shipping a Trillion Parameters With a Hub Bucket: Delta Weight Sync in TRL

#large-language-models #model-optimization #distributed-training #delta-sync #transformer-reinforcement-learning #parameter-efficiency
Hugging Face Blog · 2026-05-06 번역

vLLM V0에서 V1로: 강화학습에서 수정보다 정확성을 먼저

vLLM V0 to V1: Correctness Before Corrections in RL

#large-language-models #reinforcement-learning #model-optimization #llm-inference #vllm #correctness