#reinforcement-learning

총 3건 · 1/1 페이지

전체 24시간 7일 30일

전체 🇰🇷 한국어 본문

Hugging Face Blog · 2026-05-06 제목번역

vLLM V0에서 V1로: 강화학습에서 수정보다 정확성을 먼저

vLLM V0 to V1: Correctness Before Corrections in RL

#large-language-models #reinforcement-learning #model-optimization #llm-inference #vllm #correctness
Hugging Face Blog · 2026-04-16 제목번역

Ecom-RLVE: 전자상거래 대화형 에이전트용 적응형 검증 환경

Ecom-RLVE: Adaptive Verifiable Environments for E-Commerce Conversational Agents

#reinforcement-learning #e-commerce #conversational-agents #verifiable-environments #adaptive-systems
Hugging Face Blog · 2026-03-31 제목번역

TRL v1.0: 분야와 함께 성장하는 포스트-트레이닝 라이브러리

TRL v1.0: Post-Training Library Built to Move with the Field

#language-models #reinforcement-learning #model-training #post-training #deep-learning #llm-training