#model-optimization
총 4건 · 1/1 페이지
-
허브 버킷을 이용한 1조 파라미터 배포: TRL의 델타 가중치 동기화
Shipping a Trillion Parameters With a Hub Bucket: Delta Weight Sync in TRL
-
vLLM V0에서 V1로: 강화학습에서 수정보다 정확성을 먼저
vLLM V0 to V1: Correctness Before Corrections in RL
-
Gemini 3.1 Flash Lite: 가장 비용 효율적인 AI 모델
Gemini 3.1 Flash Lite: Our most cost-effective AI model yet
Gemini 3.1 Flash-Lite is our fastest and most cost-efficient Gemini 3 series model yet.
-
AlignEval: 평가를 쉽고 재미있으며 자동화되게 만드는 앱 구축하기
AlignEval: Building an App to Make Evals Easy, Fun, and Automated
Look at and label your data, build and evaluate your LLM-evaluator, and optimize it against your labels.