-
Holo3.1: 빠르고 로컬인 컴퓨터 사용 에이전트
Holo3.1: Fast & Local Computer Use Agents
-
Mellum2 소개: JetBrains의 12B Mixture-of-Experts 모델
Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains
-
LLM을 넘어서: 확장 가능한 엔터프라이즈 AI 도입이 에이전트 로직에 의존하는 이유
Beyond LLMs: Why Scalable Enterprise AI Adoption Depends on Agent Logic
-
NVIDIA Cosmos 3 환영합니다: 물리적 AI 추론 및 행동을 위한 첫 번째 오픈 옴니모델
Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action
-
PyTorch 프로파일링 (1부): torch.profiler 초보자 가이드
Profiling in PyTorch (Part 1): A Beginner's Guide to torch.profiler
-
허브 버킷을 이용한 1조 파라미터 배포: TRL의 델타 가중치 동기화
Shipping a Trillion Parameters With a Hub Bucket: Delta Weight Sync in TRL
-
Reachy Mini 완전한 로컬 실행
Reachy Mini goes fully local
-
하네스, 스캐폴드, 그리고 올바르게 알아야 할 AI 에이전트 용어들
Harness, Scaffold, and the AI Agent Terms Worth Getting Right
-
전문화가 규모를 이긴다: AI 조달 의사결정에서 대부분이 놓치는 전략적 변수
Specialization Beats Scale: A Strategic Variable Most AI Procurement Decisions Overlook
-
OlmoEarth v1.1: 더 효율적인 지구 관측 모델 시리즈
OlmoEarth v1.1: A more efficient family of Earth observation models
-
Ettin Reranker 패밀리 소개
Introducing the Ettin Reranker Family
-
PaddleOCR 3.5: Transformers 백엔드를 이용한 OCR 및 문서 파싱 작업
PaddleOCR 3.5: Running OCR and Document Parsing Tasks with a Transformers Backend
-
Granite 임베딩 다국어 R2: Apache 2.0 오픈소스 32K 컨텍스트를 갖춘 다국어 임베딩 — 100M 이하 모델 중 최고의 검색 품질
Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality
-
연속 배칭에서 비동기성 활성화
Unlocking asynchronicity in continuous batching
-
AWS에서 기초 모델 학습 및 추론을 위한 구성 요소
Building Blocks for Foundation Model Training and Inference on AWS
-
vLLM V0에서 V1로: 강화학습에서 수정보다 정확성을 먼저
vLLM V0 to V1: Correctness Before Corrections in RL
-
오픈 ASR 리더보드에 벤치마킹 조작 방지 기능 추가
Adding Benchmaxxer Repellant to the Open ASR Leaderboard