-
Holo3.1: 빠르고 로컬인 컴퓨터 사용 에이전트
Holo3.1: Fast & Local Computer Use Agents
-
Mellum2 소개: JetBrains의 12B Mixture-of-Experts 모델
Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains
-
LLM을 넘어서: 확장 가능한 엔터프라이즈 AI 도입이 에이전트 로직에 의존하는 이유
Beyond LLMs: Why Scalable Enterprise AI Adoption Depends on Agent Logic
-
NVIDIA Cosmos 3 환영합니다: 물리적 AI 추론 및 행동을 위한 첫 번째 오픈 옴니모델
Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action
-
PyTorch 프로파일링 (1부): torch.profiler 초보자 가이드
Profiling in PyTorch (Part 1): A Beginner's Guide to torch.profiler
-
허브 버킷을 이용한 1조 파라미터 배포: TRL의 델타 가중치 동기화
Shipping a Trillion Parameters With a Hub Bucket: Delta Weight Sync in TRL
-
Reachy Mini 완전한 로컬 실행
Reachy Mini goes fully local
-
하네스, 스캐폴드, 그리고 올바르게 알아야 할 AI 에이전트 용어들
Harness, Scaffold, and the AI Agent Terms Worth Getting Right
-
전문화가 규모를 이긴다: AI 조달 의사결정에서 대부분이 놓치는 전략적 변수
Specialization Beats Scale: A Strategic Variable Most AI Procurement Decisions Overlook
-
OlmoEarth v1.1: 더 효율적인 지구 관측 모델 시리즈
OlmoEarth v1.1: A more efficient family of Earth observation models
-
Ettin Reranker 패밀리 소개
Introducing the Ettin Reranker Family
-
PaddleOCR 3.5: Transformers 백엔드를 이용한 OCR 및 문서 파싱 작업
PaddleOCR 3.5: Running OCR and Document Parsing Tasks with a Transformers Backend
-
Granite 임베딩 다국어 R2: Apache 2.0 오픈소스 32K 컨텍스트를 갖춘 다국어 임베딩 — 100M 이하 모델 중 최고의 검색 품질
Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality
-
연속 배칭에서 비동기성 활성화
Unlocking asynchronicity in continuous batching
-
AWS에서 기초 모델 학습 및 추론을 위한 구성 요소
Building Blocks for Foundation Model Training and Inference on AWS
-
vLLM V0에서 V1로: 강화학습에서 수정보다 정확성을 먼저
vLLM V0 to V1: Correctness Before Corrections in RL
-
오픈 ASR 리더보드에 벤치마킹 조작 방지 기능 추가
Adding Benchmaxxer Repellant to the Open ASR Leaderboard
-
그래나이트 4.1 LLM: 구축 방식
Granite 4.1 LLMs: How They’re Built
-
DeepInfra가 Hugging Face 추론 제공자로 이용 가능
DeepInfra on Hugging Face Inference Providers 🔥
-
NVIDIA Nemotron 3 Nano Omni 소개: 문서, 오디오, 비디오 에이전트를 위한 장문맥 멀티모달 지능
Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents
-
OpenAI 프라이버시 필터를 사용하여 확장 가능한 웹 애플리케이션 구축하는 방법
How to build scalable web apps with OpenAI's Privacy Filter
-
딥시크-V4: 에이전트가 실제로 사용할 수 있는 백만 토큰 컨텍스트
DeepSeek-V4: a million-token context that agents can actually use
-
Chrome 확장 프로그램에서 Transformers.js를 사용하는 방법
How to Use Transformers.js in a Chrome Extension
-
QIMMA قِمّة ⛰: 품질 우선 아랍어 LLM 리더보드
QIMMA قِمّة ⛰: A Quality-First Arabic LLM Leaderboard
-
AI와 사이버보안의 미래: 개방성이 중요한 이유
AI and the Future of Cybersecurity: Why Openness Matters
-
Sentence Transformers를 이용한 멀티모달 임베딩 및 리랭커 모델 학습과 파인튜닝
Training and Finetuning Multimodal Embedding & Reranker Models with Sentence Transformers
-
당신이 직접 열었을 PR
The PR you would have opened yourself
-
Ecom-RLVE: 전자상거래 대화형 에이전트용 적응형 검증 환경
Ecom-RLVE: Adaptive Verifiable Environments for E-Commerce Conversational Agents
-
VAKRA 내부: 에이전트의 추론, 도구 활용, 그리고 실패 모드
Inside VAKRA: Reasoning, Tool Use, and Failure Modes of Agents
-
HCompany의 HoloTab을 만나보세요. 당신의 AI 브라우저 동료입니다.
Meet HoloTab by HCompany. Your AI browser companion.