-
딥씨크 V4 - 거의 최고 수준의 성능, 저렴한 가격
DeepSeek V4 - almost on the frontier, a fraction of the price
<p>Chinese AI lab DeepSeek's last model release was V3.2 (and V3.2 Speciale) <a href="https://simonwillison.net/2025/Dec/1/deepseek-v32/">last December</a>. They just dropped the f…
-
딥시크-V4: 에이전트가 실제로 사용할 수 있는 백만 토큰 컨텍스트
DeepSeek-V4: a million-token context that agents can actually use
-
웹 브라우저에서 LiteParse로 PDF 텍스트 추출하기
Extract PDF text in your browser with LiteParse for the web
<p>LlamaIndex have a most excellent open source project called <a href="https://github.com/run-llama/liteparse">LiteParse</a>, which provides a Node.js CLI tool for extracting text…
-
GPT-5.5를 위한 펠리칸: 반공식적 Codex 백도어 API
A pelican for GPT-5.5 via the semi-official Codex backdoor API
<p><a href="https://openai.com/index/introducing-gpt-5-5/">GPT-5.5 is out</a>. It's available in OpenAI Codex and is rolling out to paid ChatGPT subscribers. I've had some preview …
-
Chrome 확장 프로그램에서 Transformers.js를 사용하는 방법
How to Use Transformers.js in a Chrome Extension
-
분리형 DiLoCo: 복원력 있는 대규모 분산 AI 훈련 — Google DeepMind
Decoupled DiLoCo: Resilient, Distributed AI Training at Scale â Google DeepMind
-
Claude Code가 월 100달러가 될까요? 아마 아닐 겁니다 - 정말 혼란스럽네요
Is Claude Code going to cost $100/month? Probably not - it's all very confusing
<p>Anthropic today quietly (as in <em>silently</em>, no announcement anywhere at all) updated their <a href="https://claude.com/pricing">claude.com/pricing</a> page (but not their …
-
구글 DeepMind, 글로벌 컨설팅 기업들과 협력하여 엔터프라이즈 AI 도입 가속화
Google DeepMind partners with global consultancies to accelerate enterprise AI adoption. â Google DeepMind
Google DeepMind partners with global consultancies to bring the power of frontier AI to organizations around the world.
-
QIMMA قِمّة ⛰: 품질 우선 아랍어 LLM 리더보드
QIMMA قِمّة ⛰: A Quality-First Arabic LLM Leaderboard
-
AI와 사이버보안의 미래: 개방성이 중요한 이유
AI and the Future of Cybersecurity: Why Openness Matters
-
Import AI 454: 정렬 연구 자동화; 중국 모델의 안전성 연구; HiFloat4
Import AI 454: Automating alignment research; safety study of a Chinese model; HiFloat4
At what point do the financial markets price in the singularity?
-
LLM 아키텍처를 이해하기 위한 내 워크플로우
My Workflow for Understanding LLM Architectures
A learning-oriented workflow for understanding new open-weight model releases
-
Sentence Transformers를 이용한 멀티모달 임베딩 및 리랭커 모델 학습과 파인튜닝
Training and Finetuning Multimodal Embedding & Reranker Models with Sentence Transformers
-
당신이 직접 열었을 PR
The PR you would have opened yourself
-
Ecom-RLVE: 전자상거래 대화형 에이전트용 적응형 검증 환경
Ecom-RLVE: Adaptive Verifiable Environments for E-Commerce Conversational Agents
-
Gemini 3.1 Flash TTS: 표현력 있는 차세대 AI 음성
Gemini 3.1 Flash TTS: the next generation of expressive AI speech
Our newest audio model introduces granular audio tags that give you precise control to direct AI speech for expressive audio generation.
-
VAKRA 내부: 에이전트의 추론, 도구 활용, 그리고 실패 모드
Inside VAKRA: Reasoning, Tool Use, and Failure Modes of Agents
-
HCompany의 HoloTab을 만나보세요. 당신의 AI 브라우저 동료입니다.
Meet HoloTab by HCompany. Your AI browser companion.
-
Gemini Robotics-ER 1.6: 강화된 구체화 추론으로 실제 로봇 작업 수행
Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning
Gemini Robotics ER 1.6: Enhancing spatial reasoning and multi-view understanding for autonomous robotics.
-
Import AI 453: AI 에이전트 붕괴, 미러코드 그리고 점진적 무력화에 대한 열 가지 관점
Import AI 453: Breaking AI agents; MirrorCode; and ten views on gradual disempowerment
Was fire equivalent to a singularity for people at the time?
-
센텐스 트랜스포머를 활용한 멀티모달 임베딩 및 리랭커 모델
Multimodal Embedding & Reranker Models with Sentence Transformers
-
Waypoint-1.5: 일반 GPU를 위한 고충실도 인터랙티브 월드
Waypoint-1.5: Higher-Fidelity Interactive Worlds for Everyday GPUs
-
Safetensors가 PyTorch 재단에 합류합니다
Safetensors is Joining the PyTorch Foundation
-
Import AI 452: 사이버전쟁의 확장 법칙, AI 자동화의 급증, 그리고 GDP 예측의 미스터리
Import AI 452: Scaling laws for cyberwar; rising tides of AI automation; and a puzzle over gDP forecasting
How much could AI revolutionize the economy?
-
코딩 에이전트의 구성 요소 - Sebastian Raschka 박사
Components of A Coding Agent - by Sebastian Raschka, PhD
How coding agents use tools, memory, and repo context to make LLMs work better in practice
-
Gemma 4: 바이트 대 바이트, 가장 강력한 오픈 모델
Gemma 4: Byte for byte, the most capable open models
Gemma 4: Our most intelligent open models to date, purpose-built for advanced reasoning and agentic workflows.
-
Gemma 4 환영합니다: 기기 내 최첨단 멀티모달 지능
Welcome Gemma 4: Frontier multimodal intelligence on device
-
팔콘 인식
Falcon Perception
-
Gradio 백엔드를 이용한 커스텀 프론트엔드
Any Custom Frontend with Gradio's Backend
-
그래나이트 4.0 3B 비전: 엔터프라이즈 문서용 소형 멀티모달 인공지능
Granite 4.0 3B Vision: Compact Multimodal Intelligence for Enterprise Documents