-
Netflix PRS 2024 - 추천 경험에 LLM 적용
Netflix PRS 2024 - Applying LLMs to Recommendation Experiences
Challenges and lessons from deploying LLM experiences: evals, scalability, guardrails.
-
프롬프트 기초 및 효과적으로 적용하는 방법
Prompting Fundamentals and How to Apply them Effectively
Structured input/output, prefilling, n-shots prompting, chain-of-thought, reducing hallucinations, etc.
-
LLM으로 1년간 구축하며 배운 것들
What We've Learned From A Year of Building with LLMs
From the tactical nuts & bolts to the operational day-to-day to the long-term business strategy.
-
원숭이 마음을 길들이는 AI 코치 만들기
Building an AI Coach to Help Tame My Monkey Mind
Building an AI coach with speech-to-text, text-to-speech, an LLM, and a virtual number.
-
작동하고 작동하지 않는 작업별 LLM 평가
Task-Specific LLM Evals that Do & Don't Work
Evals for classification, summarization, translation, copyright regurgitation, and toxicity.
-
머신러닝 모델을 단위 테스트에서 모킹하지 마세요
Don't Mock Machine Learning Models In Unit Tests
How unit testing machine learning code differs from typical software practices
-
파인튜닝을 위한 합성 데이터 생성 및 활용 방법
How to Generate and Use Synthetic Data for Finetuning
Overcoming the bottleneck of human annotations in instruction-tuning, preference-tuning, and pretraining.
-
언어 모델링 논문 목록 (논문 클럽 시작하기)
Language Modeling Reading List (to Start Your Paper Club)
Some fundamental papers and a one-sentence summary for each; start your own paper club!
-
2023년 연간 회고
2023 Year in Review
An expanded charter, lots of writing and speaking, and finally learning to snowboard.
-
푸시 알림: 무엇을 보내고, 무엇을 피하고, 얼마나 자주 보낼지
Push Notifications: What to Push, What Not to Push, and How Often
Sending helpful & engaging pushes, filtering annoying pushes, and finding the frequency sweet spot.
-
도메인 외 파인튜닝을 통한 환각 탐지 부트스트래핑
Out-of-Domain Finetuning to Bootstrap Hallucination Detection
How to use open-source, permissive-use data and collect less labeled samples for our tasks.
-
2023 AI 엔지니어 서밋 회고
Reflections on AI Engineer Summit 2023
The biggest deployment challenges, backward compatibility, multi-modality, and SF work ethic.
-
AI 엔지니어 2023 기조 연설 - LLM 시스템을 위한 빌딩 블록
AI Engineer 2023 Keynote - Building Blocks for LLM Systems
Evals, retrieval-augmented generation, guardrails, and collecting feedback; all that good stuff.
-
생성형 요약의 평가 및 환각 탐지
Evaluation & Hallucination Detection for Abstractive Summaries
Reference, context, and preference-based metrics, self-consistency, and catching hallucinations.
-
LLM 패턴을 문제에 맞추는 방법
How to Match LLM Patterns to Problems
Distinguishing problems with external vs. internal LLMs, and data vs non-data patterns
-
-
AI 시스템의 맥락 기반 검색
Contextual Retrieval in AI Systems \ Anthropic
-
효과적인 AI 에이전트 구축
Building Effective AI Agents \ Anthropic
-
Claude 3.5 Sonnet으로 SWE-bench Verified의 기준을 높이다
Raising the bar on SWE-bench Verified with Claude 3.5 Sonnet Jan 06, 2025
-
-
Claude Code: 에이전트 코딩을 위한 모범 사례 2025년 4월 18일
Claude Code: Best practices for agentic coding Apr 18, 2025
-
우리의 멀티 에이전트 연구 시스템 구축 방법
How we built our multi-agent research system Jun 13, 2025
-
Claude 데스크탑 확장: Claude 데스크탑용 원클릭 MCP 서버 설치
Claude Desktop Extensions: One-click MCP server installation for Claude Desktop \ Anthropic
-
AI 에이전트를 위한 효과적인 도구 작성하기—AI 에이전트 활용
Writing effective tools for AI agents—using AI agents \ Anthropic
-
최근 발생한 세 가지 이슈에 대한 사후 분석
A postmortem of three recent issues Sep 17, 2025
-
AI 에이전트를 위한 효과적인 컨텍스트 엔지니어링
Effective context engineering for AI agents Sep 29, 2025
-
실제 세계를 위한 에이전트 스킬
Equipping agents for the real world with Agent Skills Oct 16, 2025
-
권한 프롬프트를 넘어서: Claude Code를 더욱 안전하고 자율적으로 만들기
Beyond permission prompts: making Claude Code more secure and autonomous Oct 20, 2025
-
MCP를 사용한 코드 실행: 더 효율적인 AI 에이전트 구축
Code execution with MCP: building more efficient AI agents \ Anthropic
-
Claude 개발자 플랫폼의 고급 도구 사용 기능 소개
Introducing advanced tool use on the Claude Developer Platform Nov 24, 2025