-
언어 모델링 논문 목록 (논문 클럽 시작하기)
Language Modeling Reading List (to Start Your Paper Club)
Some fundamental papers and a one-sentence summary for each; start your own paper club!
-
2023년 연간 회고
2023 Year in Review
An expanded charter, lots of writing and speaking, and finally learning to snowboard.
-
푸시 알림: 무엇을 보내고, 무엇을 피하고, 얼마나 자주 보낼지
Push Notifications: What to Push, What Not to Push, and How Often
Sending helpful & engaging pushes, filtering annoying pushes, and finding the frequency sweet spot.
-
도메인 외 파인튜닝을 통한 환각 탐지 부트스트래핑
Out-of-Domain Finetuning to Bootstrap Hallucination Detection
How to use open-source, permissive-use data and collect less labeled samples for our tasks.
-
2023 AI 엔지니어 서밋 회고
Reflections on AI Engineer Summit 2023
The biggest deployment challenges, backward compatibility, multi-modality, and SF work ethic.
-
AI 엔지니어 2023 기조 연설 - LLM 시스템을 위한 빌딩 블록
AI Engineer 2023 Keynote - Building Blocks for LLM Systems
Evals, retrieval-augmented generation, guardrails, and collecting feedback; all that good stuff.
-
생성형 요약의 평가 및 환각 탐지
Evaluation & Hallucination Detection for Abstractive Summaries
Reference, context, and preference-based metrics, self-consistency, and catching hallucinations.
-
LLM 패턴을 문제에 맞추는 방법
How to Match LLM Patterns to Problems
Distinguishing problems with external vs. internal LLMs, and data vs non-data patterns
-
-
AI 시스템의 맥락 기반 검색
Contextual Retrieval in AI Systems \ Anthropic
-
효과적인 AI 에이전트 구축
Building Effective AI Agents \ Anthropic
-
Claude 3.5 Sonnet으로 SWE-bench Verified의 기준을 높이다
Raising the bar on SWE-bench Verified with Claude 3.5 Sonnet Jan 06, 2025
-
-
Claude Code: 에이전트 코딩을 위한 모범 사례 2025년 4월 18일
Claude Code: Best practices for agentic coding Apr 18, 2025
-
우리의 멀티 에이전트 연구 시스템 구축 방법
How we built our multi-agent research system Jun 13, 2025
-
Claude 데스크탑 확장: Claude 데스크탑용 원클릭 MCP 서버 설치
Claude Desktop Extensions: One-click MCP server installation for Claude Desktop \ Anthropic
-
AI 에이전트를 위한 효과적인 도구 작성하기—AI 에이전트 활용
Writing effective tools for AI agents—using AI agents \ Anthropic
-
최근 발생한 세 가지 이슈에 대한 사후 분석
A postmortem of three recent issues Sep 17, 2025
-
AI 에이전트를 위한 효과적인 컨텍스트 엔지니어링
Effective context engineering for AI agents Sep 29, 2025
-
실제 세계를 위한 에이전트 스킬
Equipping agents for the real world with Agent Skills Oct 16, 2025
-
권한 프롬프트를 넘어서: Claude Code를 더욱 안전하고 자율적으로 만들기
Beyond permission prompts: making Claude Code more secure and autonomous Oct 20, 2025
-
MCP를 사용한 코드 실행: 더 효율적인 AI 에이전트 구축
Code execution with MCP: building more efficient AI agents \ Anthropic
-
Claude 개발자 플랫폼의 고급 도구 사용 기능 소개
Introducing advanced tool use on the Claude Developer Platform Nov 24, 2025
-
장시간 실행 에이전트를 위한 효과적인 하네스
Effective harnesses for long-running agents Nov 26, 2025
-
AI 에이전트 평가(Evals) 신비 벗기기
Demystifying evals for AI agents Jan 09, 2026
-
AI 저항성 기술 평가 설계
Designing AI-resistant technical evaluations Jan 21, 2026
-
병렬 처리 Claude 팀으로 C 컴파일러 구축하기
Building a C compiler with a team of parallel Claudes Feb 05, 2026
-
에이전트 코딩 평가에서 인프라 노이즈 정량화
Quantifying infrastructure noise in agentic coding evals Feb 05, 2026
-
Claude Opus 4.6의 BrowseComp 성능에서의 평가 인식 (2026년 3월 6일)
Eval awareness in Claude Opus 4.6’s BrowseComp performance Mar 06, 2026
-
장기 실행 애플리케이션 개발을 위한 하네스 설계
Harness design for long-running application development Mar 24, 2026