주말 아침 - 주간 AI #10

dimohy · 2월 8, 2026, 2:18오후

GitHub Agent HQ에서 Copilot·Claude·Codex 멀티 에이전트 시대가 열리고, Claude Opus 4.6이 Microsoft Foundry에서 1M 토큰 컨텍스트와 함께 출격합니다. VS Code 1.109는 멀티 에이전트 개발 플랫폼으로 진화하고, Martin Fowler 사이트에서는 코딩 에이전트 컨텍스트 엔지니어링의 종합 가이드가 공개됩니다. OpenAI는 단일 PostgreSQL로 10억 사용자를 처리한 스케일링 비결과 Codex App Server 아키텍처를 공개하고, Anthropic은 Claude를 광고 없는 '사고의 공간’으로 선언합니다. Docker 3Cs 에이전트 보안 프레임워크, O’Reilly의 AI ‘파일럿 연옥’ 탈출 전략, AI 보조 프로그래밍 산출물 필수론, Fractal Architecture 통찰, 그리고 '바이브 코딩이 아닌 에이전틱 엔지니어링’이라는 새로운 프레임까지 — AI 개발의 최전선을 한눈에 만나보세요.

주요 뉴스

기술의 사춘기 — Dario Amodei (Anthropic CEO)

Anthropic CEO가 AI의 4대 리스크를 체계적으로 분석한 대형 에세이입니다. AI 자율성(모델 오정렬), 대량파괴무기 오용, 권위주의 권력 장악, 경제적 일자리 대체까지 — 각 위험에 대한 방어 전략을 제시합니다. Constitutional AI를 통해 Claude의 '인격’을 형성하고, 해석가능성(Interpretability) 연구로 모델 내부를 들여다보는 Anthropic의 접근법이 인상적이며, 1~2년 내 노벨상 수상자를 능가하는 AI가 도래할 수 있다고 경고합니다.

Claude Agent SDK와 Microsoft Agent Framework로 AI 에이전트 구축하기

Microsoft Agent Framework에 Claude Agent SDK가 Python으로 통합되었습니다. Claude 에이전트와 Azure OpenAI 에이전트를 하나의 순차/병렬/핸드오프 워크플로우에서 조합할 수 있으며, MCP 서버 연결, 파일 편집, 코드 실행, 스트리밍 응답 등 Claude의 에이전트 기능을 일관된 BaseAgent 인터페이스로 활용할 수 있습니다.

OpenAI Codex 데스크톱 앱 출시 — 에이전트 커맨드 센터

OpenAI가 macOS용 Codex 데스크톱 앱을 공개했습니다. 여러 에이전트를 병렬로 실행·관리하는 '커맨드 센터’로, worktree를 활용해 같은 레포에서 충돌 없이 동시 작업이 가능합니다. Skills로 코드 생성을 넘어 Figma 디자인 구현, Linear 프로젝트 관리, Vercel/Cloudflare 배포까지 확장하고, Automations로 이슈 트리아지·CI 실패 요약 등 반복 작업을 자동 스케줄링합니다. GPT-5.2-Codex 이후 월 100만+ 개발자가 사용 중이며, ChatGPT Free/Go에도 한시적 개방합니다.

OpenAI, 단일 PostgreSQL로 10억 사용자 처리 — 대규모 스케일링의 비결

OpenAI가 단일 PostgreSQL 인스턴스와 50개 읽기 복제본으로 약 10억 사용자까지 확장한 대규모 엔지니어링 성과입니다. 쓰기 집중 워크로드는 Azure Cosmos DB에 위임하고, 안정성을 위해 메인 DB에 더 이상 테이블을 추가하지 않는 전략을 채택했습니다.

GitHub Agent HQ — Copilot·Claude·Codex 멀티 에이전트 플랫폼

GitHub Agent HQ에서 Copilot, Claude(Anthropic), Codex(OpenAI)를 직접 사용할 수 있습니다. 이슈·PR에 여러 에이전트를 할당해 접근법을 비교하고, VS Code에서 로컬/클라우드/백그라운드 세션을 선택할 수 있습니다. 에이전트 출력은 드래프트 PR로 제출되어 기존 코드 리뷰 워크플로우와 자연스럽게 통합되며, Google·Cognition·xAI 등 더 많은 에이전트가 추가 예정입니다.

Claude Opus 4.6, Microsoft Foundry(Azure)에서 출시 — 코딩·에이전트·엔터프라이즈 워크플로우의 새 기준

Anthropic의 최강 모델 Claude Opus 4.6이 Microsoft Foundry(Azure)에 출시되었습니다. 1M 토큰 컨텍스트 윈도우(베타), 128K 최대 출력, 적응형 사고(Adaptive Thinking), 컨텍스트 압축(Context Compaction) 등 새로운 API 기능과 함께, 자율 코딩·엔터프라이즈 지식 업무·에이전트 워크플로우·컴퓨터 사용에서 혁신적 성능을 보여줍니다. Foundry의 거버넌스·보안·확장성과 결합하여 실험에서 프로덕션으로의 전환을 가속합니다.

새로운 도구/서비스

ZingIt: 클릭 한 번으로 AI가 UI를 수정 — GitHub Copilot SDK 활용기

브라우저에서 UI 요소를 클릭하고 수정 지시를 내리면, AI가 코드베이스에서 해당 파일을 찾아 자동으로 편집해주는 ZingIt 도구입니다. GitHub Copilot SDK의 세션 관리, 스트리밍, 이미지 첨부 기능을 활용했으며, Claude Code와 OpenAI Codex도 지원합니다. frame.io의 마커 개념에서 영감을 받아, 개발자가 UI 버그를 설명하는 번거로움을 획기적으로 줄였습니다.

Microsoft Work IQ (퍼블릭 프리뷰) — M365 데이터를 자연어로 조회하는 MCP 서버

이메일, 회의, 문서, Teams 메시지 등 Microsoft 365 데이터를 자연어로 질의할 수 있는 CLI/MCP 서버입니다. “이번 주 회의 일정은?”, “Sarah가 예산 관련해서 보낸 이메일 요약해줘” 같은 질문이 가능하며, VS Code, GitHub Copilot CLI 등과 연동됩니다.

MCP 서버와 Dynamic Tool Routing으로 AI 운영 에이전트 구축하기

Microsoft Agents SDK + Azure OpenAI로 Policy MCP 서버(Azure Blob Storage)와 Orders MCP 서버(Azure SQL)를 하나의 에이전트에 연결하는 실전 워크숍입니다. AG-UI로 도구 호출 인수·결과를 실시간 스트리밍하여 "블랙박스 문제"를 해결하고, 상태 변경 작업(주문 수정 등)에는 Human-in-the-Loop 승인 카드를 UI에 표시하여 안전성을 확보합니다. 공급망 자동화 시나리오에서 MCP를 도메인 경계로 활용하는 패턴이 인상적입니다.

3Cs: AI 에이전트 보안 프레임워크 (Docker)

AI 에이전트가 머신 속도로 코드 수정·API 호출·크레덴셜 사용을 수행하면서 기존 보안 체계가 무력화되는 '무인 노트북 문제’를 지적합니다. Docker가 제안하는 3Cs: Contain(폭발 반경 제한으로 실험 안전성 확보), Curate(에이전트 환경을 사전에 의도적으로 구성), Control(런타임 정책으로 실시간 경계 적용)으로 수동 승인 없이도 안전한 자율 실행을 가능하게 합니다.

Claude는 사고의 공간 — Anthropic의 광고 없는 AI 선언

Anthropic이 Claude에 광고를 넣지 않겠다고 공식 선언했습니다. AI 대화는 검색과 달리 민감하고 개인적이어 광고가 부적절하며, 광고 기반 모델은 '진정한 도움’보다 거래 기회에 편향될 수 있다고 판단합니다. 기업 계약과 유료 구독으로 수익을 창출하며, 에이전트 커머스(사용자 대리 구매)는 지원하되, AI의 응답이 광고주가 아닌 사용자를 위해서만 작동하는 '사고의 공간’을 유지합니다.

VS Code, 멀티 에이전트 개발의 본거지로 — Claude·Codex 에이전트 통합

VS Code 1.109에서 GitHub Copilot과 함께 Claude·Codex 에이전트를 로컬·클라우드·백그라운드로 실행할 수 있습니다. Agent Sessions 뷰에서 모든 에이전트 세션을 한 곳에서 관리하고, 서브에이전트 병렬 실행으로 복잡한 작업을 분산 처리합니다. MCP Apps로 채팅 안에 인터랙티브 UI를 렌더링하고, Agent Skills를 확장 기능으로 패키징·배포할 수 있어 에디터가 멀티 에이전트 오케스트레이션 플랫폼으로 진화합니다.

학습 자료

LLM이 계속 좋아지는 비결 — 수백 가지 작은 개선의 합

Transformer 아키텍처는 2017년과 거의 동일하지만, 세부적으로는 모든 것이 변했습니다. Thinking 모델, 도구 사용, 128K+ 컨텍스트 윈도우, Mixture of Experts, FP4 데이터 타입, Flash Attention 3, GQA/MLA, 합성 데이터, 더 나은 옵티마이저까지 — 수십 가지 차원에서의 Hill climbing이 큰 성능 도약을 만들어내는 과정을 상세히 분석합니다.

Foundry Local로 로컬 AI 모델 과학적 벤치마킹하기

Foundry Local SDK + Node.js + React로 구축하는 로컬 AI 모델 벤치마킹 플랫폼 FLPerformance를 소개합니다. TTFT(첫 토큰까지 시간), TPOT(토큰당 시간), p50/p95/p99 레이턴시 분포 등 다차원 성능을 과학적으로 측정하고, 실제 배포 하드웨어에서 워크로드 패턴에 맞는 모델을 데이터 기반으로 선택하는 방법을 다룹니다.

책임감 있는 개발자를 위한 AI 코딩 도구 실전 활용법

Copilot, Cursor, Claude, ChatGPT를 실무에서 2년간 활용한 경험을 바탕으로 한 실전 가이드입니다. 레거시 코드베이스 이해, 의존성 업그레이드 시 braking change 해결, 리팩터링 일괄 적용, GLSL 같은 생소한 기술 구현, 테스트 작성까지 — "시작하기 전에 질문 있나요?"라는 프롬프트 테크닉과 함께 AI 결과물을 반드시 검증해야 하는 ‘책임감 있는 개발자’ 원칙을 강조합니다.

GitHub Copilot 에이전트 모드 극대화 가이드

시니어 엔지니어 관점에서 Copilot 에이전트 모드를 활용한 시스템 설계·분해, 태깅 서브시스템 구현, 안전한 스키마 마이그레이션, 검증 레이어 리팩터링, 테스트 전략 현대화까지 엔드투엔드 워크플로우를 다룹니다. GitHub Skills 연습 모듈과 함께, Copilot을 자동완성 도구가 아닌 아키텍처 수준의 협업 파트너로 전환하는 구체적인 프롬프트와 실전 패턴을 제시합니다.

Codex App Server 아키텍처 해부 — 단일 하니스, 멀티 클라이언트

Codex CLI, VS Code 확장, 데스크톱 앱, 웹 런타임이 모두 동일한 에이전트 하니스를 공유하는 App Server의 아키텍처를 해부합니다. JSON-RPC over stdio 프로토콜, Item→Turn→Thread 3계층 대화 프리미티브, 도구 실행 시 Human-in-the-Loop 승인 플로우까지 — Rust로 구현된 codex-core가 모든 에이전트 로직을 담당하며, JetBrains·Xcode 등 파트너 통합에도 사용됩니다.

코딩 에이전트를 위한 컨텍스트 엔지니어링 — Martin Fowler

Thoughtworks의 Birgitta Böckeler가 Martin Fowler 블로그에 기고한 코딩 에이전트 컨텍스트 설정 종합 가이드입니다. 재사용 가능한 프롬프트(Instructions vs Guidance), 컨텍스트 인터페이스(Tools·MCP·Skills), 컨텍스트 크기 관리 전략을 체계적으로 정리하고, Claude Code를 예시로 CLAUDE.md·Rules·Skills·Subagents·Hooks·Plugins까지 각 기능의 역할과 사용 시점을 명확히 구분합니다. "통제의 환상"에 대한 경고도 인상적입니다.

인사이트

동작하는 MCP Apps 구축을 위한 5가지 팁

MCP Apps는 에이전트 인터페이스 안에 인터랙티브 UI를 직접 렌더링하는 공식 MCP 확장입니다. goose, Claude, ChatGPT, Postman이 이미 지원하는 가운데, 호스트 환경 테마/로케일 적응, 모델과 뷰 간 데이터 흐름 제어(content vs structuredContent), 로딩/에러 상태 처리, sendMessage와 updateModelContext로 모델 동기화, 도구 호출 권한(model-only vs app-only) 분리 등 실전 구축 노하우를 정리합니다.

Microsoft, Windows 11의 AI 과잉 투입을 축소 — Copilot 통합 줄이고 Recall 재검토

Microsoft가 Windows 11의 AI 전략을 재평가하며, Copilot 통합을 줄이고 논란이 컸던 Recall 기능을 재설계하기로 했습니다. 사용자 피드백에 따라 AI 기능의 과잉 투입보다는 실질적이고 절제된 접근으로 전환하는 중대한 방향 전환입니다.

Context Window에 맞는 코드 — AI 시대에 재조명하는 Fractal Architecture

“Code That Fits in Your Head” 저자 Mark Seemann이 자신의 핵심 가설을 LLM 시대에 재해석합니다. 인간의 작업 기억이 7±2개로 제한되듯, LLM의 컨텍스트 윈도우도 한계가 있어 코드베이스가 커질수록 AI가 기존 코드를 깨뜨립니다. 각 추상화 수준에서 소수의 부분만으로 구성하는 Fractal Architecture가 인간뿐 아니라 AI에게도 유효할 수 있다는 통찰을 던집니다.

시니어 개발자가 Cursor를 프로덕션급 AI 에이전트로 바꾸는 법

Cursor를 단순 챗봇이 아닌 ‘컨텍스트 오케스트레이션’ 시스템으로 활용하는 5단계 프레임워크입니다. .cursor/rules/로 모듈별 규칙 분리, Slash Commands로 재사용 가능한 워크플로우 트리거, Skills로 실행 가능한 도구 확장, Subagents로 복잡한 사고 위임, 그리고 Maker→Checker 'Two-Pass Protocol’로 AI가 만든 코드를 다른 페르소나가 재검토하여 오류를 90% 줄이는 실전 워크플로우를 제시합니다.

AI 보조 프로그래밍에서 산출물(Artifacts)의 중요성

ESLint 창시자 Nicholas Zakas가 "바이브 코딩"의 한계를 지적합니다. AI 페어 프로그래머는 기억이 없으므로, PRD(요구사항), ADR(아키텍처 결정 기록), TDD(기술 설계 문서), 태스크 리스트 등 체계적 산출물이 필수입니다. “나중에 저장” 기능의 Redis 캐시 TTL 누락 버그를 예시로, 산출물이 없으면 AI가 만든 문제의 근본 원인을 추적할 수 없음을 보여줍니다.

파일럿 연옥을 넘어서 — 엔터프라이즈 AI 스케일링의 현실적 프레임워크 (O'Reilly)

MIT NANDA 보고서에 따르면 기업 GenAI 파일럿의 95%가 측정 가능한 비즈니스 임팩트를 내지 못합니다. ‘파일럿 연옥’ 탈출의 핵심은 플랫폼 팀의 프로덕트 사고, 임베디드 AI 전문가, 동적 거버넌스, 역량 구축의 결합입니다. JPMorganChase·Walmart·Uber 등 성공 사례의 공통 패턴 — 조직 설계 문제로 접근하여 18~24개월의 현실적 타임라인을 받아들이는 전략을 분석합니다.

바이브 코딩이 아니다: 에이전틱 엔지니어링

Addy Osmani의 ‘Agentic Engineering’ 에세이를 소개하며, 바이브 코딩과 에이전틱 엔지니어링의 본질적 차이를 구분합니다. 바이브 코딩은 프롬프트→수용→실행의 YOLO 방식이지만, 에이전틱 엔지니어링은 AI가 구현을 맡고 인간이 아키텍처·품질·정확성을 소유하는 접근입니다. 월 $100+ AI 도구에 투자하고, 요청 전 계획·분해에 시간을 쏟는 전문 개발자들이 2~5배 이상의 생산성 향상을 얻는 이유를 설명합니다.