주말 아침 - 주간 AI #21

봄의 끝자락, AI 업계는 또 한 번 거대한 분기점을 통과했습니다. OpenAI가 GPT-5.5를 정식 공개해 차세대 모델 레이스를 다시 가속했고, Anthropic은 Claude Design으로 시각 작업 영역까지 발을 넓혔으며, Google은 Gemini Enterprise Agent Platform으로 기업 에이전트 시장에 본격 참전했습니다. 도구 진영에서는 GPT-image-2의 Microsoft Foundry 탑재, Azure MCP Server의 .mcpb 번들 배포, Foundry Toolboxes, ChatGPT Workspace Agents, CodeAct Agent Framework까지 에이전트 인프라가 한 단계 더 성숙해졌고, DeepSeek V4는 프런티어 수준 성능을 파격적인 가격에 내놓아 가성비 경쟁의 판도를 흔들었습니다. 학습 자료로는 LangChain.js 무료 입문 코스, MCP Tools/Resources/Prompts 구분, Context Engineering, RAG를 넘는 관계 기반 시스템이, 인사이트 진영에서는 "Harness가 곧 제품"이라는 4대 모델사의 공통 인식, Agentic AI의 3계층과 굳이 쓸 필요 없는 순간, AI가 코드를 쓰는 시대 개발자의 가치 정의, Cursor 안정성 회고 같은 묵직한 질문들이 함께 도착했습니다. 따뜻한 커피와 함께, 이번 주 흐름을 천천히 정리해 보세요.

주말 아침 AI #21

:fire: 주요 뉴스

GPT-5.5 정식 공개 (Introducing GPT-5.5)

OpenAI가 차세대 플래그십 모델 GPT-5.5를 공개. 추론·코딩·장기 컨텍스트 처리에서 GPT-5 대비 큰 폭의 개선을 보이며, ChatGPT·API·Codex·Workspace Agents에 동시 적용. 기업용 워크플로 자동화와 멀티스텝 에이전트 실행 품질이 핵심 향상 포인트.

Anthropic, Claude Design 공개 (Introducing Claude Design by Anthropic Labs)

Anthropic이 시각·디자인 작업에 특화된 Claude Design을 공개. 자연어 지시만으로 UI 목업, 그래픽, 프레젠테이션, 다이어그램을 생성·수정하며, 텍스트 중심이던 Claude 생태계를 비주얼 워크 영역으로 확장하는 첫 본격 시도.

GitHub Copilot Individual 요금제 개편 (Changes to GitHub Copilot Individual plans)

개인 개발자용 Copilot 플랜이 재편. Free·Pro·Pro+ 티어와 에이전트·CLI·코드 리뷰 사용량 한도가 조정되며, 모델 선택권과 프리미엄 요청 쿼터가 가격에 따라 차등 적용. 프리랜서·소규모 팀의 채택 전략에 직접적인 영향을 주는 변화.

Gemini Enterprise Agent Platform 출시 (Gemini Enterprise Agent Platform lets you build, govern, and optimize your agents.)

Google Cloud가 기업용 에이전트 구축·거버넌스·최적화를 통합한 Gemini Enterprise Agent Platform을 발표. 에이전트 라이프사이클 관리, 권한·감사 통제, 성능 모니터링, 도구 연결을 한 자리에서 다루며 Foundry·Bedrock과의 정면 경쟁 구도가 확정됨.

DeepSeek V4 — 프런티어급 성능을 파격가에 (DeepSeek V4 – almost on the frontier, a fraction of the price)

DeepSeek V4가 GPT-5.5/Claude Opus 4.7에 근접한 벤치마크를 보이면서도 토큰 단가는 한 자릿수 분의 1. 오픈 가중치 라이선스와 결합되어 자체 호스팅·파인튜닝 진영에 강한 추진력을 부여. “프런티어 모델 = 저렴한 인프라” 가설의 결정적 사례.

Roo Code, IDE 시대의 종언을 선언 (Roo Code pivots to cloud-based agent, says IDEs aren't the future of coding)

인기 오픈소스 코딩 에이전트 Roo Code가 클라우드 기반 자율 에이전트로 전환. 창업자는 "IDE는 더 이상 코딩의 미래가 아니다"라고 단언하며 Cursor·Devin·Replit Agent 트렌드와 합류. 로컬 IDE 중심 워크플로의 임계점을 보여주는 상징적 이동.

:rocket: 새로운 도구/서비스

Microsoft Foundry, GPT-image-2 탑재 (Introducing OpenAI's GPT-image-2 in Microsoft Foundry)

OpenAI의 차세대 이미지 모델 GPT-image-2가 Microsoft Foundry에서 정식 제공. 텍스트 렌더링 품질, 일관된 캐릭터 유지, 편집·인페인팅이 크게 향상되며 Azure 보안·컴플라이언스 경계 안에서 호출 가능. .NET·Python SDK 즉시 지원.

Azure MCP Server, .mcpb 번들로 배포 (Azure MCP Server now available as an MCP Bundle (.mcpb))

Azure MCP Server를 MCP Bundle(.mcpb) 단일 파일로 배포 가능. Claude Desktop·VS Code 등 지원 클라이언트에서 한 번의 설치로 수백 개 Azure 도구를 즉시 활성화하며, 버전 핀·서명·의존성을 패키지가 책임지는 차세대 MCP 배포 표준의 첫 사례.

Foundry Toolboxes 공개 (Introducing Toolboxes in Foundry)

에이전트가 의도(intent)에 맞춰 필요한 도구만 동적으로 로드하는 Toolbox 개념을 Foundry에 도입. 수백 개 도구를 모두 컨텍스트에 노출하지 않고 라우팅·필터링해 토큰·지연·환각을 동시에 줄이는 실전 패턴.

ChatGPT Workspace Agents 출시 (Introducing workspace agents in ChatGPT)

팀 단위로 공유·배포 가능한 Workspace Agents가 ChatGPT에 도입. 조직 데이터·도구·권한과 묶여 동작하며 슬랙/이메일/문서 같은 일상 워크플로 안에서 호출 가능. 사내 자동화 진입 장벽을 크게 낮추는 OpenAI의 본격 기업 시장 행보.

Microsoft Foundry, Kimi K2.6 모델 추가 (Introducing Kimi K2.6 in Microsoft Foundry)

Moonshot AI의 Kimi K2.6이 Foundry 카탈로그에 합류. 초장문 컨텍스트와 도구 호출 정확도가 강점이며, Microsoft 인프라의 보안·SLA 위에서 GPT 계열·Claude 계열과 손쉬운 비교 평가가 가능해짐. 멀티 모델 전략이 Foundry의 핵심 가치로 자리매김.

CodeAct Agent Framework — 모델 호출 횟수를 줄이다 (CodeAct in Agent Framework: Faster Agents with Fewer Model Turns)

도구 호출을 텍스트 JSON 대신 실행 가능한 코드 블록으로 표현하는 CodeAct 패턴이 .NET Agent Framework에 도입. Hyperlight 마이크로 VM에서 안전 격리 실행되며, 멀티스텝 작업의 모델 턴 수와 응답 시간을 큰 폭으로 감축.

OpenAI Privacy Filter 공개 (Introducing OpenAI Privacy Filter)

프롬프트·응답 단계에서 PII를 자동 탐지·마스킹하는 Privacy Filter를 공식 제공. 기업 내 ChatGPT/Codex/Workspace Agents 사용 시 GDPR·HIPAA 대응 부담을 줄이며, 별도 미들웨어 없이 API 옵션으로 활성화 가능.

:books: 학습 자료

LangChain.js 무료 입문 코스 (LangChain.js for Beginners: A Free Course to Build Agentic AI Apps with JavaScript)

Microsoft가 공개한 LangChain.js 기반 에이전트 앱 개발 무료 강의. 체인·에이전트·툴·메모리 같은 핵심 개념을 JavaScript/TypeScript로 단계적으로 익히고, Azure OpenAI와 연동한 실전 예제까지 포함. 프런트엔드 개발자가 AI 백엔드까지 확장하기 좋은 출발점.

Context Engineering — 고품질 출력의 진짜 기술 (Context Engineering: The Real Skill Behind High-Quality AI Output)

프롬프트 엔지니어링을 넘어, 어떤 정보를 어떤 순서·형식·범위로 모델에 주입할지 설계하는 Context Engineering의 원리와 실전 패턴. 시스템 프롬프트, 검색 결과, 사용자 입력, 도구 응답을 조립하는 구조가 결국 출력 품질의 80%를 결정함을 사례로 정리.

MCP 본질 정리 — Tools / Resources / Prompts (MCP Demystified: Tools vs Resources vs Prompts Explained Simply)

MCP의 세 가지 기본 빌딩 블록인 Tools(능동 호출)·Resources(수동 데이터 노출)·Prompts(템플릿)의 차이를 직관적인 예시로 정리. 자체 MCP 서버를 설계할 때 무엇을 무엇으로 모델링해야 하는지 명확한 의사결정 기준을 제공.

로컬에서 프로덕션까지 — AI 에이전트 개발 풀 사이클 (From Local to Production: The Complete Developer Journey for Building, Composing, and Deploying AI Agents)

Foundry Toolkit·Agent Framework·Hosted Agents·Toolboxes를 묶어 로컬 프로토타입부터 프로덕션 배포·관측까지 이어지는 표준 개발 여정을 단일 시나리오로 보여주는 종합 가이드. 평가, CI/CD, 권한, 모니터링까지 전 과정을 다룸.

RAG로 부족할 때 — 관계 기반 엔터프라이즈 AI (When RAG Isn't Enough: Moving from Retrieval to Relationship-Aware Systems in Enterprise AI)

단순 벡터 검색 기반 RAG가 한계에 부딪치는 엔터프라이즈 시나리오에서, 엔티티·관계·시간 축을 그래프와 결합한 Relationship-Aware Retrieval 아키텍처를 제시. GraphRAG·온톨로지·하이브리드 인덱스 구성 패턴을 실전적으로 정리.

로컬 vs 원격 MCP 서버 — 어떤 선택? (Local vs remote MCP servers – which should you choose?)

stdio 기반 로컬 MCP 서버와 HTTP/SSE 기반 원격 MCP 서버의 장단점을 보안·지연·배포·관측 관점에서 비교. 개인 워크스테이션 도구는 로컬, 공유·SaaS·중앙 통제가 필요한 도구는 원격이라는 결정 기준을 명확히 제시.

:light_bulb: 인사이트

"Harness가 곧 제품" — 가격은 다르다 (Anthropic, OpenAI, Google, and Microsoft agree that the harness is the product. They disagree on the price.)

4대 모델 공급사가 공통적으로 "모델 자체보다 도구·메모리·권한·UX를 묶은 Harness가 진짜 제품"이라는 입장으로 수렴. 그러나 토큰 종량제, 좌석 라이선스, 작업 단위 과금 등 가격 모델은 서로 정반대 방향으로 갈리며 향후 1~2년 시장 구도를 좌우할 전망.

Agentic AI의 3계층 — 그리고 쓰지 않을 때 (Three tiers of Agentic AI – and when to use none of them)

단일 LLM 호출 / 워크플로 오케스트레이션 / 자율 에이전트 3단계로 분류하고, 각 계층의 비용·신뢰성·디버깅 난이도를 비교. 결정적·고빈도·낮은 가치 작업은 오히려 에이전트를 쓰지 말라는 균형 잡힌 권고가 핵심 메시지.

AI 도입 시 개발자가 흔히 저지르는 10가지 실수 (Top 10 Mistakes Developers Make When Adopting AI)

평가 없이 모델만 교체, 프롬프트 버전 관리 부재, 토큰 비용 미측정, 기능 플래그 없는 LLM 호출, 보안 경계 무시 등 현장에서 반복되는 안티패턴을 10가지로 정리. 각 항목별 즉시 적용 가능한 교정 패턴 포함.

코드를 AI가 쓸 때, 개발자의 가치는 무엇인가 (How do developers define their worth when code is written by AI?)

Christian Heilmann이 던지는 정체성 질문. 코드 라인 수가 더 이상 가치 척도가 될 수 없는 시대, 문제 정의·아키텍처·검증·커뮤니케이션·접근성이 새로운 핵심 역량으로 부상. 시니어·주니어 모두에게 직접 와닿는 직업론.

Cursor 안정성 회고 (Keeping the Cursor app stable)

폭발적 성장으로 인한 메모리 누수, 워크스페이스 인덱싱 폭주, 에이전트 백그라운드 작업 충돌을 해결한 과정을 공개. 텔레메트리·크래시 분류·롤백 파이프라인을 어떻게 정비했는지가 코드 에이전트 운영팀에 직접적인 참고 자료가 됨.

내 Claude Code 워크플로 (My Claude Code Workflow)

Rocky Lhotka가 공유하는 일상 Claude Code 사용법. 프로젝트별 시스템 프롬프트, 컨텍스트 파일 큐레이션, 작업 단위 분해, 변경 검토 단계, 커밋 전 체크리스트까지 — 한 명의 시니어 개발자가 실제로 어떻게 에이전트와 협업하는지 그대로 담은 케이스 스터디.

1 Like