PickleeAI와 개발에 대한 짧은 노트
홈아티클아카이브검색

끝까지 읽는 글

AI와 개발에 관한 변화 중에서 블로그처럼 오래 읽을 수 있는 글만 골라 정리합니다.

© 2026 Picklee

RSSSitemap

글

2026년 1월 28일수정 2026년 2월 3일원문

Gemini 3 Flash - Agentic Vision

Google의 Gemini 3 Flash에 추가된 Agentic Vision 기능. 이미지를 단순히 '보는' 게 아니라 Think→Act→Observe 루프로 능동적으로 '조사'함. 코드 실행으로 이미지를 확대/크롭/분석하며 추론 근거를 시각적으로 제시. 비전 벤치마크에서 5-10% 성능 향상. GPQA Diamond 90.4%, SWE-bench 78% 달성.

트렌드
API

Gemini 3 Flash - Agentic Vision

핵심 컨셉: 이미지를 단순히 '보는' 것이 아니라 능동적으로 '조사'하는 새로운 비전 패러다임

작동 방식 - Think→Act→Observe 루프:

  1. Think: 이미지 분석 계획 수립
  2. Act: 코드 실행으로 이미지 확대/크롭/주석 추가
  3. Observe: 결과를 컨텍스트에 추가하여 추론 근거 시각화

주요 기능:

  • 코드 실행 기반 이미지 조작: Python으로 직접 캔버스에 그리기
  • 고해상도 입력 반복 검사: 특정 패치를 크롭해 새 이미지로 분석
  • 시각적 근거 제시: 추론 과정을 이미지에 직접 표시

성능:

  • 비전 벤치마크 5-10% 성능 향상
  • GPQA Diamond: 90.4%
  • SWE-bench Verified: 78%
  • Humanity's Last Exam: 33.7%

실제 사례: PlanCheckSolver.com - 건축 도면 검증 플랫폼에서 코드 실행으로 5% 정확도 향상

사용처: Google AI Studio, Vertex AI API, Gemini 앱(Thinking 모드 선택)

더 읽기

같이 읽어볼 만한 글

전체 글 보기
2026년 4월 30일

Prepay for the Gemini API to get more control over your spend — 에이전트 경제성이 기능보다 먼저 제품 표면으로 올라오다

Google은 2026년 4월 15일 Google AI Studio용 Gemini API Prepay Billing을 발표했다. 신규 Google Cloud Billing Account를 여는 미국 사용자부터 선불 크레딧 기반 결제를 쓸 수 있고, 자동 충전과 함께 남은 잔액을 기준으로 API 호출 비용을 관리하게 해 spend predictability를 높이겠다는 내용이다. 🔍 왜…

2026년 4월 12일

SQL MCP Server 공개 — 데이터베이스 연결이 NL2SQL 실험에서 통제형 agent interface로 이동한다

Microsoft는 2026년 4월 8일 SQL MCP Server를 공개했다. Data API builder 기반의 이 서버는 Microsoft SQL, PostgreSQL, Azure Cosmos DB, MySQL을 지원하며, RBAC·Key Vault·OpenTelemetry·REST/GraphQL/MCP 동시 노출과 함께 AI agent용 고정 DML 도구 집합을 제공한다. 🔍 왜…

2026년 4월 11일

Azure MCP Server 2.0 stable — MCP가 로컬 개발 편의 기능을 넘어 중앙 통제형 클라우드 운영 인터페이스가 되다

Microsoft는 2026년 4월 10일 Azure MCP Server 2.0 stable을 발표했다. 이번 릴리즈는 57개 Azure 서비스에 걸친 276개 MCP tools를 제공하며, 핵심 변화로 self-hosted remote MCP server, managed identity·OBO 기반 인증, 보안 강화, sovereign cloud 대응을 내세웠다. 🔍 왜 주목해야 하나…

2026년 4월 11일

Dataverse Skills 공개 — 엔터프라이즈 로우코드 플랫폼이 이제 '에이전트가 조작 가능한 시스템'이 되기 시작했다

Microsoft는 2026년 4월 1일 Dataverse Skills를 공개했다. GitHub Copilot과 Claude Code용 오픈소스 플러그인으로, Dataverse 환경 탐색, PAC CLI 인증, MCP 등록, 스키마 설계, 데이터 적재, 분석 질의를 자연어 기반 에이전트 루프로 묶는다. 🔍 왜 주목해야 하나 이 발표의 본질은 로우코드 플랫폼도 이제 사람 UI가 아니라…