아카이브
최신 글을 차례대로 훑기 쉽게 정리했습니다. 제목, 날짜, 짧은 설명부터 읽고 필요할 때만 태그나 카테고리로 더 좁혀볼 수 있습니다.
현재 보기
37개 글 · #무료
NVIDIA가 공개한 한국어 합성 페르소나 데이터셋으로, 한국의 공개 통계와 지역·직업·교육 등 사회적 분포를 바탕으로 100만 개 규모의 페르소나 레코드를 구성한 자료다. 한국어 모델 학습과 시뮬레이션에서 한국형 맥락을 반영하는 데 참고할 수 있다. 소버린 AI, 한국어 LLM 학습, 합성 데이터 다양성 확대 관점에서 볼 만하다. 영어권 중심 페르소나 데이터셋으로는 놓치기 쉬운 지역성과…
Voicebox는 음성 복제, 다국어 TTS, 후처리 효과, 멀티 보이스 편집을 한곳에서 다루는 로컬 우선 음성 합성 스튜디오다. 클라우드형 음성 서비스의 대안으로 제시되며, 여러 TTS 엔진을 바꿔가며 테스트하고 REST API로 앱에 붙일 수 있게 설계됐다. 볼 만한 이유는 단순한 모델 데모가 아니라 실제 제작 워크플로우에 가까운 구조를 갖췄기 때문이다. 몇 초짜리 샘플로 보이스…
코드(25개 언어), 문서, 논문, 이미지, 비디오 등 다양한 파일을 분석해 쿼리 가능한 지식 그래프로 변환하는 AI 어시스턴트 스킬. Tree-sitter AST로 코드 구조를 추출하고, Claude Vision으로 이미지를 분석하며, faster-whisper로 영상/오디오를 로컬 변환한다. 원본 대비 71.5배 토큰 감소. GitHub 스타 26.6k. 🔍 왜 주목해야 하나 AI…
Apple Silicon용 Gemma 4 26B 기반 MLX 4-bit 모델 카드. 텍스트 중심 로컬 에이전트 작업을 겨냥한 빠른 추론형 변형으로 소개된다.
colleague.skill은 특정 동료의 업무 방식과 표현 톤을 스킬 형태로 정리해 재사용할 수 있게 만드는 오픈소스 프로젝트다. /create-colleague 명령으로 새 스킬을 만들고, 생성된 페르소나를 /{slug} 형태로 호출해 반복 작업에 적용한다. 프롬프트를 매번 복붙하는 대신, 팀 내부의 암묵지와 일 스타일을 에이전트가 읽는 재사용 가능한 인터페이스로 바꾸려는 시도이기…
designmd.ai는 AI 코딩 도구가 읽을 수 있는 DESIGN.md 포맷 기반 디자인 시스템을 모아 검색·공유하는 레지스트리다. 100개 이상의 무료 디자인 시스템을 탐색하고 포맷 문서, MCP, CLI 문맥까지 함께 볼 수 있게 구성돼 있다. 프롬프트와 이미지 레퍼런스에 흩어져 있던 디자인 컨텍스트를 Markdown 명세로 묶어, AI가 더 일관되게 UI를 생성하도록 돕는 흐름을…
TypeUI는 AI가 생성한 UI 코드 위에 일관된 시각 규칙을 덧입히기 위한 CLI이자 디자인 스킬 레지스트리다. pull·generate·update 흐름으로 스킬을 프로젝트에 주입하고, 무료 스킬과 상용 기능을 함께 제공한다. AI 코딩의 문제를 단순히 더 많이 생성하는 것이 아니라, 여러 에이전트와 작업자가 섞여도 같은 시각 언어를 유지하게 만드는 데 초점을 둔 도구라는 점이…
양자화나 증류 없이 70B 모델을 4GB GPU에서, Llama 3.1 405B를 8GB VRAM에서 실행할 수 있는 추론 최적화 라이브러리. 계층별 모델 분해(layer-wise decomposition)로 필요한 레이어만 메모리에 로드하는 방식. 블록 단위 양자화 압축으로 3배 속도 향상. GitHub 스타 15k+. 🔍 왜 주목해야 하나 대부분의 LLM 최적화는 모델 자체를 줄이는…
3월 31일 Anthropic Claude Code의 TypeScript 소스코드 약 51만 2천 줄이 npm 레지스트리에 실수로 노출된 사건을 계기로, 개발자 Sigrid Jin이 클린룸 방식으로 오픈소스 AI 코딩 에이전트 프레임워크 Claw Code를 출시했다. 출시 첫날 72,000 GitHub stars를 기록하고 일주일 만에 100K를 돌파하며 역사상 가장 빠르게 성장한 AI…
Google이 4월 2~3일 Gemma 4를 Apache 2.0 라이선스로 공개했다. Effective 2B·4B·26B MoE·31B Dense 네 가지 크기로 제공되며, 256K 토큰 컨텍스트, 비전·오디오 네이티브 멀티모달, 140개 이상 언어를 지원한다. 🔍 왜 주목해야 하나 Gemma 4는 Gemini 3와 동일한 연구 기반으로 제작됐으면서 상업 제한 없는 Apache 2.0으로…
PrismML이 4월 3일 스텔스에서 등장해 세계 최초 상업적으로 실행 가능한 1-bit LLM 패밀리 Bonsai를 Apache 2.0으로 공개했다. 플래그십인 Bonsai 8B는 1.15GB 메모리에 구동되며, FP16 8B 모델 대비 14배 소형·8배 빠른 속도·5배 낮은 에너지 소비를 달성하면서 추론 품질은 동급 수준을 유지한다. 🔍 왜 주목해야 하나 1-bit LLM은…
2D 캔버스 기반 AI 작업공간. Canvas는 웹에서 쓰고, 별도 FlowithOS는 Mac/Windows 데스크톱 앱을 제공한다. 다만 공식 자료상 셀프호스팅/오프라인 실행 안내는 없고, 계정 로그인 기반으로 동작한다.
Google이 Gemini Code Assist를 개인 개발자에게 완전 무료로 전면 개방했다. Gemini 2.5 기반으로 VS Code, JetBrains, Android Studio를 지원하며 일 6,000회 코드 요청과 240회 채팅이 무료로 제공된다. 신용카드 없이 개인 Gmail 계정으로 즉시 이용 가능하다. 🔍 왜 주목해야 하나 GitHub Copilot(월 $10~$19)이…
Y Combinator 회장 Garry Tan이 만든 Claude Code 기반 AI 소프트웨어 팩토리. 23개의 전문화된 AI 역할(경영진, 엔지니어링, 디자인, QA, 보안 등)을 조합해 10~15개 스프린트를 병렬로 돌린다. 60일간 60만 줄 프로덕션 코드 산출, 일일 1~2만 줄 생산량. GitHub 스타 60.1k. 🔍 왜 주목해야 하나 YC 회장이 풀타임으로 YC를 운영하면서…
여러 AI 에이전트를 하나의 회사 조직처럼 구성하고 운영하는 오픈소스 오케스트레이션 플랫폼. 조직도, 목표 정렬, 예산 관리, 거버넌스(승인 게이트, 롤백, 감사 로그)까지 갖추고 있다. "OpenClaw이 직원이라면 Paperclip은 회사다." GitHub 스타 42.8k. 🔍 왜 주목해야 하나 AI 에이전트 생태계가 개별 에이전트 성능 경쟁을 넘어 '에이전트 간 협업과 조직…
Mistral AI가 3월 26일 오픈소스 텍스트-음성 변환 모델 Voxtral TTS(4B 파라미터)를 출시했다. 9개 언어를 지원하고 5초 이하의 음성 샘플로 목소리를 복제하며, 첫 오디오 출력 지연(TTFA)이 90ms에 불과해 실시간 음성 에이전트 구현이 가능하다. 🔍 왜 주목해야 하나 TTS 시장은 ElevenLabs, Deepgram, OpenAI가 독점하다시피 한 유료 API…
Alibaba가 0.8B, 2B, 4B, 9B 파라미터 4종의 Qwen 3.5 소형 모델을 Apache 2.0 라이선스로 공개했다. 9B 모델이 GPQA Diamond 벤치마크에서 81.7점을 기록해 GPT-OSS-120B(71.5점)를 13.6% 앞질렀다. 🔍 왜 주목해야 하나 9B 모델이 120B 규모 모델을 정확도에서 앞선다는 것은 단순한 스케일업이 아닌 아키텍처·학습 데이터…
프랑스 Mistral AI가 공개한 22B 파라미터의 Mistral Small 4가 추론 및 지시 수행 벤치마크에서 자신보다 3~5배 큰 클로즈드 모델들을 앞질렀다. Apache 2.0 라이선스로 제공되며 상업적 이용도 자유롭다. 🔍 왜 주목해야 하나 22B 모델이 60B~100B급 클로즈드 모델과 동급이거나 우세하다는 것은 오픈소스 진영의 기술력이 클로즈드 생태계를 본격적으로 위협하는…
Mistral AI가 3월 중순 출시한 Mistral Small 4는 119B 파라미터 Mixture-of-Experts(MoE) 구조의 오픈소스 모델로, Apache 2.0 라이선스 하에 상업적 무제한 사용이 가능하며 토큰당 활성 파라미터는 6B에 불과해 추론 속도가 매우 빠르다. 🔍 왜 주목해야 하나 기존 오픈소스 모델들이 성능과 라이선스 유연성 사이에서 트레이드오프를 강요받아…
chenglou(React 초기 멤버, ReasonML 창시자)가 만든 다국어 텍스트 측정 및 레이아웃 라이브러리. DOM의 getBoundingClientRect 같은 비싼 측정을 완전히 우회하고, 순수 산술 계산만으로 텍스트 높이와 라인 레이아웃을 처리한다. GitHub 스타 13.9k. 🔍 왜 주목해야 하나 브라우저 텍스트 레이아웃의 고질적 문제인 layout thrashing을…
Alibaba가 Qwen 3.5 Small 시리즈(0.8B·2B·4B·9B)를 Apache 2.0 라이선스로 오픈소스 공개했다. 9B 모델의 GPQA 점수 81.7로 OpenAI의 GPT-OSS-120B(71.5)를 벤치마크에서 앞질렀다. 🔍 왜 주목해야 하나 파라미터 수 대비 추론 성능의 효율이 극적으로 개선되고 있다는 증거다. 9B 모델이 120B를 이긴다는 것은 단순 스케일 경쟁이…
Mistral AI가 3월 17일 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 119B 파라미터 MoE 구조로 추론 시 약 22B만 활성화되며, 256K 컨텍스트 윈도우와 멀티모달(비전) 기능을 단일 모델에 통합했다. 전작 Small 3 대비 엔드투엔드 완료 시간 40% 단축, 처리량 3배 향상을 달성했다. 🔍 왜 주목해야 하나 LiveCodeBench에서…
Mistral AI가 2026년 3월 16일, 119B 파라미터 Mixture-of-Experts 아키텍처의 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 토큰당 활성 파라미터는 6B으로, 기존 Magistral(추론), Pixtral(비전), Devstral(에이전트 코딩) 세 모델의 기능을 하나로 통합했다. 🔍 왜 주목해야 하나 '하나의 오픈소스 모델로 세…
Mistral AI가 2026년 3월 26일 오픈소스 TTS(텍스트-음성 변환) 모델 Voxtral TTS를 공개했다. Ministral 3B 기반으로 영어·프랑스어·독일어 등 9개 언어를 지원하며, 5초 미만의 음성 샘플로 커스텀 음성 복제가 가능하다. 첫 음성까지 지연(TTFA)은 90ms, 실시간 팩터(RTF)는 6x를 달성했다. 🔍 왜 주목해야 하나 오픈소스 TTS 시장은 그간…
Alibaba가 0.8B, 2B, 4B, 9B 네 가지 크기의 Qwen 3.5 Small 시리즈를 Apache 2.0 라이선스로 공개했다. 텍스트, 이미지, 비디오를 네이티브 멀티모달로 처리하며, 9B 모델이 GPQA Diamond 벤치마크에서 81.7점을 기록해 GPT-oss-120B(71.5점)를 상회했다. 🔍 왜 주목해야 하나 파라미터 규모가 13배 이상 차이 나는 모델을 GPQA…
OpenAI가 GPT-oss-120B(MoE, 활성 파라미터 5.1B)와 GPT-oss-20B 두 모델을 Apache 2.0 라이선스로 Hugging Face에 공개했다. GPT-oss-120B는 단일 80GB GPU(H100, MI300X)에서 실행 가능하며, 핵심 추론 벤치마크에서 o4-mini에 근접하는 성능을 기록한다. 🔍 왜 주목해야 하나 Meta의 Llama 시리즈가 오픈…
종이접기를 AI와 대화하며 배우는 인터랙티브 플랫폼. 실시간 3D 미리보기와 단계별 가이드 제공. Product Hunt 1위 (372표).
MCP는 매 턴 API 호출 후 context 누적으로 토큰 기하급수 증가. CDP(Chrome DevTools Protocol)는 스크립트 1회 작성+실행으로 context 누적 없이 동일 작업 수행. 블록 10개 기준 MCP 32,500 vs CDP 5,500 토큰(약 83% 절감). Notion/Figma/Slack/Cursor 등 Chromium 기반 앱에 적용 가능.
Microsoft의 브라우저 자동화 CLI. MCP 대신 CLI 기반으로 토큰 효율성 극대화. Claude Code, Copilot 등 코딩 에이전트에 최적화.
1인 개발자 Peter Steinberger가 만든 오픈소스 AI 비서. WhatsApp/Telegram으로 컴퓨터 작업 자동화. GitHub 스타 18만개, 역대 최고속 성장.
Claude Code를 위한 1줄 설치 메모리 시스템. 세션 간 컨텍스트 손실 방지. AI로 대화 압축 후 ChromaDB에 벡터 저장, 다음 세션에 자동 주입. 로컬 저장으로 프라이버시 보장. GitHub 12k 스타.
Reddit에서 화제된 Claude Code 6개월 사용 팀 모음. 자동 활성화 스킬, 전략적 계획 서브에이전트, 훅 시스템 등 엔터프라이즈급 워크플로우 구축법. GitHub 샘플 40시간만에 1,100 스타.
Google Antigravity IDE를 위한 멀티에이전트 스킬. PM/Frontend/Backend/Mobile/QA/Debug 에이전트가 협업. 토큰 75% 절감 설계. Gemini/Claude/Codex/Qwen 등 모델 혼합 사용. 실시간 대시보드. bunx oh-my-ag로 설치.
Manus AI의 완전 로컬 대안. API 비용 없이 전기세만으로 자율 에이전트 실행. 웹 브라우징, 코드 작성/디버깅, 태스크 계획을 로컬 LLM으로 처리. 보이스 지원. GitHub 24.4k+ 스타.
Mistral의 오픈소스(Apache 2.0) CLI 코딩 어시스턴트. Devstral 2(SWE-bench 72.2%) 기반. 터미널에서 자연어로 코드베이스 탐색/수정/실행. 프로젝트 컨텍스트 자동 인식, Git 상태 반영, 멀티파일 오케스트레이션. Claude Sonnet 대비 7배 비용 효율적. 현재 API 무료.
Tencent의 AI 3D 생성 플랫폼. 텍스트/이미지/스케치로 고품질 3D 에셋 생성. 2단계 DiT 아키텍처(형태→텍스처 분리). 며칠 걸리던 작업을 분 단위로 단축. OBJ/GLB 출력, Unity/Unreal/Blender 호환. HuggingFace 260만+ 다운로드. 무료 20회/일 제공.
AI 코딩 어시스턴트(Claude Code, Cursor, Windsurf 등)를 위한 UI 요소 주석 도구. 브라우저에서 요소 클릭 시 클래스명, CSS 셀렉터, 위치 정보를 자동 캡처. AI가 정확한 파일/라인으로 직접 점프 가능. '눈먼 장님 코딩' 문제 해결.