PickleeAI와 개발에 대한 짧은 노트
홈아티클아카이브검색

끝까지 읽는 글

AI와 개발에 관한 변화 중에서 블로그처럼 오래 읽을 수 있는 글만 골라 정리합니다.

© 2026 Picklee

RSSSitemap

글

2026년 1월 29일수정 2026년 2월 3일원문

Hunyuan 3D - Tencent 3D 생성 AI

Tencent의 AI 3D 생성 플랫폼. 텍스트/이미지/스케치로 고품질 3D 에셋 생성. 2단계 DiT 아키텍처(형태→텍스처 분리). 며칠 걸리던 작업을 분 단위로 단축. OBJ/GLB 출력, Unity/Unreal/Blender 호환. HuggingFace 260만+ 다운로드. 무료 20회/일 제공.

트렌드
오픈소스
무료
API

Hunyuan 3D - Tencent 3D 생성 AI

핵심 컨셉: 텍스트/이미지/스케치에서 고품질 3D 에셋을 분 단위로 생성

기술 아키텍처:

  • 2단계 DiT(Diffusion Transformer) 파이프라인
  • 1단계: 베어 3D 메시 생성
  • 2단계: 해당 메시에 맞는 텍스처 맵 합성
  • 형태와 텍스처 분리로 품질 향상

버전 히스토리:

  • 2025.01: Hunyuan3D 2.0 출시
  • 2025.04: Hunyuan 3D-2.5 (1B→10B 파라미터)
  • 2025.06: Hunyuan3D 2.5 기술 보고서, 2.1 완전 오픈소스
  • 2025.07: HunyuanWorld-1.0 (3D 월드 생성 모델)
  • 2025.09: Hunyuan 3D 3.0, 3D Studio 출시

출력 포맷: OBJ, GLB

호환 소프트웨어: Unity, Unreal Engine, Blender

무료 제공:

  • 일반 사용자: 20회/일
  • 기업(Tencent Cloud): 200 크레딧

실적: HuggingFace 260만+ 다운로드, 오픈소스 3D 모델 중 세계 최다

파트너: Unity China, Bambu Lab, Liblib 등 150+ 기업

더 읽기

같이 읽어볼 만한 글

전체 글 보기
2026년 4월 5일

Google Gemma 4 공개 — Apache 2.0·256K 컨텍스트·멀티모달, 오픈 에이전틱 모델의 새 기준

Google이 4월 2~3일 Gemma 4를 Apache 2.0 라이선스로 공개했다. Effective 2B·4B·26B MoE·31B Dense 네 가지 크기로 제공되며, 256K 토큰 컨텍스트, 비전·오디오 네이티브 멀티모달, 140개 이상 언어를 지원한다. 🔍 왜 주목해야 하나 Gemma 4는 Gemini 3와 동일한 연구 기반으로 제작됐으면서 상업 제한 없는 Apache 2.0으로…

2026년 3월 31일

Mistral Voxtral TTS — 4B 오픈소스 음성 합성 모델, ElevenLabs 대비 7~9배 저렴

Mistral AI가 3월 26일 오픈소스 텍스트-음성 변환 모델 Voxtral TTS(4B 파라미터)를 출시했다. 9개 언어를 지원하고 5초 이하의 음성 샘플로 목소리를 복제하며, 첫 오디오 출력 지연(TTFA)이 90ms에 불과해 실시간 음성 에이전트 구현이 가능하다. 🔍 왜 주목해야 하나 TTS 시장은 ElevenLabs, Deepgram, OpenAI가 독점하다시피 한 유료 API…

2026년 3월 30일

Mistral Small 4 (22B), 오픈소스 추론 벤치마크 1위 — 자기 3~5배 규모 클로즈드 모델 추월

프랑스 Mistral AI가 공개한 22B 파라미터의 Mistral Small 4가 추론 및 지시 수행 벤치마크에서 자신보다 3~5배 큰 클로즈드 모델들을 앞질렀다. Apache 2.0 라이선스로 제공되며 상업적 이용도 자유롭다. 🔍 왜 주목해야 하나 22B 모델이 60B~100B급 클로즈드 모델과 동급이거나 우세하다는 것은 오픈소스 진영의 기술력이 클로즈드 생태계를 본격적으로 위협하는…

2026년 1월 29일

Mistral Vibe CLI - 오픈소스 코딩 에이전트

Mistral의 오픈소스(Apache 2.0) CLI 코딩 어시스턴트. Devstral 2(SWE-bench 72.2%) 기반. 터미널에서 자연어로 코드베이스 탐색/수정/실행. 프로젝트 컨텍스트 자동 인식, Git 상태 반영, 멀티파일 오케스트레이션. Claude Sonnet 대비 7배 비용 효율적. 현재 API 무료.