PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

읽을거리

2026년 6월 19일

OpenAI AI chemist — GPT-5.4가 자동화 실험실과 결합해 Chan-Lam 수율을 개선

OpenAI와 Molecule.one은 2026년 6월 17일 GPT-5.4를 Maria AI/Lab과 연결한 near-autonomous chemistry workflow가 primary sulfonamide Chan-Lam coupling에서 TEMPO 계열 additive를 찾아 수율을 개선했다고 발표했다. Maria Lab은 OAI-M1-03에서 10,080개 반응을 실행했고, 최적…

본문 읽기원문 보기

발행일

2026년 6월 19일

업데이트

2026년 6월 19일

주제

AI
OpenAI
모델
트렌드
원문 보기

배경 및 맥락

AI for science는 오랫동안 논문 탐색, 구조 예측, 분자 설계 같은 특정 task에서 성과를 보여 왔다. 하지만 실제 R&D 생산성은 모델이 좋은 아이디어를 말하는 것만으로 올라가지 않는다. 가설이 실험실에서 작동해야 하고, 실험 조건과 노이즈, 재현성, 안전성, 사람의 전문 판단을 모두 통과해야 한다.

OpenAI와 Molecule.one의 AI chemist 사례는 이 간극을 좁히는 방향을 보여준다. GPT-5.4를 Maria라는 agentic chemistry AI와 high-throughput lab에 연결해, 모델이 연구 proposal을 만들고 실험 결과를 다시 받아 후속 실험을 설계하는 루프를 구성했다.


핵심 내용

OpenAI는 2026년 6월 17일 GPT-5.4와 Molecule.one의 Maria AI/Lab을 활용해 medicinal chemistry의 Chan-Lam coupling 반응을 개선한 결과를 공개했다. 시스템은 open-ended goal에서 시작해 연구 제안을 생성하고, 높은 순위의 proposal 중 일부를 human chemist가 골라 실험으로 보냈다. 핵심 proposal인 OAI-M1-03은 primary sulfonamide와 boronic acid의 Chan-Lam coupling에서 mild oxidant, 특히 TEMPO 계열 additive가 반응을 개선할 수 있다고 제안했다.

Maria Lab은 해당 proposal에서 총 10,080개 반응을 실행했다. 최적 조건에서 boronic acid의 88%, sulfonamide의 83%에서 수율이 개선됐고, 평균 수율은 16.6%에서 25.2%로 올라갔다. 30% 이상 수율을 보인 반응 비중도 15.6%에서 37.5%로 증가했다. 이후 human chemist가 대표 substrate pair 14개를 bench scale로 재현했고, 11개 pair에서 수율 증가, 8개 pair에서 2배 이상 증가가 확인됐다.


경쟁 구도 / 비교

일반적인 AI drug discovery 도구는 분자 후보 생성, property prediction, literature search처럼 디지털 영역에서 끝나는 경우가 많다. 이번 사례는 모델, agentic planning, automated lab, human validation이 결합된 closed-loop research workflow에 가깝다. 이는 AI가 과학자의 보조 검색 도구에서 실험 설계 파트너로 이동할 수 있음을 보여준다.

반대로 한계도 분명하다. OpenAI는 이를 fully autonomous가 아니라 near-autonomous라고 설명했다. Human chemist가 proposal selection, steering, plan correction, lab operation, final validation에 계속 관여했고, 결과도 특정 reaction class와 substrate 범위 안에서 검증됐다. 따라서 이 결과는 범용 AI 과학자의 증거라기보다, 좁은 문제를 잘 정의하고 자동화 실험 인프라와 연결했을 때 모델이 실질 기여할 수 있다는 증거에 가깝다.


의미

산업적으로는 AI for science 경쟁의 평가 기준이 바뀐다. 앞으로 중요한 질문은 모델이 논문을 얼마나 잘 요약하는가가 아니라, 좋은 가설을 만들고 실험 비용을 줄이며 재현 가능한 결과로 이어지는가다. Automated lab과 expert review가 결합된 조직은 아이디어 탐색 속도를 크게 높일 수 있지만, physical experiment와 safety governance가 병목이 된다.

실무적으로 R&D 팀은 AI 모델만 구매해서는 이 효과를 얻기 어렵다. 실험 데이터 표준화, lab automation, proposal ranking, human approval gate, substrate scope 검증, independent replication, chemical/biological misuse control까지 하나의 system으로 설계해야 한다. 이 사례는 AI 도입의 본질이 모델 API 호출이 아니라 연구 운영체계 재설계라는 점을 잘 보여준다.

이어 읽기

관련 읽을거리

전체 보기
2026년 6월 27일GPT-5.6 Sol preview - frontier model releases become policy-gated infrastructure decisionsOpenAI는 2026년 6월 26일 GPT-5.6 series의 limited preview를 발표하며 Sol, Terra, Luna 3개 tier와 새로운 max reasoning effort, subagent 기반 ultra mode를 공개했다. Sol은 Terminal-Bench 2.1, GeneBench v1, ExploitBench, ExploitGym 같은 장시간…2026년 5월 6일GPT-5.5 Instant — 범용 AI 제품 경쟁이 frontier launch보다 기본 모델 운영 품질로 이동OpenAI는 2026년 5월 5일 ChatGPT의 기본 모델을 GPT-5.5 Instant로 교체한다고 발표했다. 새 모델은 GPT-5.3 Instant 대비 고위험 프롬프트에서 hallucinated claim을 52.5% 줄였고, 사용자가 오류를 지적했던 까다로운 대화에서는 inaccurate claim을 37.3% 줄였으며, chat-latest로도 제공된다.2026년 4월 23일ChatGPT Images 2.0ChatGPT Images 2.0 소식의 핵심을 빠르게 정리하면, AI 모델 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.2026년 4월 1일GPT-5.4 출시 — 추론·코딩·에이전트 통합 모델, OSWorld-V 인간 기준선 AI 최초 초과OpenAI가 3월 5일 GPT-5.4를 출시했다. GPT-5.3 Codex의 코딩 역량을 메인라인 추론 모델에 통합한 것으로, 100만 토큰 컨텍스트 윈도우와 멀티스텝 에이전트 워크플로우 자율 실행 능력을 탑재했다. 실제 데스크톱 생산성 태스크를 시뮬레이션하는 OSWorld-V 벤치마크에서 75%를 기록, 인간 기준선(72.4%)을 AI 최초로 초과했다.