Claude Opus 4.8 출시, GPT-5.5 코딩 격차 10%p 벌렸습니다
Claude Opus 4.8이 5월 28일 출시됐습니다. SWE-Bench Pro 69.2%로 GPT-5.5(58.6%)를 10%p 앞서며 에이전틱 코딩 1위를 탈환, 표준 API 가격은 Opus 4.7과 동일합니다.
AI 업계 최신 소식을 공식 발표·1차 출처 기준으로 검증해 전합니다. OpenAI·Anthropic·Google 등 주요 AI 기업의 모델 출시, 기능 업데이트, 정책 변화를 한국 사용자 관점에서 분석합니다. 단순 번역이 아니라 한국 시장에 어떤 의미인지, 무엇을 점검해야 하는지까지 다룹니다.
Claude Opus 4.8이 5월 28일 출시됐습니다. SWE-Bench Pro 69.2%로 GPT-5.5(58.6%)를 10%p 앞서며 에이전틱 코딩 1위를 탈환, 표준 API 가격은 Opus 4.7과 동일합니다.
폰을 꺼도 Gmail·캘린더를 24시간 모니터링하는 Gemini Spark, 25년 만의 검색 재설계, 삼성·젠틀몬스터·카카오까지. Google I/O 2026 핵심 정리.
Claude Code 한도 2배 확장, 속도 제한 해제, 에이전트 자가학습 Dreaming — 5월 6일 Anthropic이 한 자리에서 꺼낸 것들을 정리합니다.
4월 20일 공개된 1조 파라미터 오픈소스 모델 키미 K2.6이 Opus를 위협하고 있습니다. 300개 에이전트가 13시간 무인 코딩에 성공했고, 벤치마크 성능은 GPT-5.5 수준입니다.
Claude Opus 동등 성능을 정가 1/10, 할인가 1/30으로. MIT 라이선스 오픈웨이트 딥시크 V4의 벤치마크와 실무 적용 가능성을 검증합니다.
OpenAI가 GPT-5.5를 발표했습니다. 코딩 성능 82.7%, 가격 2배. 한국의 스타트업과 기업들이 알아야 할 성능·비용·도입 시점을 정리했습니다.
OpenAI GPT Image 2.0이 한글 99% 정확도와 Image Arena 1위를 동시에 달성했습니다. 한국 마케터·디자이너·웹툰팀에게 무엇이 바뀌는지 정리했습니다.
Anthropic이 Claude Opus 4.7을 발표했습니다. 코딩 점수는 확실히 올랐는데, 장문서 처리는 오히려 떨어졌습니다. 4강이 영토를 나눠 가진 시대, 진짜 강자가 누구인지 정리했습니다.
앤트로픽 Mythos가 27년 묵은 OpenBSD 버그를 스스로 찾아냈습니다. Firefox 익스플로잇은 90배 향상. 너무 강해서 회사가 일반 공개를 거부했습니다.
마이크로소프트가 자체 AI 브랜드 MAI를 출시했습니다. 음성 인식·합성·이미지 생성 3종으로, OpenAI 없이도 AI 1등을 노리는 전략 전환의 시작입니다.