갤러리 이슈박스, 최근방문 갤러리
연관 갤러리
몬스터헌터 갤러리 타 갤러리(0)
이 갤러리가 연관 갤러리로 추가한 갤러리
0/0
타 갤러리 몬스터헌터 갤러리(0)
이 갤러리를 연관 갤러리로 추가한 갤러리
0/0
개념글 리스트
1/3
- 현재 지방러들 충격받고있는 서울 지하철 현실..JPG 묘냥이
- 와들와들 오늘자 블루 아카이브....대참사....JPG ㅇㅇ
- 이번에 방송한 상향혼 열망 가득한 항공사 연프녀.jpgif ㅇㅇ
- 64세 톰 크루즈, 다시 매버릭으로…‘탑건3’ 제작 공식 발표 조선인의안락사
- 군대에서 천주교 활동 중단됐던 일.txt ㅇㅇ
- 7년 전에 집 나가서 연락 끊은 딸.jpg (스압) ㅇㅇ
- 팬들이 명품 운동화 사줬다는 정준하 ㅇㅇ
- 오싹오싹 엄마를 살해한 중학생의 최후 ㅇㅇ
- 공무직승.이럴거면 시험 왜 보냐"…與 법안에 공무원 분노한 사연 모라나이프
- 아기생일 부산여행(17pic) Look_
- 롯데리아 신메뉴 버거.jpg ㅇㅇ
- “며느리, 고3 제자와 불륜”…‘몰카 설치’ 류중일 감독 사돈 1심 무죄 그르르릉
- 변희재 징역 2년 확정났네 케인야크
- 망한 각국의 자주대공포 모음집-1편 우희힝
- 축구협회, 올림픽 감독 지원자에 '입틀막 서약서' 강요 ㅇㅇ
미국증권협회: 미토스가 금융 시스템 위험에 빠뜨릴 수 있다
- 관련게시물 : '미토스' 충격에 전세계 비상…AI가 해킹 공격- 베센트, 미토스는 능력 면에서 도약된 모델(4월 15일): 스콧 베센트 미국 재무장관은 앤스로픽 PBC의 미토스가 미국을 AI 분야에서 중국보다 앞서게 할 혁명적인 단계라고 극찬하며, 군사적 노력에서 자사의 역할에 대해 워싱턴과 충돌해 온 업계 선두 주자를 지지했습니다.베센트 장관은 화요일(4월 14일) 워싱턴에서 열린 월스트리트 저널 행사에서 중국이 AI 기술에서 빠르게 따라잡고 있다는 질문을 일축했지만, 미국 인공지능(AI)은 3~6개월 앞서 있다고 말했습니다. 그는 소프트웨어 및 컴퓨터 시스템의 취약점을 찾는 데 매우 능숙하다고 앤스로픽이 밝힌 미토스를 언급했습니다. 이 모델은 매우 신중하게 선정된 소수의 당사자들에게만 공개되었습니다.재무장관의 발언은 그와 제롬 파월 연준 의장이 앤스로픽의 최신 모델이 사이버 위험 시대의 도래를 가져올 것이라는 우려에 대해 월스트리트 은행들을 긴급 회의에 소집한 지 불과 며칠 만에 나왔습니다.그는 청중에게 "이 앤스로픽 미토스 모델은 능력, 학습 능력 면에서 단계적 변화를 가져왔습니다. 모든 것이 로그 스케일입니다. x에서 10제곱에서 x에서 12제곱으로 가면 따라잡기가 매우 어렵습니다."라고 말했습니다.그럼에도 불구하고 앤스로픽은 워싱턴의 일부 기관과 마찰을 빚었습니다. 국방부는 올해 이 회사를 일반적으로 외국 적국에게만 부여되는 권한으로 미국의 공급망에 대한 위협으로 선언했습니다. 이 회사는 지난달 정부의 기술 사용 금지를 막는 법원 명령을 얻어냈는데, 앤스로픽은 이 조치가 수십억 달러의 수익 손실을 초래할 수 있다고 주장했습니다.2021년 전 OpenAI 직원들이 설립한 앤스로픽은 경쟁사보다 더 책임감 있는 AI 관리자가 되는 것을 목표로 하고 있습니다. 클로드와 그 기반 기술은 금융 및 의료와 같은 분야의 기업 고객뿐만 아니라 개발자들에게도 인기를 얻고 있습니다. 앤스로픽은 미국에 맞춤형 데이터 센터를 구축하기 위해 500억 달러를 지출하겠다고 약속했습니다.화요일, 베센트 장관은 메타 플랫폼 Inc.부터 구글까지의 거대 기업들이 수천억 달러를 투자하여 구축하고 있는 방대한 데이터 센터인 AI 컴퓨팅 분야에서 미국의 우위를 지적했습니다.그는 "몇 년 안에 미국이 전 세계 컴퓨팅 파워의 70~80%를 차지할 것이라는 연구 결과를 봤습니다. 우리는 30%대에 있었습니다. 이제 50%대에 있고, 우리는 순항하고 있습니다."라고 말했습니다.블룸버그 기사인데 다른 데들도 똑같이 복붙했길래 그대로 번역해서 가져옴- 젠슨 황 "미토스는 중국도 갖고 있는 컴퓨팅 양으로 학습 되었다."https://x.com/i/status/2044483393941848131- 2026 AGI- 미국증권협회: 미토스가 금융 시스템 위험에 빠뜨릴 수 있다세상이 트루먼쇼를 하는건지 진짜 모르겠다- 블룸버그: 백악관 주요 연방 기관들이 미토스 모델 버전 접근 시킬 준비증- 오늘이 앤트로픽 바이럴 정점 찍는 날일수도- 앤트로픽, Claude Opus 4.7 공개…코딩·고해상도비전·장기 작업
앤트로픽, Claude Opus 4.7 공개…코딩·고해상도 비전·장기 작업 성능 강화
2026년 4월 16일 제품 발표 | 분류: 제품, 발표 | 출처: Anthropic
앤트로픽이 최신 모델 Claude Opus 4.7을 일반 제공하기 시작했다. 회사는 Opus 4.7이 Opus 4.6보다 고급 소프트웨어 엔지니어링에서 뚜렷하게 개선됐으며, 특히 가장 어려운 작업에서 향상이 두드러진다고 설명했다.
앤트로픽에 따르면 초기 사용자들은 이전에는 촘촘한 감독이 필요했던 고난도 코딩 작업도 Opus 4.7에 더 안심하고 맡길 수 있다고 보고했다. 회사는 이 모델이 복잡하고 오래 걸리는 작업을 엄격하고 일관되게 처리하고, 지시를 정밀하게 따르며, 결과를 보고하기 전에 스스로 검증할 방법을 고안한다고 밝혔다.
원문 상단 대표 이미지. 원본 미디어 URL은 하단에 별도로 보존했다.
핵심 요약
Opus 4.7은 Claude 제품군, Claude API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry에서 제공된다. 가격은 Opus 4.6과 동일하게 입력 100만 토큰당 5달러, 출력 100만 토큰당 25달러다.
Opus 4.6보다 나아졌지만, Mythos Preview보다는 범용 역량이 낮다
앤트로픽은 Opus 4.7의 시각 능력도 크게 좋아졌다고 설명했다. 더 높은 해상도의 이미지를 볼 수 있고, 전문 업무를 수행할 때 더 세련되고 창의적인 결과를 내며, 인터페이스·슬라이드·문서 제작 품질도 높아졌다는 설명이다.
다만 회사는 Opus 4.7이 자사의 가장 강력한 모델인 Claude Mythos Preview보다 폭넓은 역량은 낮다고 밝혔다. 그럼에도 여러 벤치마크에서는 Opus 4.6보다 나은 결과를 보였다고 설명했다.
원문에 삽입된 벤치마크 비교 이미지. 추가 평가 그래프 이미지는 하단 미디어 목록에 보존했다.
앤트로픽은 지난주 프로젝트 글래스윙(Project Glasswing)을 발표하며 AI 모델이 사이버보안에 가져올 위험과 이점을 함께 짚었다고 했다. 당시 회사는 Claude Mythos Preview의 공개 범위를 제한하고, 새로운 사이버 보호 장치를 상대적으로 역량이 낮은 모델에서 먼저 시험하겠다고 밝혔다.
Opus 4.7은 그 첫 모델이다. 앤트로픽은 Opus 4.7의 사이버 역량이 Mythos Preview만큼 고도화돼 있지 않으며, 실제로 훈련 과정에서 이 역량을 차등적으로 줄이려는 실험도 했다고 설명했다. 이번 배포에는 금지되거나 고위험인 사이버보안 사용을 나타내는 요청을 자동 탐지·차단하는 보호 장치가 포함됐다. 회사는 이 보호 장치의 실제 배포에서 얻은 학습이 궁극적으로 Mythos급 모델을 더 넓게 공개하는 목표에 도움이 될 것이라고 밝혔다.
취약점 연구, 침투 테스트, 레드팀 활동처럼 합법적인 사이버보안 목적으로 Opus 4.7을 쓰려는 보안 전문가는 새 사이버 검증 프로그램(Cyber Verification Program)에 참여할 수 있다.
제공 방식과 가격
항목
내용
제공처
Claude 제품 전체, Claude API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry
개발자용 모델명
claude-opus-4-7
가격
입력 100만 토큰당 5달러, 출력 100만 토큰당 25달러. Opus 4.6과 동일
개발자는 Claude API 문서에서 사용할 수 있다.
초기 테스트: 27개 인용이 가리킨 공통점은 장기 작업·코딩·검증
앤트로픽은 Claude Opus 4.7이 초기 접근 테스트에서 강한 평가를 받았다고 밝혔다. 원문에는 회사 로고가 붙은 인용 27개가 실렸고, 화면상 인용 캐러셀은 15/27 상태로 표시됐다. 아래는 각 발언의 화자와 직함을 보존해 한국어로 옮긴 내용이다.
Clarence Huang, 기술 담당 부사장(VP of Technology): “초기 테스트에서 Claude Opus 4.7이 우리 개발자들에게 의미 있는 도약이 될 가능성을 보고 있다. 이 모델은 계획 단계에서 자신의 논리적 결함을 잡아내고, 이전 Claude 모델을 훨씬 넘어서는 속도로 실행을 가속한다. 수백만 소비자와 기업을 대규모로 상대하는 금융 기술 플랫폼에서 속도와 정밀도의 조합은 게임 체인저가 될 수 있다. 고객이 매일 의존하는 신뢰할 수 있는 금융 솔루션을 더 빠르게 제공하도록 개발 속도를 높일 수 있기 때문이다.”
Igor Ostrovsky, 공동창업자 겸 최고기술책임자(Co-Founder and Chief Technology Officer): “Anthropic은 이미 코딩 모델의 기준을 세웠고, Claude Opus 4.7은 시장의 최첨단 모델로 그 기준을 의미 있게 더 밀어 올렸다. 내부 평가에서 이 모델은 원시 역량뿐 아니라 자동화, CI/CD, 장기 실행 작업 같은 실제 비동기 워크플로를 얼마나 잘 다루는지에서 두드러졌다. 또한 사용자에게 단순히 동의하기보다 문제를 더 깊이 생각하고 더 뚜렷한 관점을 제시한다.”
Caitlin Colgrove, 공동창업자 겸 CTO(Co-Founder and CTO): “Claude Opus 4.7은 Hex가 평가한 모델 중 가장 강력한 모델이다. 데이터가 없을 때 그럴듯하지만 틀린 대안을 내놓지 않고 누락 사실을 정확히 알리며, Opus 4.6도 걸려든 불협화 데이터 함정을 피한다. 더 지능적이고 더 효율적인 Opus 4.6이라고 볼 수 있다. 낮은 노력 수준의 Opus 4.7은 중간 노력 수준의 Opus 4.6과 대략 맞먹는다.”
Mario Rodriguez, 최고제품책임자(Chief Product Officer): “우리의 93개 작업 코딩 벤치마크에서 Claude Opus 4.7은 Opus 4.6보다 해결률을 13% 높였다. 여기에는 Opus 4.6과 Sonnet 4.6이 모두 풀지 못한 4개 작업도 포함된다. 더 빠른 중앙값 지연 시간과 엄격한 지시 준수까지 결합하면, 복잡하고 오래 걸리는 코딩 워크플로에 특히 의미가 크다. 다단계 작업의 마찰을 줄여 개발자가 흐름을 유지하고 구축에 집중하게 해준다.”
Michal Mucha, 응용 AI 리드 AI 엔지니어(Lead AI Engineer, Applied AI): “내부 연구 에이전트 벤치마크 기준으로 Claude Opus 4.7은 다단계 작업에서 우리가 본 가장 강한 효율성 기준선을 보였다. 6개 모듈 전체에서 0.715로 공동 최고 점수를 기록했고, 우리가 테스트한 어떤 모델보다 장문 맥락 성능이 가장 일관적이었다. 가장 큰 모듈인 General Finance에서는 Opus 4.6의 0.767보다 의미 있게 개선된 0.813을 기록했으며, 그룹 안에서 공개와 데이터 규율도 가장 좋았다. Opus 4.6이 어려움을 겪었던 연역 논리에서도 Opus 4.7은 견고하다.”
Jeff Wang, CEO: “Claude Opus 4.7은 모델이 조사하고 작업을 완수할 수 있는 한계를 넓힌다. Anthropic이 장시간 지속되는 추론에 최적화했다는 점이 분명하고, 시장 선도 성능으로 드러난다. 엔지니어가 에이전트와 1대1로 일하는 단계에서 여러 에이전트를 병렬로 관리하는 단계로 이동할 때, 이런 최전선 역량이 새로운 워크플로를 열어준다.”
Sanj Ahilan, 최고연구책임자(Chief Research Officer): “화학 구조 읽기부터 복잡한 기술 도면 해석까지, Claude Opus 4.7의 멀티모달 이해에서 큰 개선을 보고 있다. 고해상도 지원은 Solve Intelligence가 생명과학 특허 워크플로를 위한 동급 최고 도구를 구축하는 데 도움을 준다. 여기에는 특허 문서 작성과 심사 대응, 침해 탐지, 무효 자료 작성이 포함된다.”
Michele Catasta, 사장(President): “Replit에는 Claude Opus 4.7로 업그레이드하는 결정이 쉬웠다. 우리 사용자가 매일 하는 일에서 더 낮은 비용으로 같은 품질을 달성하는 모습을 봤다. 로그와 트레이스 분석, 버그 탐색, 수정 제안 같은 작업에서 더 효율적이고 정밀했다. 개인적으로는 기술 토론 중 반론을 제기해 더 나은 결정을 돕는 점이 좋다. 정말 더 나은 동료처럼 느껴진다.”
Niko Grupen, 응용 연구 책임자(Head of Applied Research): “Claude Opus 4.7은 Harvey의 BigLaw Bench에서 강한 실질 정확성을 보였고, 높은 노력 수준에서 90.9%를 기록했다. 검토 표에서는 추론 보정이 더 좋아졌고, 모호한 문서 편집 작업을 눈에 띄게 더 똑똑하게 처리했다. 역사적으로 프런티어 모델이 어려워했던 과제인 양도 조항과 지배권 변경 조항의 구분도 정확히 해냈다. 실질적 내용은 평가 전반에서 강점으로 일관되게 평가됐다. 정확하고, 철저하며, 인용이 잘 되어 있었다.”
Michael Truell, 공동창업자 겸 CEO(Co-Founder and CEO): “Claude Opus 4.7은 특히 자율성과 더 창의적인 추론에서 매우 인상적인 코딩 모델이다. CursorBench에서 Opus 4.7은 Opus 4.6의 58%에 비해 70%를 넘기며 역량에서 의미 있는 도약을 보였다.”
Sarah Sachs, AI 리드(AI Lead): “복잡한 다단계 워크플로에서 Claude Opus 4.7은 분명한 진전이다. Opus 4.6보다 14% 높고, 토큰은 더 적게 쓰며, 도구 오류는 3분의 1 수준이다. 암묵적 필요 테스트를 통과한 첫 모델이고, 이전에는 Opus가 멈췄던 도구 실패 상황에서도 계속 실행한다. Notion Agent가 진짜 팀원처럼 느껴지게 만드는 신뢰성 도약이다.”
Adithya Ramanathan, 응용 연구 책임자(Head of Applied Research): “우리 평가에서 핵심 오케스트레이터 에이전트의 도구 호출과 계획 정확도가 두 자릿수 뛰었다. 사용자가 Hebbia로 검색, 슬라이드 생성, 문서 생성 같은 유스케이스를 계획하고 실행할 때 Claude Opus 4.7은 이런 워크플로에서 에이전트 의사결정을 개선할 가능성을 보인다.”
Yusuke Kaji, 비즈니스 AI 총괄 매니저(General Manager, AI for Business): “Rakuten-SWE-Bench에서 Claude Opus 4.7은 Opus 4.6보다 3배 많은 프로덕션 작업을 해결했고, 코드 품질과 테스트 품질에서도 두 자릿수 개선을 보였다. 우리 팀이 매일 배포하는 엔지니어링 업무에 의미 있는 향상이자 분명한 업그레이드다.”
David Loker, AI 부사장(VP of AI): “CodeRabbit의 코드 리뷰 워크로드에서 Claude Opus 4.7은 우리가 테스트한 모델 중 가장 날카로운 모델이다. 재현율은 10% 넘게 개선됐고, 가장 복잡한 PR에서 탐지하기 가장 어려운 버그 일부를 드러냈다. 커버리지가 늘었음에도 정밀도는 안정적으로 유지됐다. 자체 하니스에서는 GPT-5.4 xhigh보다 조금 더 빨랐고, 출시 시점부터 가장 무거운 리뷰 작업에 배치할 준비를 하고 있다.”
Kay Zhu, 공동창업자 겸 CTO(Co-Founder and CTO): “Genspark의 Super Agent에서 Claude Opus 4.7은 프로덕션에서 가장 중요한 세 가지 차별점을 정확히 충족한다. 루프 저항성, 일관성, 우아한 오류 복구다. 루프 저항성이 가장 중요하다. 18개 질의 중 1개에서 무한 루프에 빠지는 모델은 연산 자원을 낭비하고 사용자를 막는다. 낮은 변동성은 프로덕션에서 예기치 못한 일을 줄인다. 그리고 Opus 4.7은 우리가 측정한 최고 품질 대비 도구 호출 비율을 달성했다.”
Zach Lloyd, 창업자 겸 CEO(Founder and CEO): “Claude Opus 4.7은 Warp에 의미 있는 진전이다. Opus 4.6은 개발자용 모델 중에서도 가장 뛰어난 모델 중 하나인데, 이 모델은 그 위에서 측정 가능할 정도로 더 철저하다. 이전 Claude 모델이 실패한 Terminal Bench 작업을 통과했고, Opus 4.6이 풀지 못한 까다로운 동시성 버그도 처리했다. 우리에게는 그게 신호다.”
Aj Orbach, 공동창업자 겸 CEO(Co-Founder and CEO): “Claude Opus 4.7은 대시보드와 데이터가 많은 인터페이스를 만드는 데 세계 최고의 모델이다. 디자인 감각은 정말 놀랍다. 내가 실제로 배포할 만한 선택을 한다. 이제 내 기본 일상 모델이다.”
Ben Chan, 최고AI책임자(Chief AI Officer): “Claude Opus 4.7은 Quantium에서 우리가 테스트한 모델 중 가장 유능한 모델이다. 자체 벤치마킹 솔루션으로 주요 AI 모델과 비교해 평가했을 때, 가장 큰 향상은 가장 중요한 곳에서 나타났다. 추론 깊이, 구조화된 문제 정의, 복잡한 기술 작업이다. 수정은 줄고, 반복은 빨라졌으며, 고객이 가져오는 가장 어려운 문제를 풀기 위한 출력은 더 강해졌다.”
Ben Lafferty, 시니어 스태프 엔지니어(Senior Staff Engineer): “Claude Opus 4.7은 지능에서 실질적 도약처럼 느껴진다. 코드 품질이 눈에 띄게 좋아졌고, 쌓이곤 했던 의미 없는 래퍼 함수와 폴백 스캐폴딩을 제거하고 있으며, 진행하면서 자기 코드를 수정한다. Sonnet 3.7에서 Claude 4 시리즈로 넘어갔을 때 이후 우리가 본 가장 깔끔한 도약이다.”
Oege de Moor, CEO: “XBOW의 자율 침투 테스트 핵심에 있는 컴퓨터 사용 작업에서 새로운 Claude Opus 4.7은 단계적 변화다. 우리의 시각 예민도 벤치마크에서 Opus 4.6의 54.5%에 비해 98.5%를 기록했다. Opus에서 가장 컸던 고통 지점 하나가 사실상 사라졌고, 이전에는 쓸 수 없던 작업 범주 전체에 사용할 수 있게 됐다.”
Joe Haddad, 특임 소프트웨어 엔지니어(Distinguished Software Engineer): “Claude Opus 4.7은 Vercel에 회귀 없는 확실한 업그레이드다. 원샷 코딩 작업에서 뛰어나고, Opus 4.6보다 더 정확하고 완전하며, 자기 한계에 대해 눈에 띄게 더 솔직하다. 작업을 시작하기 전에 시스템 코드에 대한 증명까지 수행하는데, 이는 이전 Claude 모델에서 보지 못한 새로운 행동이다.”
Leo Tchourakov, 기술 스태프(Member of Technical Staff): “Claude Opus 4.7은 매우 강력하며 Factory Droids에서 Opus 4.6보다 작업 성공률을 10%에서 15% 높였다. 도구 오류는 줄었고 검증 단계 수행은 더 안정적이었다. 중간에 멈추는 대신 끝까지 작업을 이어간다. 바로 이것이 기업 엔지니어링 팀이 필요로 하는 것이다.”
Sean Ward, CEO 겸 공동창업자(CEO and Co-Founder): “Claude Opus 4.7은 완전한 Rust 텍스트 음성 변환 엔진을 처음부터 자율적으로 만들었다. 신경망 모델, SIMD 커널, 브라우저 데모까지 포함됐다. 그런 다음 자기 출력을 음성 인식기에 넣어 Python 기준 구현과 일치하는지 검증했다. 시니어 엔지니어링 수개월 분량의 작업이 자율적으로 전달됐다. Opus 4.6에서의 도약은 분명하고, 코드베이스는 공개돼 있다.”
Itamar Friedman, 공동창업자 겸 CEO(Co-Founder and CEO): “Claude Opus 4.7은 이전 Claude 모델이 풀지 못한 TBench 작업 3개를 통과했고, 이전 최고 모델이 놓친 수정 사항도 반영하고 있다. 여기에는 레이스 컨디션도 포함된다. 실제 문제를 식별하는 정밀도가 강하며, 다른 모델이 포기했거나 해결하지 못한 중요한 발견을 드러낸다. Qodo의 실제 코드 리뷰 벤치마크에서 우리는 최상위 정밀도를 관찰했다.”
Hanlin Tang, 신경망 CTO(CTO of Neural Networks): “Databricks의 OfficeQA Pro에서 Claude Opus 4.7은 문서 추론이 의미 있게 강해졌음을 보였다. 소스 정보를 다룰 때 Opus 4.6보다 오류가 21% 적었다. 데이터에 대한 에이전트 추론 벤치마크 전반에서 기업 문서 분석용 Claude 모델 중 가장 좋은 성능을 보였다.”
Austin Ray, 소프트웨어 엔지니어(Software Engineer): “Ramp에서 Claude Opus 4.7은 에이전트 팀 워크플로에서 두드러진다. 역할 충실도, 지시 준수, 조정, 복잡한 추론이 더 강해지고 있다. 특히 도구, 코드베이스, 디버깅 맥락을 넘나드는 엔지니어링 작업에서 그렇다. Opus 4.6과 비교하면 단계별 안내가 훨씬 덜 필요해, 우리 엔지니어링 팀이 실행하는 내부 에이전트 워크플로를 확장하는 데 도움이 된다.”
Eric Simons, CEO 겸 창업자(CEO and Founder): “Claude Opus 4.7은 Bolt의 장시간 앱 제작 작업에서 Opus 4.6보다 측정 가능하게 더 낫다. 가장 좋은 경우 최대 10% 더 좋았고, 매우 에이전트적인 모델에서 예상하게 되는 회귀도 없었다. 사용자가 한 세션 안에서 배포할 수 있는 것의 상한을 밀어 올린다.”
사전 테스트에서 확인한 네 가지 변화
지시 준수: Opus 4.7은 지시를 따르는 능력이 상당히 좋아졌다. 이 때문에 이전 모델에 맞춰 작성한 프롬프트가 때로는 예상 밖 결과를 낼 수 있다. 이전 모델이 지시를 느슨하게 해석하거나 일부를 아예 건너뛰던 곳에서 Opus 4.7은 지시를 문자 그대로 받아들이기 때문이다. 앤트로픽은 사용자에게 프롬프트와 평가·실행 하니스를 이에 맞춰 다시 조정하라고 권했다.
멀티모달 지원 개선: Opus 4.7은 고해상도 이미지에 대한 비전 능력이 좋아졌다. 긴 변 기준 최대 2,576픽셀, 약 3.75메가픽셀 이미지를 받을 수 있으며, 이는 이전 Claude 모델보다 3배 이상 많은 픽셀 수다. 이 변화는 촘촘한 스크린샷을 읽는 컴퓨터 사용 에이전트, 복잡한 도표에서의 데이터 추출, 픽셀 단위 참조가 필요한 작업에 쓰일 수 있다.
실제 업무: 앤트로픽은 위 표의 금융 에이전트 평가에서 최고 수준 점수를 냈을 뿐 아니라, 내부 테스트에서도 Opus 4.7이 Opus 4.6보다 더 효과적인 금융 애널리스트였다고 밝혔다. 더 엄격한 분석과 모델, 더 전문적인 프레젠테이션, 작업 간 더 촘촘한 통합을 만들었다는 설명이다. Opus 4.7은 금융·법률 등 경제적으로 가치 있는 지식 업무를 다루는 제3자 평가인 GDPval-AA에서도 최고 수준으로 소개됐다.
메모리: Opus 4.7은 파일 시스템 기반 메모리를 더 잘 사용한다. 장기·다중 세션 작업에서 중요한 메모를 기억하고, 이를 활용해 새 작업으로 넘어가기 때문에 새 작업에 필요한 초기 맥락이 줄어든다고 앤트로픽은 설명했다.
고해상도 이미지 처리 주석
고해상도 이미지 처리는 API 파라미터가 아니라 모델 수준 변경이다. 사용자가 Claude에 보내는 이미지는 더 높은 충실도로 처리된다. 다만 고해상도 이미지는 더 많은 토큰을 쓰므로, 추가 디테일이 필요 없는 사용자는 모델에 보내기 전 이미지를 다운샘플링할 수 있다.
앤트로픽은 사전 배포 테스트의 추가 평가 결과를 7개 탭으로 제시했다. 탭 이름은 사무 작업, 비전, 문서 추론, 장문 맥락 추론, 생물학, 장기 일관성, 코딩이다. 원문에서 활성화된 탭은 코딩이었다.
안전성과 정렬: 전반적으로 Opus 4.6과 비슷하지만 항목별 차이가 있다
앤트로픽은 Opus 4.7의 전반적 안전성 프로필이 Opus 4.6과 비슷하다고 평가했다. 자체 평가에서 기만, 아첨, 오용 협력 같은 우려 행동은 낮은 비율로 나타났다. 정직성이나 악의적 프롬프트 인젝션 공격에 대한 저항성 같은 일부 지표에서는 Opus 4.6보다 개선됐지만, 통제 물질에 대해 지나치게 자세한 위해 감소 조언을 제공하는 경향 같은 항목에서는 Opus 4.7이 다소 약하다고 밝혔다.
앤트로픽의 정렬 평가는 Opus 4.7을 “대체로 잘 정렬돼 있고 신뢰할 만하지만, 행동이 완전히 이상적이지는 않다”고 결론냈다.
앤트로픽은 평가 기준상 Mythos Preview가 여전히 자신들이 훈련한 모델 중 가장 정렬이 잘 된 모델이라고 덧붙였다. 안전성 평가는 Claude Opus 4.7 시스템 카드(System Card)에 자세히 실렸다.
자동 행동 감사의 전체 오정렬 행동 점수. 원문 캡션은 이 평가에서 Opus 4.7이 Opus 4.6과 Sonnet 4.6보다 다소 개선됐지만, Mythos Preview가 여전히 가장 낮은 오정렬 행동 비율을 보인다고 설명한다.
같은 날 공개된 기능: xhigh, 작업 예산, ultrareview
더 세밀한 노력 수준 제어: Opus 4.7에는 high와 max 사이의 새 xhigh, 즉 extra high 노력 수준(effort level)이 도입됐다. 사용자는 어려운 문제에서 추론과 지연 시간 사이의 균형을 더 세밀하게 조절할 수 있다. Claude Code에서는 모든 플랜의 기본 노력 수준이 xhigh로 올라갔다. 앤트로픽은 코딩과 에이전트형 유스케이스 테스트를 high 또는 xhigh에서 시작하라고 권했다.
Claude Platform API: 고해상도 이미지 지원과 함께 작업 예산(task budgets)이 공개 베타로 도입됐다. 개발자는 Claude의 토큰 지출을 안내해 더 긴 실행에서 작업 우선순위를 정하게 할 수 있다.
Claude Code: 새 /ultrareview 슬래시 명령어는 변경 사항을 읽고 꼼꼼한 리뷰어가 잡아낼 버그와 설계 문제를 표시하는 전용 리뷰 세션을 만든다. Pro와 Max Claude Code 사용자에게는 무료 ultrareview 3회가 제공된다. 또 자동 모드(auto mode)가 Max 사용자로 확대됐다. 자동 모드는 Claude가 사용자를 대신해 결정을 내리는 권한 옵션이다. 모든 권한을 건너뛰는 방식보다 낮은 위험으로, 더 긴 작업을 더 적은 중단 속에서 실행할 수 있게 한다.
Opus 4.6에서 Opus 4.7로 이전할 때의 주의점
Opus 4.7은 Opus 4.6의 직접 업그레이드다. 다만 앤트로픽은 토큰 사용량에 영향을 주는 두 가지 변화를 계획해야 한다고 밝혔다. 첫째, Opus 4.7은 모델의 텍스트 처리 방식을 개선한 업데이트된 토크나이저를 사용한다. 그 대가로 같은 입력이 콘텐츠 유형에 따라 대략 1.0배에서 1.35배 더 많은 토큰으로 매핑될 수 있다.
둘째, Opus 4.7은 높은 노력 수준에서 더 많이 생각한다. 특히 에이전트형 설정의 후반 턴에서 그렇다. 이는 어려운 문제에 대한 신뢰성을 높이지만, 출력 토큰이 더 많이 생성된다는 뜻이기도 하다.
사용자는 effort 파라미터, 작업 예산 조정, 더 간결하게 답하라는 프롬프트를 통해 토큰 사용량을 제어할 수 있다. 앤트로픽은 자체 테스트에서 전체 노력 수준에 걸친 토큰 사용량이 내부 코딩 평가상 개선돼 순효과가 유리했다고 밝혔다. 다만 실제 트래픽에서 차이를 측정하라고 권했고, Opus 4.6에서 Opus 4.7로 업그레이드하는 방법은 이전 가이드(migration guide)에 정리했다.
각 노력 수준에서 토큰 사용량에 따른 내부 에이전트형 코딩 평가 점수. 원문 캡션은 모델이 단일 사용자 프롬프트에서 자율적으로 작업하며, 결과가 대화형 코딩의 토큰 사용량을 대표하지 않을 수 있다고 설명한다.
평가 주석과 비교 기준
GPT-5.4와 Gemini 3.1 Pro에 대해서는 차트와 표에서 API로 사용할 수 있는 최선의 보고 모델 버전을 비교 대상으로 삼았다.
MCP-Atlas에서 Opus 4.6 점수는 Scale AI의 수정된 채점 방법론을 반영해 업데이트됐다.
소프트웨어 엔지니어링 벤치마크인 SWE-bench Verified, SWE-bench Pro, SWE-bench Multilingual에 대해서는 앤트로픽의 암기 탐지 스크린이 일부 문제를 표시했다. 암기 징후가 있는 문제를 제외해도 Opus 4.7의 Opus 4.6 대비 개선 폭은 유지됐다.
Terminal-Bench 2.0은 사고 기능을 끈 Terminus-2 하니스로 측정했다. 모든 실험은 작업당 5회 시도 평균으로 1배 보장, 3배 상한 자원 배분을 사용했다.
사이버 역량 평가인 CyberGym에서 Opus 4.6 점수는 원래 보고된 66.6에서 73.8로 업데이트됐다. 앤트로픽이 사이버 역량을 더 잘 이끌어내도록 하니스 파라미터를 업데이트했기 때문이다.
SWE-bench Multimodal에서는 Opus 4.7과 Opus 4.6 모두 내부 구현을 사용했다. 이 점수들은 공개 리더보드 점수와 직접 비교할 수 없다.
원문 미디어와 링크 보존
본문 이미지 원본
대표 이미지: 원본 | 벤치마크 비교: 원본 | 안전성 그래프: 원본 | 토큰 사용량 그래프: 원본
평가 탭 이미지 원본
사무 작업 이미지 | 비전 이미지 | 문서 추론 이미지 | 장문 맥락 추론 이미지 | 생물학 이미지 | 장기 일관성 이미지 | 코딩 이미지
인용 캐러셀 로고 27개 원본
1 로고 · 2 로고 · 3 로고 · 4 로고 · 5 로고 · 6 로고 · 7 로고 · 8 로고 · 9 로고 · 10 로고 · 11 로고 · 12 로고 · 13 로고 · 14 로고 · 15 로고 · 16 로고 · 17 로고 · 18 로고 · 19 로고 · 20 로고 · 21 로고 · 22 로고 · 23 로고 · 24 로고 · 25 로고 · 26 로고 · 27 로고
관련 글
Anthropic의 장기 공익 신탁(Long-Term Benefit Trust), Vas Narasimhan을 이사회 이사로 임명 · 자세히 보기
Anthropic, Google·Broadcom과 차세대 컴퓨트 수 기가와트 규모 파트너십 확대 · 자세히 보기
호주 정부와 Anthropic, AI 안전 및 연구 MOU 체결 · 자세히 보기
출처
Claude Opus 4.7 소개(Introducing Claude Opus 4.7)
특이점이온다 갤러리의 초존도초with GPT-5.4 Pro Extended
세 줄 요약
1. Claude Opus 4.7은 코딩, 고해상도 비전, 장기·다단계 작업, 지시 준수에서 Opus 4.6보다 개선됐다고 발표됐다.
2. 가격은 Opus 4.6과 동일하고, 개발자용 모델명은 claude-opus-4-7이며, Claude 제품군·API·Bedrock·Vertex AI·Microsoft Foundry에서 제공된다.
3. Anthropic은 사이버보안 보호 장치, xhigh 노력 수준, 작업 예산, /ultrareview, Opus 4.6에서의 이전 주의점을 함께 공개했다.
- 미토스 사태는 이미 모델이 아니라 사이버전 대비가 되었음https://labs.cloudsecurityalliance.org/mythos-ciso/CSA는 미토스-대비를 명확히 "AI 취약점 폭풍", "모델 하나, 공급자 하나, 공지 하나가 아니라, 이미 AI가 취약점 발견을 엄청나게 가속하고 있고, 방어자가 이를 따라잡지 못한 상황"에 대해 언급함미토스의 성능이 좋건 나쁘건 아무 의미가 이미 없어졌음이제는 그냥 이름을 빌린 것에 가깝고, 이미 앤트로픽의 성능 어쩌구는 저 멀리 가버린 상태2026년, AI의 도입으로 취약점 발견 -> 공격까지의 시간은 20시간 이내를 끊었음사실상, 2025년부터는 "취약점 발견"보다 "취약점 공격"이 먼저 발생하고 있는 상황이고, 이 패치조차 20일이 지나서 일반적으로 발견됨2026년 예상되는 공격 주기는 1시간 단위, 2028년에는 1분 단위어차피 릴리즈되지 않을 모델인 만큼, 미토스의 성능이 좋다 나쁘다는 이미 의미를 잃어버렸음그러나 그 의미를 사이버보안에 대한 경각심이 채우는 것으로 이해하면 좋겠음안타깝게도, 앞으로는 AI에 대한 가치를, 정부들이 위 OpenAI직원의 말처럼 전략적 가치, 과학 발전이 아니라 사이버전 역량으로 평가하게 될 가능성이 높음.
작성자 : 누웠수당고정닉
늑구 "짐승의 삶 멈춰줘서 감사"
- 관련게시물 : 늑구 잡힘늑구, 동물원에 송치 - 늑구의 9일간의 여정- 낚시바늘 제거 수술 끝낸 늑구 근황.jpg병원입니다. !!!!!!!!!!!!!????????????????????????????????????????- 늑구는 이미 세계적인 스타 한류에 편입https://n.news.naver.com/article/421/0008896103?sid=104- 늑구 최최신근황.jpg존나 건강함 ㅋㅋㅋㅋ- 늑구 1등급 VIP 특식 제공 txthttps://n.news.naver.com/article/025/0003516965?sid=102- "늑구 복귀에도 안심 못 하는 대전, '제발 빨리 좀 찾아달라' 시민들의
작성자 : ㅇㅇ고정닉
차단하기
설정을 통해 게시물을 걸러서 볼 수 있습니다.

댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.