Anthropic Institute: 'AI가 자신을 구축할 때' — 가속화하는 재귀적 자기개선의 정량적 증거 및 보안 함의

무슨 일이 있었나

Anthropic의 Institute는 6월 4일에 이전에 보고되지 않은 내부 데이터와 공개 벤치마크를 사용한 상세 분석을 발표하여 Anthropic에서 AI가 이미 AI 개발을 상당히 가속화하고 있음을 보여줍니다: 엔지니어들은 2021–2025년보다 분기당 8배 많은 코드를 배포하고, Claude는 자율적으로 12시간 소프트웨어 작업을 완료할 수 있으며, 작업 완료 지평선은 4개월마다 두 배씩 증가하고 있습니다. 이 게시글은 재귀적 자기개선의 경로를 공식적으로 설명하고, 이 전환을 관리하기 위한 국제 조율을 요구하며, 시스템이 자신의 후속 시스템을 구축할 수 있다면 '보안 방식, 모니터링 방식, 그리고 행동 형성 방식이 모두 훨씬 더 중요해진다'는 점을 명시적으로 지적합니다.

왜 중요한가

이는 내부 원격 측정을 사용하여 AI 주도 AI 개발의 속도를 정량화한 Anthropic의 첫 번째 발표이며, 재귀적 자기개선을 먼 미래의 가정이 아닌 근시일 내의 거버넌스 및 보안 문제로 제시합니다. AI 보안 프로그램에 대한 함의는 구체적입니다: 현재의 AI 안전 평가, 레드팀 주기, 및 모니터링 아키텍처는 기계 속도로 개선되는 시스템을 위해 재설계되어야 할 수 있으며, Anthropic은 다른 고위험 기술에 대한 메커니즘과 비슷한 국제 조율 메커니즘을 명시적으로 요구합니다.

필요한 조치

재귀적 자기개선 궤적을 AI 거버넌스 위험 등록부에 포함시키고; 현재 AI 보안 평가 프로그램이 4개월마다 역량이 두 배씩 증가하는 속도에 맞출 수 있는지 검토하며, Anthropic Institute의 제안된 조율 프로세스를 고객 정책 브리핑에 포함시키기 위해 추적하십시오.