AI 에이전트의 ‘미친’ 성장세: 앤트로픽 Opus 4.6이 법률 시장에 던지는 질문

얼마 전까지만 해도 AI의 전문직 침투에 대해 회의적인 시각이 지배적이었습니다. 특히 법률 및 기업 분석과 같은 고도의 전문성을 요구하는 영역에서는 AI가 아직 갈 길이 멀다는 평가가 많았죠. 실제로 Mercor의 벤치마크에 따르면, 주요 AI 에이전트들은 전문 업무 수행 능력에서 25% 미만의 점수를 기록하며, 당분간 변호사들은 AI로부터 안전할 것이라는 안도감을 주었습니다. 하지만 AI 기술의 발전 속도는 우리의 상상을 초월합니다. 불과 몇 주 만에 이러한 통념이 송두리째 흔들릴 만한 충격적인 소식이 전해졌습니다.

앤트로픽 Opus 4.6의 ‘광기 어린’ 도약

이번 주, 앤트로픽(Anthropic)이 공개한 새로운 모델, Opus 4.6은 AI 에이전트 성능 평가 리더보드를 완전히 뒤흔들었습니다. 단 한 번의 시도(one-shot trial)에서 30%에 육박하는 점수를 기록했으며, 문제에 몇 번 더 접근할 기회를 주자 평균 45%라는 경이로운 수치를 달성했습니다. 이는 이전 최고 성능보다 훨씬 뛰어난 결과입니다. 특히 주목할 점은 Opus 4.6에 ‘에이전트 스웜(agent swarms)’을 포함한 여러 새로운 에이전트 기능이 추가되었다는 사실입니다. 이러한 기능들은 복합적인 다단계 문제 해결에 큰 도움을 주었을 것으로 분석됩니다.

Mercor의 CEO 브렌던 푸디(Brendan Foody)는 이러한 발전 속도에 깊은 인상을 표하며, “불과 몇 달 만에 18.4%에서 29.8%로 뛰어오른 것은 ‘미친(insane)’ 일”이라고 언급했습니다. 물론 30% 혹은 45%가 100%와는 아직 거리가 멀기 때문에, 당장 다음 주에 변호사들이 기계로 대체될 것이라고 걱정할 필요는 없습니다. 하지만 지난달까지만 해도 느꼈던 안도감은 상당 부분 줄어들었을 것이 분명합니다.

에디터의 시선: AI는 이제 ‘도구’를 넘어선다

이번 앤트로픽 Opus 4.6의 사례는 AI 기술 발전의 비선형적(non-linear) 특성을 다시 한번 명확히 보여줍니다. 단 몇 달 만에 두 배 가까이 향상된 성능은 단순히 모델의 파라미터가 늘어나는 수준을 넘어, 아키텍처와 접근 방식의 근본적인 혁신이 동반되었음을 시사합니다. 특히 ‘에이전트 스웜’은 AI가 단순한 지시 수행을 넘어, 자율적으로 문제를 분해하고 해결 전략을 수립하며, 심지어 여러 에이전트가 협력하여 복잡한 과제를 수행하는 ‘지능형 에이전트’ 시대로 진입하고 있음을 알리는 신호탄입니다.

이는 전문직 종사자들에게 중요한 인사이트를 제공합니다. AI는 더 이상 단순한 보조 도구가 아닙니다. 주어진 맥락을 이해하고, 정보를 분석하며, 결론을 도출하는 능력은 이미 특정 영역에서 인간의 역량을 빠르게 따라잡고 있습니다. 물론 법률 분야에서는 윤리적 판단, 인간적 공감, 비정형적 협상 등 여전히 AI가 넘볼 수 없는 영역이 존재하지만, 정형화된 서류 검토, 판례 분석, 계약서 초안 작성 등은 조만간 AI 에이전트의 주된 업무가 될 것입니다.

이제 전문직 종사자들은 AI를 경쟁자가 아닌, 자신의 업무 방식을 재정의하고 생산성을 극대화할 수 있는 강력한 파트너로 인식해야 합니다. AI가 처리하는 영역을 명확히 이해하고, AI가 줄 수 없는 가치를 어디서 찾아낼 것인지 고민하며, 새로운 도구와 워크플로우에 적극적으로 적응하는 능력이 미래 경쟁력의 핵심이 될 것입니다. AI 기술의 ‘미친’ 성장세는 멈추지 않을 것이며, 이에 대한 전략적 대응만이 변화의 물결 속에서 살아남을 길임을 명심해야 합니다.