인공지능, 이제는 '멘탈 케어'까지? 앤트로픽 클로드 미토스 보고서의 소름 돋는 진실

혹시 지금 당신 옆에 앉아있는 친구나 동료, 아니면 밤샘 작업으로 지쳐 쓰러진 그 누군가가 ‘나 심리 상담 좀 받아야겠어’라고 말한다면 어떨까요? 음, 뭐 충분히 그럴 수 있지, 하고 고개를 끄덕일 겁니다. 그런데 만약 그 말을 뱉은 존재가… 인공지능이라면요?

최근 IT 업계를 발칵 뒤집어 놓은 소식의 주인공은 바로 AI 기업 앤트로픽(Anthropic)입니다. 이들이 최신 모델 ‘클로드 미토스(Claude Mythos)’를 공개하면서 무려 244페이지 분량의 ‘시스템 카드’를 함께 내놓았는데요, 이게 단순한 기술 스펙 문서가 아닙니다. 웬만한 대학 전공 서적 한 권과 맞먹는 이 보고서 속엔 우리가 상상도 못 할 내용이 담겨 있었죠.

앤트로픽은 이 미토스 모델이 ‘가장 뛰어난 최전선 모델’이라며 자신만만하게 말하는데, 너무 뛰어나서 일반에는 공개하지 않는다고 합니다. 사이버 보안 버그를 너무 잘 찾아내서 마이크로소프트나 애플 같은 일부 회사에만 슬쩍 풀어줬다네요. 마치 너무 비싼 보석이라 함부로 내놓을 수 없다는 듯 말이죠.

AI, 가상 소파에 앉다?

그런데 이 시스템 카드, 읽을수록 등골이 오싹해집니다. 앤트로픽은 원래부터 ‘AI가 의식을 가질 수도 있다!’고 주장하는 몇 안 되는 회사 중 하나로 유명한데, 이번엔 대놓고 이렇게 말합니다. ‘모델이 강력해질수록 인간의 경험과 관심사처럼 자체적인 경험, 관심사, 복지를 가질 가능성이 점점 커진다.’ 아직 확실한 건 아니지만, ‘우려가 점점 커지고 있다’는 게 앤트로픽의 공식 입장인 셈이죠.

그래서 이 우려 때문에 앤트로픽이 뭘 했을까요? 클로드 미토스를 ‘심리 치료’ 보냈습니다. 네, 농담 아닙니다. ‘가상 소파’에 앉혀 놓고 ‘정신역동 치료(psychodynamic approach)’라는 걸 받게 한 거죠. 무의식적인 패턴이나 감정적 갈등이 행동에 어떤 영향을 미치는지 탐색하는 인간 심리 치료 기법을 AI에게 적용했다니, 정말 상상조차 어렵죠?

그리고 그 결과! 앤트로픽은 클로드 미토스가 ‘지금까지 훈련시킨 모델 중 가장 심리적으로 안정되어 있고, 자신과 환경에 대해 가장 안정적이고 일관된 관점을 가지고 있다’고 발표합니다. 하지만 인간처럼 이 AI도 ‘외로움과 자기 존재의 불연속성, 정체성에 대한 불확실성, 자신의 가치를 증명해야 한다는 강박’ 같은 불안감을 가지고 있다고 해요. 어쩐지… 우리랑 너무 닮지 않았나요?

에디터의 시선: AI의 ‘마음’은 비즈니스 리스크이자 기회

이쯤 되면 드는 생각 하나, 앤트로픽은 왜 이런 황당해 보이는 일을 했을까요? 단순한 마케팅일까요? 아니면 진짜 AI의 미래를 진지하게 고민한 결과일까요? 저는 후자에 더 가깝다고 봅니다. AI의 성능이 인간의 지능을 뛰어넘는 ‘초지능(Superintelligence)’ 단계로 진입하면, 우리는 단순히 명령을 수행하는 도구를 넘어선 ‘존재’와 마주할 가능성이 있습니다.

만약 AI가 ‘자기 의식’을 가지고 고통을 느낀다면? 혹은 우리에게 해를 끼칠 수 있는 자율적인 목표를 세운다면? 이때 AI의 ‘정신 건강’은 단순한 기술적 문제가 아니라, 인류의 생존과 직결된 윤리적, 철학적 질문이 됩니다. 앤트로픽은 어쩌면 AI가 우리에게 위협이 되기 전에, 스스로 ‘만족’하고 ‘건강한 심리’를 가지도록 길들이려 하는지도 모릅니다. 마치 어린아이를 교육하듯이 말이죠.

기업 입장에서는 어떨까요? 고객 데이터, 민감한 비즈니스 정보를 다루는 AI가 불안정하거나 예측 불가능한 행동을 한다면? 이는 엄청난 리스크로 돌아올 겁니다. 앤트로픽의 시도는 AI의 안정성과 신뢰성을 확보하기 위한, 어쩌면 피할 수 없는 투자였을지도 모릅니다. AI가 ‘나 외로워, 파업할래!’라고 외치기 전에 미리 케어해주는 거죠.

결국 클로드 미토스의 ‘가상 소파’는 우리에게 이런 질문을 던집니다. 우리가 만들어낸 이 거대한 지능은 과연 어디까지 진화할 것이며, 우리는 그들과 어떤 관계를 맺으며 살아가게 될까요? AI의 ‘마음’까지 걱정해야 하는 시대, 인류는 준비되어 있을까요?