LLM은 생각보다 똑똑하고, 생각보다 멍청하다

모두의주차장 블로그 썸네일

주차장에 들어갈 때 앱으로 미리 주차권을 결제해뒀는데, 막상 나갈 때 차단기가 열리지 않아 현장에서 한 번 더 결제해야 했던 적이 있으신가요? 뒤 차량의 경적 소리에 우선 현장에서 주차비를 내기는 했지만, 이중으로 결제된 주차비를 환불받을 생각에 벌써부터 귀찮은 생각이 들죠. 미리 싼 주차권을 알아보고, 결제해둔 시간과 에너지가 아깝기도 하고요.

쏘카가 운영하는 온라인 주차 플랫폼 '모두의주차장'에서도 이런 문제가 반복되고 있었어요. 장비사와의 연동 오류가 고질적인 문제의 원인이었는데요. 최근, 쏘카는 이 오랜 숙제를 AI 에이전트로 풀어냈습니다.

단 2주만에 완성한, 고객이 이상이 있었는지조차 모르게 시스템이 알아서 문제를 감지하고 복구하는 시스템! 멀티 에이전트 시스템으로 주차권 연동 장애를 잡아낸 주차코어개발팀의 잰슨, 토닉을 만나 자세한 이야기를 들어봤습니다.

모두의주차장 토닉, 잰슨

@토닉(코어개발팀) @잰슨(코어개발팀)

‘주차권 연동 장애’, 텍스트로만 봤을 때는 잘 와닿지 않는데요. 정확히 어떤 문제였나요?

쉽게 말하면 앱으로 결제한 주차권이 막상 현장에서는 인식되지 않는 거예요. 예를 들어 저녁 9시 30분에 모두의주차장 앱에서 주차권을 결제하고 입차했는데, 밤 11시에 출차하려고 정산소에 도착하니까 차단기가 열리지 않는 거죠. 결국에는 일단 현장에서 한 번 더 결제할 수밖에 없는 상황이 벌어지고요.

문제는 이게 끝이 아니라는 거예요. 출차 이후에 고객님이 직접 고객센터에 연락해서 환불을 요청해야 하고, 영수증 증빙도 따로 제출해야 해요. 기존에는 이 환불이 완료되기까지 평균 8.8일이 걸렸으니까, 결제 시점부터 따지면 거의 열흘 가까이 불편을 겪어야 하는 셈이죠. 시간적 피해와 금전적 피해도 크지만, 무엇보다 서비스에 대한 신뢰가 무너지는 게 가장 뼈아픈 부분이었어요.

모두의주차장 주차권 연동 장애

일부 모두의주차장 고객이 겪어왔던 주차권 연동 장애 구조도

연간 결제 건의 6.3%에 해당하는 문제였다고 들었어요. 시급하게 해결해야하는 상황이었다고요?

그 6.3%의 에러 케이스가 미치는 부정적인 영향이 너무 컸거든요. 모두의주차장의 앱스토어 리뷰를 분석해봤더니 최근 30일 부정 리뷰 비율이 62%에 달했고, 평균 별점도 2.5점까지 떨어진 상태였습니다. '이중결제', '차단기안열림', '고객센터안받음' 같은 부정적인 키워드도 계속 등장했고요.

운영 측면에서는 이 문제를 해결하기 위해 큰 비용이 숨어있다는 게 문제였어요. 장애 대응과 환불 처리에 적지 않은 운영 리소스가 단순 반복 작업으로 소모되고 있었거든요. AI 시대에 이렇게 많은 리소스가 반복 대응에 묶여 있다는 게 정말 큰 기회비용이라고 생각했어요.

정리하자면, 작은 불편이 서비스 전체의 신뢰 위기로 확산되고, 결국 "다시는 이 앱 안 쓴다"는 이탈로 이어지는 크리티컬한 문제였던 셈이에요.

그동안에도 장애 대응은 꾸준히 해오셨을텐데요. 문제가 반복된 원인은 뭐였나요?

근본적인 원인은 주차 시스템 자체의 구조적 한계에 있었어요. 모두의주차장과 협력하는 장비사는 55개나 있고, 주차장은 5,500개에 달해요. 표준 없이 제각각의 웹 인터페이스로 운영되니까 통합 관리가 불가능한 복잡성이 있었죠.

또, 대부분의 주차장이 로컬 네트워크 기반으로 운영되니까 중앙 서버보다 안정성이 현저히 떨어져요. 장비사가 사전 고지 없이 UI나 API를 수시로 변경해버리는 것도 문제였어요. 그러면 기존 연동 로직이 한순간에 깨져버려서 오류가 발생하거든요.

사람이 5,500개 주차장을 24시간 감시하는 건 물리적으로 불가능하잖아요. 그래서 그동안은 구조적으로 '고객이 피해를 본 뒤에야' 움직일 수밖에 없었죠. 장애가 발생하고, 고객이 이중결제를 하고, CS에 접수가 들어오고, 그제서야 담당자가 수동으로 원인을 분석하고 복구하는 흐름이었어요. 실제 로그를 보면 케이스마다 리드타임이 짧게는 4시간, 길게는 5일 이상이 걸리기도 했죠.

'룰 기반 자동화'로는 해결이 어려웠다고 들었어요. 그래서 AI 에이전트를 선택하신 거고요.

맨 처음에는 장비사별로 룰 기반 자동화 스크립트를 구축했었어요. 그런데 여기서 오류가 나면, 그걸 다시 룰 기반 자동화로 잡을 수는 없더라고요. 원인이 너무 많아서요. 장애 원인의 변동은 사실상 무한대인데, 예측 가능한 패턴을 전부 미리 입력한다는 건 사실 불가능했죠.

그래서 자율성을 가진 AI 에이전트가 필수적이라고 판단했어요. AI 에이전트는 화면을 보고 요소 위치를 파악하는 시각적 판단 능력이 있고, 변경점을 스스로 감지해서 로직을 적응시킬 수 있어요. 새로운 UI도 자연어 기반으로 문맥을 이해할 수 있고요. 예측 불가능한 변동에도 대응할 수 있다는 게 핵심이었습니다.

AI에게 모든 걸 맡기지 않고, 마지막 단계에서는 사람이 검토하도록 설계하셨어요. 이유가 있을까요?

LLM은 본질적으로 비결정적인 시스템이에요. 같은 입력을 줘도 결과가 매번 똑같이 나오지 않을 수 있다는 뜻이죠. 저희가 이번 프로젝트를 진행하면서 정말 자주 얘기했던 게, "LLM은 생각보다 똑똑한데, 생각보다 멍청하다"는 거예요. 기대 이상의 결과를 내놓을 때도 있지만, 정말 기본적인 동작을 반복하지 못할 때도 있었거든요.

그래서 파급력이 큰 작업, 특히 운영 환경에 코드를 배포하는 단계에서는 반드시 사람이 검토해야 한다고 생각했어요. 자동 감지와 자동 복구는 빠르게 진행하되, 코드 패치는 Draft PR 형태로 제안만 하고 개발자가 검토 후 승인하도록 설계한 거죠. 완전 자동화가 이상적으로 보이지만, 현실에서는 개발자가 최종 승인을 내리는 게 훨씬 안전하고 실용적이에요. 안전성과 효율성을 동시에 잡을 수 있는 가장 현실적인 답이었다고 봐요.

모두의주차장 본문2

주차권 연동 장애 AI 에이전트의 구조도

착수부터 개발 완료까지, 단 2주만에 끝냈다고 들었어요. 어떻게 그렇게 빠른 속도로 프로젝트를 수행할 수 있었나요?

매일 밤새면 됩니다.(하하) 농담이고요. 회사에서 운영하는 AI 파일럿 프로그램에 선정되었던 게 가장 컸던 것 같아요. 파일럿 프로그램에 선정되면 회사 차원에서 기존에 맡고 있던 모든 프로젝트와 업무 대신, 파일럿 프로젝트에 집중할 수 있도록 지원을 해주고 있거든요. 그래서 업무시간 내내 에이전트 개발에 몰두할 수 있었습니다.

그리고 저희 주차그룹은 AI 학습을 위한 워크샵을 수차례 진행해왔어요. 주차권 연동 장애 대응 에이전트를 개발하면서도 워크샵에서 학습했던 지식들을 그대로 활용했기 때문에 빠른 시간 안에 개발이 가능했던 것 같아요.

도입 이후의 변화도 드라마틱했다고요.

실패 원인 분류 정확도가 100%를 기록했어요. 맨 처음 설정했던 목표는 90% 이상이었는데, 완벽하게 분류하는 데 성공했습니다. 운영 리드타임도 98% 단축했어요. 기존에는 장애 발생부터 담당자가 인지하기까지 평균 4시간이 걸렸는데, 이제는 5분 이내로 줄었습니다.

하지만 가장 의미 있는 변화는 따로 있어요. 예전에는 고객이 출차하다가 차단기에 막히고, 18,000원을 현장에서 다시 결제하고, 직접 CS에 환불 요청하고, 영수증을 제출하고, 평균 8.8일을 기다려야 했어요. 지금은요? 고객은 그냥 10초만에 정상 출차해요. 백그라운드에서 장애 발생, 에이전트 감지, 자동 복구가 모두 고객이 도착하기 전에 끝나거든요. 고객은 이상이 있었는지조차 모르는 상태죠. 단순히 내부 프로세스 시간만 줄인 게 아니라 고객 경험 자체를 완전히 바꿨다는 점에서 가장 의미 있는 성과라고 생각해요.

이번 프로젝트를 진행하면서 가장 크게 배운 점이 있다면요?

사회적으로 AI가 크게 부각되다 보니, 모든 문제를 AI로 해결하려는 함정에 빠지기 쉬워요.

2주간 장애 원인을 하나씩 뜯어보면서 저희가 가장 자주 주고받은 말이 "이거, 에이전트 안 끼워도 되겠는데요?"였어요. '어쩔 수 없다'며 오랫동안 덮어뒀던 문제들이, 막상 들춰보니 단순한 구조 개선만으로 풀리는 경우가 많았거든요. 익숙해서 안 보이던 것들이지, 못 고칠 문제는 아니었던 거예요.

이 과정을 거치면서 팀 내부에 한 가지 기준이 자리 잡았어요. AI가 잘 하는 영역과 그렇지 못한 영역을 먼저 구분하고, 꼭 필요한 지점에만 적용하자는 거예요. 때로는 AI를 사용하지 않고 기존 시스템을 활용해서 해결하는게 훨씬 빠르고 비용도 합리적인 경우가 많았습니다.

마지막으로 성공적으로 프로젝트를 마무리한 소감을 들려주세요.

AI Agent에 대한 막연한 기대와 두려움이 함께 있었는데, 실제 문제를 푸는 데 활용해보니 이해도도 올라가고 자신감이 붙었어요. 그리고 막연함이 걷히고 나니, 오히려 AI 자체보다 고객의 문제가 더 또렷하게 보이더라고요. 결국 프로덕트를 다루는 팀의 궁극적인 목표는 고객이 겪고 있는 문제를 해결하는 일이에요. 앞으로도 고객의 문제를 차근차근 풀어가고 싶고, 그 과정에서 AI가 적합한 지점이 보이면 적극적으로 도입해보려고 해요.