Claude Code가 다시 불러온 열정

요즘 다시 밤을 새우기 시작했다. 처음 코딩을 배웠을 때 느꼈던 그 설레임이 돌아온 기분이다. Claude Code라는 도구를 만나면서부터 내 일상은 완전히 바뀌었다. 단순히 코드를 짜주는 기계가 아니라, 내 생각을 현실로 옮겨주는 가장 강력한 파트너를 만난 것 같다. 프로그래밍이라는 행위가 주는 본질적인 즐거움이 무엇인지 다시 생각하게 되는 요즘이다.

Read more

AI 에이전트 시대의 진짜 병목은 신뢰다

요즘 어딜 가나 AI 에이전트라는 단어가 들려온다. 코딩을 대신하고 이메일을 분류하며 심지어 금융 거래까지 실행하는 이 기술은 이미 우리 곁에 깊숙이 들어와 있다. 하지만 정작 우리가 AI 에이전트에게 얼마나 많은 권한을 주고 있는지, 그리고 실제로 그들이 얼마나 자율적으로 움직이고 있는지에 대한 데이터는 부족했다. 최근 앤트로픽(Anthropic)이 발표한 실전에서 AI 에이전트 자율성 측정하기라는 연구는 그래서 더 의미가 깊다. 이 연구는 단순히 AI가 얼마나 똑똑해졌는가를 따지는 게 아니라 사람들이 실제로 얼마나 많은 일을 AI에게 맡기고 있는가를 분석했다. 결과는 꽤나 흥미로웠다. AI의 능력은 이미 충분한데 문제는 우리의 신뢰였다.

Read more

그럴듯한 코드를 쓰는 LLM과 그 이면

최근 개발자 커뮤니티에서 LLM이 생성하는 코드의 품질을 두고 매우 흥미로운 논쟁이 벌어졌다. '너의 LLM은 정확한 코드가 아니라 그럴듯한 코드를 쓴다’는 제목의 글이 큰 화제가 되었는데, 한 개발자가 Rust로 SQLite를 처음부터 끝까지 재구현한 프로젝트를 분석한 내용이다. 겉으로 보기에는 수십만 줄의 방대한 코드가 완벽한 구조를 갖추고 테스트를 통과하며 실제 SQLite 파일 포맷을 읽고 쓰는 것처럼 보이지만, 성능 면에서는 원본 SQLite보다 2만 배나 느리다는 충격적인 결과가 나왔다. 이는 LLM이 아키텍처나 모듈의 이름 같은 외형은 그럴듯하게 흉내 내지만, 성능을 결정짓는 핵심적인 최적화 로직이나 불변식은 놓치기 쉽다는 점을 시사한다.

Read more

바이브 코딩과 탑다운 방식에 대한 오해

요즘 바이브 코딩이라는 말이 유행하면서 이를 비판하는 목소리도 자주 들린다. 탑다운 방식이라 밑바닥을 모른다는 지적이 대표적이다. 하지만 솔직히 말해서 우리 개발자들 중에 정말로 바텀업으로 시작한 사람이 얼마나 있을지 의문이 든다. 대부분은 일단 무엇이라도 만들어보면서 실력을 쌓았다. 코드를 복사해서 붙여넣고, 에러가 나면 구글을 뒤지고, 돌아가는 걸 확인한 뒤에야 왜 이게 되는지 파악하는 과정이 익숙하다. 이것이 바로 전형적인 탑다운 방식이고, 우리 대부분이 성장해온 경로다.

Read more

멀티태스킹의 치명적인 비용과 몰입의 가치

요즘처럼 도구가 발전한 시대에는 여러 일을 동시에 처리하는 것이 마치 유능한 현대인의 필수 덕목처럼 여겨지곤 한다. 사실 실무를 하다보면 여기저기서 요청도 많이 오고 회의 일정도 많다보니 어쩔 수 없는 부분이기도 하다. 이런 것은 꽤 생산적으로 보이지만, 뇌 과학과 다양한 생산성 연구를 들여다보면 실상은 정반대라는 것을 알 수 있다. 우리가 멀티태스킹이라고 부르는 행위는 사실 아주 빠른 속도로 작업 사이를 오가는 컨텍스트 스위칭에 불과하며, 이 과정에서 발생하는 보이지 않는 비용은 우리의 일상을 잠식한다.

Read more

AI 에이전트의 본질에 집중해야 할 때

최근 AI 에이전트 기술이 급격히 발전하면서 많은 개발자가 이를 자신의 업무나 서비스에 도입하려 노력하고 있다. 하지만 시중에 나와 있는 수많은 프레임워크와 플러그인을 활용함에도 불구하고 만족스러운 결과를 얻지 못하는 경우가 허다하다. 이는 기술의 본질적인 원칙을 이해하기보다 겉으로 보이는 화려한 기능에 매몰되었기 때문이다. 에이전트를 제대로 다룬다는 것은 단순히 프롬프트를 잘 쓰는 수준을 넘어 모델의 지능을 최적으로 끌어낼 수 있는 환경을 설계하는 작업이다.

Read more

AI 엔지니어가 지구에 남는 마지막 직업이 되는 이유

최근 AI 업계에서 가장 도발적이면서도 설득력 있는 주장이 하나 들려왔다. 바로 AI 엔지니어가 지구상에 남는 마지막 직업이 될 것이라는 예측이다. 처음에는 2023년의 AI 엔지니어 부상을 강조하기 위한 일종의 밈(meme)처럼 시작되었지만, 2026년에 들어선 지금 이 농담은 점점 더 무거운 현실로 다가오고 있다. 인공지능이 화이트칼라 업무의 70%를 수행할 수 있다는 분석이 지배적인 상황에서, 왜 하필 소프트웨어 엔지니어링 포스팅은 오히려 늘어나고 있는지에 대한 답이 여기에 숨어 있다. 단순히 코딩을 잘하는 사람의 시대가 가고, AI를 활용해 세상을 재설계하는 엔지니어의 시대가 오고 있다.

Read more

클로드 코드가 가장 잘 다루는 프로그래밍 언어는 무엇일까

AI 에이전트 시대가 본격적으로 열리면서 우리가 프로그래밍 언어를 선택하는 기준이 근본적으로 흔들리고 있다. 과거에는 인간 개발자의 가독성이나 실행 성능, 혹은 생태계의 크기가 가장 중요한 지표였다면 이제는 AI 에이전트가 얼마나 효율적으로 코드를 생성하고 검증할 수 있는지가 새로운 척도로 부상했다. 최근 엔도 유스케가 클로드 코드(Claude Code)를 활용해 13개 프로그래밍 언어의 생산성을 정량적으로 분석한 결과는 이런 변화를 아주 명확하게 보여준다. 단순히 어떤 언어가 좋다는 주관적인 논쟁을 넘어 시간과 비용이라는 구체적인 수치로 증명된 데이터는 우리가 앞으로 어떤 언어로 개발을 시작해야 할지에 대해 많은 시사점을 던져준다.

Read more

퓨샷 프롬프팅으로 AI 에이전트의 신뢰도를 한 단계 높이는 방법

AI 에이전트를 개발하다 보면 테스트 환경에서는 완벽하게 작동하던 녀석이 실제 배포만 하면 엉뚱한 짓을 하는 경우를 자주 보게 된다. 지침도 잘 따르고 도구 호출도 깔끔하게 하던 모델이 갑자기 이상한 출력을 내놓으면 당황스럽기 그지없다. 모델이 갑자기 멍청해진 것도 아니고 프롬프트가 바뀐 것도 아닌데 왜 이런 일이 벌어질까? 대부분의 경우 그 이유는 실제 사용자들이 입력하는 데이터가 우리가 예상한 것보다 훨씬 지저분하고 모호하기 때문이다. 단순히 지시 사항을 나열하는 것만으로는 실제 환경의 복잡한 변수들을 모두 통제하기 어렵다는 뜻이다.

Read more

인공지능이 일자리를 빼앗는 방식은 생각보다 조용하고 잔인하다

이틀 전 Anthropic에서 흥미로운 보고서 하나를 내놨다. 자기들이 만든 Claude가 노동 시장에 어떤 영향을 주고 있는지 직접 조사한 내용이다. 제목은 'Labor Market Impacts of AI’인데, 기존의 추상적인 예측들과는 결이 조금 다르다. 실제로 사람들이 Claude를 어떻게 쓰고 있는지 데이터를 결합해서 분석했기 때문이다. 이 보고서를 보면 겉으로 드러난 숫자보다 그 이면에 숨겨진 신호들이 훨씬 더 무겁게 다가온다. 많은 이들이 인공지능이 인간의 일자리를 당장 빼앗을 것처럼 말하지만, 실제 데이터는 조금 더 복잡하고 교묘한 이야기를 하고 있다.

Read more