본문 바로가기

전체 글26

Google Gemini Lyria 3 기술력과 저작권의 딜레마 처음 구글의 인공지능이 실시간으로 음악을 뚝딱 만들어내는 장면을 목격했을 때 솔직히 온몸에 소름이 돋았습니다. 과거 영상 편집 작업을 하며 영상 분위기에 딱 맞는 배경음악 하나를 찾기 위해 며칠 밤을 새우던 제 수고로운 시간들이 한순간에 부정당하는 기분이 들었기 때문입니다. 오늘은 이 거대한 변화의 중심에 서 있는 제미나이와 리리아 3 기술을 면밀히 살펴보고 피할 수 없는 저작권 문제에 대한 제 솔직한 생각까지 차분하게 정리해 보려 합니다.제미나이 생태계에 들어온 완벽한 창작자구글 딥마인드가 야심 차게 선보인 리리아 3 모델이 대화형 인공지능 시스템 안에 기본 탑재되었다는 소식은 관련 업계 전반에 엄청난 충격파를 던졌습니다. 불과 몇 년 전만 해도 작곡을 하려면 복잡한 미디 장비를 만지거나 수많은 오디오.. 2026. 2. 25.
구글 Project IDX와 파이어베이스 스튜디오의 혁신 로컬호스트는 죽었다는 도발적인 문장이 제 머리를 강하게 때렸습니다. 개발자라면 누구나 새로운 노트북을 사서 개발 환경을 세팅하느라 며칠 밤을 지새운 경험이 있을 것입니다. 저 또한 수많은 라이브러리 버전 충돌과 싸우며 피로를 느꼈던 적이 한두 번이 아닙니다. 그런데 구글이 웹 브라우저 하나로 모든 개발 과정을 끝낼 수 있는 Project IDX를 공개하며 판을 흔들고 있습니다. 특히 제 경험상 이 변화는 단순히 도구가 바뀌는 수준을 넘어섭니다. 이전에 구글이 Project IDX라는 웹 브라우저에서의 IDE를 개발했는데 이게 Firebase Studio로 바뀌었습니다. 이러한 흐름을 보며 구글이 개발자 생태계를 장악하기 위해 얼마나 치열하게 고민하고 있는지 느낄 수 있었습니다.Project IDX가 제시.. 2026. 2. 24.
GLM-OCR 사용기: 로컬 LLM으로 완성한 무료 OCR 혁명 최근 서비스를 개발하면서 큰 벽에 부딪혔습니다. 이미지 속 텍스트를 추출하는 기능이 필수였는데, 기존 OCR 도구들의 성능이 너무나 절망적이었기 때문입니다. 그러다 우연히 중국의 지푸 AI에서 공개한 GLM-OCR 모델을 접하게 되었습니다. 비싼 API 비용과 낮은 인식률이라는 두 가지 문제를 한 번에 해결해 준 이 모델은 제 프로젝트의 구세주나 다름없었습니다.1. 기존 OCR의 한계와 GLM-OCR의 등장 배경제가 직접 서비스를 기획하면서 가장 골치 아팠던 부분은 바로 문서 인식률이었습니다. 보통 우리가 아는 테서랙트 같은 엔진이나 가벼운 시각 언어 모델들은 글자를 단순히 읽어내는 수준에는 도달했지만, 복잡한 표나 서식을 만나면 결과물이 엉망이 되기 일쑤였습니다. 제 경험상 이런 문제 때문에 결국 비싼.. 2026. 2. 24.
GLM-5 가성비 끝판왕 코딩 에이전트 사용기 매달 청구되는 API 비용 명세서를 볼 때마다 가슴이 철렁했습니다. 개발자로서 성능 좋은 AI 도구를 포기할 수는 없었기에 울며 겨자 먹기로 비싼 모델들을 써왔던 것이 사실입니다. 그런데 최근 중국의 Zhipu AI가 예고도 없이 GLM-5를 공개했다는 소식을 접하고 무릎을 쳤습니다. 이전 버전인 GLM-4.7을 사용했을 때도 클로드 코드 대비 압도적인 가성비에 놀랐던 기억이 있는데, 이번에는 성능까지 대폭 개선되었다니 기대가 안 될 수 없었습니다. 에이전트 워크플로우 시장의 판도를 뒤흔들 이 새로운 모델을 제가 직접 살펴보고 느낀 점을 가감 없이 풀어보려 합니다.가성비로 무장한 GLM-5의 등장 배경개발자 커뮤니티에서 흔히 하는 농담이 있습니다. 성능은 클로드가 좋지만, 지갑을 지키려면 다른 대안을 찾.. 2026. 2. 24.
젠스파크 후기, 올인원 AI 워크스페이스의 명암 새로운 AI 도구가 쏟아지는 요즘, 단순히 질문에 답만 해주는 챗봇을 넘어 아예 문서를 만들어주는 서비스를 발견했습니다. 바로 젠스파크입니다. 처음 이 서비스를 접했을 때 기존의 검색 엔진과는 차원이 다른 편리함에 놀랐습니다. 검색과 생성이 결합된 올인원 AI 워크스페이스라는 설명이 과장이 아니었습니다. 하지만 며칠 사용해보면서 감탄 뒤에 오는 현실적인 고민도 함께 생겼습니다. 오늘은 제가 직접 경험한 젠스파크의 혁신적인 기능과 함께, 사용자의 입장에서 느낀 솔직한 아쉬움에 대해 이야기를 풀어보려 합니다.젠스파크 스파크페이지가 보여준 검색의 미래제가 이 서비스를 사용하며 가장 인상 깊었던 점은 검색 결과의 형태였습니다. 보통 우리가 검색창에 질문을 입력하면 수많은 링크가 뜨거나, AI가 텍스트로 된 답변.. 2026. 2. 24.
구글 Stitch 후기: 바이브 코딩 디자인 한계 극복 솔직히 고백하자면 저는 개발 로직을 짜는 것보다 디자인을 입히는 게 훨씬 더 어렵고 고통스럽습니다. 요즘 유행하는 바이브 코딩 덕분에 기능 구현은 순식간에 해치우지만, 막상 결과물을 보면 투박하기 짝이 없어서 한숨이 나올 때가 많았습니다. 기능은 완벽한데 겉모습은 10년 전 웹사이트 같은 느낌이 들었기 때문입니다. 그런데 최근 구글 Stitch (스티치)를 접하고 나서 이 고민이 말끔히 해결되는 경험을 했습니다. 저처럼 코딩은 되는데 디자인이 안 되는 분들을 위해 제가 직접 써보고 느낀 점을 가감 없이 풀어보겠습니다.바이브 코딩의 딜레마와 디자인의 벽요즘 저는 자연어로 코드를 짜는 바이브 코딩 방식에 푹 빠져 있습니다. 복잡한 문법을 몰라도 원하는 기능을 말만 하면 AI가 뚝딱 만들어주는 세상이 왔으니까.. 2026. 2. 23.

소개 및 문의 · 개인정보처리방침 · 면책조항

© 2026 블로그 이름