본문 바로가기

지푸AI2

GLM-OCR 사용기: 로컬 LLM으로 완성한 무료 OCR 혁명 최근 서비스를 개발하면서 큰 벽에 부딪혔습니다. 이미지 속 텍스트를 추출하는 기능이 필수였는데, 기존 OCR 도구들의 성능이 너무나 절망적이었기 때문입니다. 그러다 우연히 중국의 지푸 AI에서 공개한 GLM-OCR 모델을 접하게 되었습니다. 비싼 API 비용과 낮은 인식률이라는 두 가지 문제를 한 번에 해결해 준 이 모델은 제 프로젝트의 구세주나 다름없었습니다.1. 기존 OCR의 한계와 GLM-OCR의 등장 배경제가 직접 서비스를 기획하면서 가장 골치 아팠던 부분은 바로 문서 인식률이었습니다. 보통 우리가 아는 테서랙트 같은 엔진이나 가벼운 시각 언어 모델들은 글자를 단순히 읽어내는 수준에는 도달했지만, 복잡한 표나 서식을 만나면 결과물이 엉망이 되기 일쑤였습니다. 제 경험상 이런 문제 때문에 결국 비싼.. 2026. 2. 24.
GLM-5 가성비 끝판왕 코딩 에이전트 사용기 매달 청구되는 API 비용 명세서를 볼 때마다 가슴이 철렁했습니다. 개발자로서 성능 좋은 AI 도구를 포기할 수는 없었기에 울며 겨자 먹기로 비싼 모델들을 써왔던 것이 사실입니다. 그런데 최근 중국의 Zhipu AI가 예고도 없이 GLM-5를 공개했다는 소식을 접하고 무릎을 쳤습니다. 이전 버전인 GLM-4.7을 사용했을 때도 클로드 코드 대비 압도적인 가성비에 놀랐던 기억이 있는데, 이번에는 성능까지 대폭 개선되었다니 기대가 안 될 수 없었습니다. 에이전트 워크플로우 시장의 판도를 뒤흔들 이 새로운 모델을 제가 직접 살펴보고 느낀 점을 가감 없이 풀어보려 합니다.가성비로 무장한 GLM-5의 등장 배경개발자 커뮤니티에서 흔히 하는 농담이 있습니다. 성능은 클로드가 좋지만, 지갑을 지키려면 다른 대안을 찾.. 2026. 2. 24.

소개 및 문의 · 개인정보처리방침 · 면책조항

© 2026 블로그 이름