본문 바로가기

오픈소스1

GLM-OCR 사용기: 로컬 LLM으로 완성한 무료 OCR 혁명 최근 서비스를 개발하면서 큰 벽에 부딪혔습니다. 이미지 속 텍스트를 추출하는 기능이 필수였는데, 기존 OCR 도구들의 성능이 너무나 절망적이었기 때문입니다. 그러다 우연히 중국의 지푸 AI에서 공개한 GLM-OCR 모델을 접하게 되었습니다. 비싼 API 비용과 낮은 인식률이라는 두 가지 문제를 한 번에 해결해 준 이 모델은 제 프로젝트의 구세주나 다름없었습니다.1. 기존 OCR의 한계와 GLM-OCR의 등장 배경제가 직접 서비스를 기획하면서 가장 골치 아팠던 부분은 바로 문서 인식률이었습니다. 보통 우리가 아는 테서랙트 같은 엔진이나 가벼운 시각 언어 모델들은 글자를 단순히 읽어내는 수준에는 도달했지만, 복잡한 표나 서식을 만나면 결과물이 엉망이 되기 일쑤였습니다. 제 경험상 이런 문제 때문에 결국 비싼.. 2026. 2. 24.

이전 1 다음

소개 및 문의 · 개인정보처리방침 · 면책조항

© 2026 블로그 이름

티스토리툴바