본문 바로가기

인공지능2

GLM-OCR 사용기: 로컬 LLM으로 완성한 무료 OCR 혁명 최근 서비스를 개발하면서 큰 벽에 부딪혔습니다. 이미지 속 텍스트를 추출하는 기능이 필수였는데, 기존 OCR 도구들의 성능이 너무나 절망적이었기 때문입니다. 그러다 우연히 중국의 지푸 AI에서 공개한 GLM-OCR 모델을 접하게 되었습니다. 비싼 API 비용과 낮은 인식률이라는 두 가지 문제를 한 번에 해결해 준 이 모델은 제 프로젝트의 구세주나 다름없었습니다.1. 기존 OCR의 한계와 GLM-OCR의 등장 배경제가 직접 서비스를 기획하면서 가장 골치 아팠던 부분은 바로 문서 인식률이었습니다. 보통 우리가 아는 테서랙트 같은 엔진이나 가벼운 시각 언어 모델들은 글자를 단순히 읽어내는 수준에는 도달했지만, 복잡한 표나 서식을 만나면 결과물이 엉망이 되기 일쑤였습니다. 제 경험상 이런 문제 때문에 결국 비싼.. 2026. 2. 24.
ChatPDF 2년 실사용 후기 (ChatPDF, 대학원생, 논문요약) 솔직히 고백하자면 수십 페이지에 달하는 영어 논문을 마주할 때마다 도망치고 싶은 충동을 자주 느꼈습니다. 대학원 연구와 개인 프로젝트를 핑계로 읽어야 할 자료는 산더미처럼 쌓여가는데 물리적인 시간은 항상 턱없이 부족했기 때문입니다. 하지만 거대한 문서를 통째로 씹어먹고 대화형으로 요약해 주는 놀라운 인공지능 서비스를 만나면서 제 연구 생활의 질은 완전히 뒤바뀌게 되었습니다.ChatPDF의 핵심 기능과 직관적인 작업 환경과거에는 어려운 전공 서적이나 복잡한 영문 가이드를 하나씩 번역기를 돌려가며 힘겹게 해석해야만 했습니다. 지금은 챗지피티와 비슷한 대화창에 피디에프 파일을 툭 던져 넣기만 하면 시스템이 알아서 전체 내용을 순식간에 학습해 버립니다. 문서를 통째로 업로드한 뒤 알고리즘의 최적화 방식이나 특정.. 2026. 2. 23.

소개 및 문의 · 개인정보처리방침 · 면책조항

© 2026 블로그 이름