태그

OCR 기술 블로그 글

OCR 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.

전체 18개최신 18개 표시

#LLM995 #Amazon Bedrock112 #자동화304 #ML283 #prompt217 #Docker117 #ChatGPT95 #멀티모달21 #VLM8 #Computer Vision7 #AWS635 #cloud422

Amazon Bedrock Vision LLM과 Amazon OpenSearch Service를 활용한 농약 제품 이미지 인식 시스템 구축기

농약 제품 사진을 인식해 정보를 찾는 3단계 AI 검색 시스템을 구축했습니다. Vision LLM 오인식을 오타 보정, OpenSearch Fallback, LLM Reranker로 보완했습니다.

#Amazon Bedrock#OpenSearch Service#LLM

3200

Amazon Bedrock Vision LLM과 Amazon OpenSearch Service를 활용한 농약 제품 이미지 인식 시스템 구축기

2026년 4월 7일

부트텐트의 생성형 AI 기반 교육과정 등록 자동화 시스템 구성하기

부트텐트는 모집 페이지를 분석해 교육과정 등록 초안을 자동 생성하는 파이프라인을 구축했습니다. 하이브리드 OCR과 검증 에이전트를 적용해 정확도와 비용, 처리 시간을 함께 개선했습니다.

#Amazon Bedrock#AWS Step Functions#Amazon EC2

2800

2026년 3월 9일

매월 반복되던 무이자 할부 정보 업로드 자동화: PM의 개발 도전기

매월 반복되던 무이자 할부 업로드를 AI OCR과 자동 파이프라인으로 전환한 사례입니다. 사람의 최종 승인과 재시도, 슬랙 알림을 더해 운영 리스크를 줄였습니다.

#자동화#OCR#파이프라인

7800

매월 반복되던 무이자 할부 정보 업로드 자동화: PM의 개발 도전기

2025년 12월 5일

LLM이지만 PDF는 읽고 싶어: 복잡한 PDF를 LLM이 이해하는 방법

복잡한 PDF를 LLM이 이해하도록 돕는 PaLADIN을 소개했습니다. 표·차트·숫자 처리 아키텍처와 성능 평가, 서비스 적용 사례를 함께 다뤘습니다.

#LLM#PDF#OCR

38000

LLM이지만 PDF는 읽고 싶어: 복잡한 PDF를 LLM이 이해하는 방법

2025년 11월 24일

두려움 너머에서 만난 성장: 숙박 상품 등록 자동화 이야기

숙박 상품 등록 흐름을 Slack, Google Sheets, OCR, API, Playwright로 자동화했습니다. 온보딩 시간을 10분 내외로 줄이고 반복 오류도 줄였습니다.

#자동화#OCR#Google Sheets

4700

두려움 너머에서 만난 성장: 숙박 상품 등록 자동화 이야기

2025년 10월 3일

한 달짜리 과제, 바이브 코딩으로 5일 만에!(ChatGPT·Cursor)

생성형 AI와 Flutter로 메뉴 등록 앱 데모를 5일 만에 만든 실험을 소개했습니다. 요구 분해와 반복 수정은 유효했지만, 프로덕션용 안전장치는 부족했습니다.

#ChatGPT#Cursor#Flutter

16200

한 달짜리 과제, 바이브 코딩으로 5일 만에!(ChatGPT·Cursor)

2025년 8월 27일

GS리테일의 Amazon Bedrock을 활용한 AI 와인 라벨 이미지 검색 서비스 구축

GS리테일은 Amazon Bedrock으로 와인 라벨 이미지 검색 서비스를 구축했습니다. Claude와 멀티모달 임베딩, Elasticsearch를 결합해 다국어 라벨 검색 품질을 높였습니다.

#Amazon Bedrock#LLM#멀티모달

5400

GS리테일의 Amazon Bedrock을 활용한 AI 와인 라벨 이미지 검색 서비스 구축

2025년 8월 6일

“보이는 데이터”를 “쓸 수 있는 데이터 “로: 코오롱몰의 LLM 기반 상품 속성 추출 여정

코오롱몰은 이미지에만 있던 상품 속성을 LLM으로 추출해 검색과 필터에 활용할 수 있게 했습니다. 그 결과 추출 시간과 비용을 크게 줄이고, 사이즈탭 노출과 구매 전환율도 높였습니다.

#LLM#Amazon Bedrock#OCR

6400

“보이는 데이터”를 “쓸 수 있는 데이터 “로: 코오롱몰의 LLM 기반 상품 속성 추출 여정

2025년 7월 8일

시각 언어 모델(Vision Language Model) 활용시 꼭 알아야 할 사실

VLM은 쉬운 공간 관계 문제도 자주 틀리는 한계가 있습니다. 현업 적용 전 정확성과 취약점을 충분히 검토해야 했습니다.

#LLM#ML#OCR

5800

시각 언어 모델(Vision Language Model) 활용시 꼭 알아야 할 사실

2025년 6월 19일

멀티모달 VLM 기술 동향

VLM의 개념과 최신 기술 동향, 주요 기업의 개발 흐름을 종합적으로 정리했습니다. 문서 AI 도입 시 특화 모델과 데이터 전략, 인프라 비용을 함께 고려할 필요가 있습니다.

#LLM#VLM#OCR

7000

2025년 2월 11일

손글씨에 강한 Google Cloud Vision AI 사용법 총정리

Google Cloud Vision API로 OCR을 수행하는 방법을 정리했습니다. API Key 방식과 서비스 계정 인증 방식을 비교하며 Colab에서의 사용법을 소개했습니다.

#Google Cloud Vision API#OCR#Colab

11200

2025년 2월 10일

데브옵스

Selenium과 OCR의 혁신적 결합: Docker와 클라우드로 확장한 대규모 디지털 사이니지 마이그레이션 자동화 솔루션

Selenium과 OCR을 결합해 스마트 디스플레이 제어를 자동화한 사례를 소개했습니다. Docker와 클라우드로 대규모 디지털 사이니지 마이그레이션 확장성을 높였습니다.

#Selenium#OCR#Docker

000

Selenium과 OCR의 혁신적 결합: Docker와 클라우드로 확장한 대규모 디지털 사이니지 마이그레이션 자동화 솔루션

2024년 12월 11일

VLM, LLM을 사용하여 멀티모달 학습 데이터 제작하기

VLM과 LLM을 활용해 멀티모달 학습 데이터를 만드는 방법을 소개했습니다. OCR, 프롬프트 엔지니어링, 후처리로 수작업 라벨링의 비용과 시간을 줄였습니다.

#LLM#VLM#멀티모달

7000

2024년 12월 2일

휴리봇 이야기 #2: AI가 사람처럼 말하게 만드는 5가지 프롬프트

휴리봇을 만들며 얻은 프롬프팅 팁을 소개했습니다. 역할 부여, 자연스러운 말투, OCR 활용, 반복 테스트가 핵심이었습니다.

#LLM#prompt#OCR

6800

2024년 9월 19일

사실 GPT는 글을 잘 읽지 못합니다.

GPT는 이미지를 보고 글자를 정확히 읽는 데 한계가 있다는 점을 사례로 설명했습니다. OCR 같은 보완 방법을 시도했지만 완전한 해결책은 찾지 못했다고 정리했습니다.

#LLM#OCR#UI/UX

3100

2024년 3월 29일

미래 교실을 만드는 콴다의 AI 기술

콴다는 AI 디지털 교과서를 위해 OCR, 문제 분류, 해설 생성, 성취도 분석 기술을 결합했습니다. 이를 통해 학생별 맞춤형 학습과 교육 격차 해소를 목표로 했습니다.

#OCR#LLM#RAG

4300

2023년 12월 27일

2023년 콴다의 발자취 | QANDA Year in Review

콴다의 2023년 이용 데이터와 콴다과외 성과를 연말결산 형태로 정리했습니다. LLM 기반 AI 튜터를 통해 맞춤형 교육을 더 넓히겠다는 계획도 함께 소개했습니다.

#검색#OCR#LLM

1600

2023년 9월 8일

Introduction to NAVER Place AI Development Team

NAVER GLACE AI 개발팀의 서비스 적용 사례와 운영 체계를 소개했습니다. 또한 PlaceLM을 중심으로 태그 추출과 서빙 효율 개선 방향을 설명했습니다.

#LLM#NLP#Computer Vision

3200

관련 태그

최신 게시글

Amazon Bedrock Vision LLM과 Amazon OpenSearch Service를 활용한 농약 제품 이미지 인식 시스템 구축기

부트텐트의 생성형 AI 기반 교육과정 등록 자동화 시스템 구성하기

매월 반복되던 무이자 할부 정보 업로드 자동화: PM의 개발 도전기

LLM이지만 PDF는 읽고 싶어: 복잡한 PDF를 LLM이 이해하는 방법

두려움 너머에서 만난 성장: 숙박 상품 등록 자동화 이야기

한 달짜리 과제, 바이브 코딩으로 5일 만에!(ChatGPT·Cursor)

GS리테일의 Amazon Bedrock을 활용한 AI 와인 라벨 이미지 검색 서비스 구축

“보이는 데이터”를 “쓸 수 있는 데이터 “로: 코오롱몰의 LLM 기반 상품 속성 추출 여정

시각 언어 모델(Vision Language Model) 활용시 꼭 알아야 할 사실

멀티모달 VLM 기술 동향

손글씨에 강한 Google Cloud Vision AI 사용법 총정리

Selenium과 OCR의 혁신적 결합: Docker와 클라우드로 확장한 대규모 디지털 사이니지 마이그레이션 자동화 솔루션

VLM, LLM을 사용하여 멀티모달 학습 데이터 제작하기

휴리봇 이야기 #2: AI가 사람처럼 말하게 만드는 5가지 프롬프트

사실 GPT는 글을 잘 읽지 못합니다.

미래 교실을 만드는 콴다의 AI 기술

2023년 콴다의 발자취 | QANDA Year in Review

Introduction to NAVER Place AI Development Team