모든 태그
태그

OCR 기술 블로그 글

OCR 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.

전체 18최신 18개 표시
홈에서 필터

최신 게시글

18개 표시

AI

Amazon Bedrock Vision LLM과 Amazon OpenSearch Service를 활용한 농약 제품 이미지 인식 시스템 구축기

농약 제품 사진을 인식해 정보를 찾는 3단계 AI 검색 시스템을 구축했습니다. Vision LLM 오인식을 오타 보정, OpenSearch Fallback, LLM Reranker로 보완했습니다.

#Amazon Bedrock#OpenSearch Service#LLM
3200

AI

부트텐트의 생성형 AI 기반 교육과정 등록 자동화 시스템 구성하기

부트텐트는 모집 페이지를 분석해 교육과정 등록 초안을 자동 생성하는 파이프라인을 구축했습니다. 하이브리드 OCR과 검증 에이전트를 적용해 정확도와 비용, 처리 시간을 함께 개선했습니다.

#Amazon Bedrock#AWS Step Functions#Amazon EC2
2800

AI

매월 반복되던 무이자 할부 정보 업로드 자동화: PM의 개발 도전기

매월 반복되던 무이자 할부 업로드를 AI OCR과 자동 파이프라인으로 전환한 사례입니다. 사람의 최종 승인과 재시도, 슬랙 알림을 더해 운영 리스크를 줄였습니다.

#자동화#OCR#파이프라인
7800

AI

LLM이지만 PDF는 읽고 싶어: 복잡한 PDF를 LLM이 이해하는 방법

복잡한 PDF를 LLM이 이해하도록 돕는 PaLADIN을 소개했습니다. 표·차트·숫자 처리 아키텍처와 성능 평가, 서비스 적용 사례를 함께 다뤘습니다.

#LLM#PDF#OCR
38000

AI

두려움 너머에서 만난 성장: 숙박 상품 등록 자동화 이야기

숙박 상품 등록 흐름을 Slack, Google Sheets, OCR, API, Playwright로 자동화했습니다. 온보딩 시간을 10분 내외로 줄이고 반복 오류도 줄였습니다.

#자동화#OCR#Google Sheets
4700

AI

한 달짜리 과제, 바이브 코딩으로 5일 만에!(ChatGPT·Cursor)

생성형 AI와 Flutter로 메뉴 등록 앱 데모를 5일 만에 만든 실험을 소개했습니다. 요구 분해와 반복 수정은 유효했지만, 프로덕션용 안전장치는 부족했습니다.

#ChatGPT#Cursor#Flutter
16200

AI

GS리테일의 Amazon Bedrock을 활용한 AI 와인 라벨 이미지 검색 서비스 구축

GS리테일은 Amazon Bedrock으로 와인 라벨 이미지 검색 서비스를 구축했습니다. Claude와 멀티모달 임베딩, Elasticsearch를 결합해 다국어 라벨 검색 품질을 높였습니다.

#Amazon Bedrock#LLM#멀티모달
5400

AI

“보이는 데이터”를 “쓸 수 있는 데이터 “로: 코오롱몰의 LLM 기반 상품 속성 추출 여정

코오롱몰은 이미지에만 있던 상품 속성을 LLM으로 추출해 검색과 필터에 활용할 수 있게 했습니다. 그 결과 추출 시간과 비용을 크게 줄이고, 사이즈탭 노출과 구매 전환율도 높였습니다.

#LLM#Amazon Bedrock#OCR
6400

AI

시각 언어 모델(Vision Language Model) 활용시 꼭 알아야 할 사실

VLM은 쉬운 공간 관계 문제도 자주 틀리는 한계가 있습니다. 현업 적용 전 정확성과 취약점을 충분히 검토해야 했습니다.

#LLM#ML#OCR
5800

AI

멀티모달 VLM 기술 동향

VLM의 개념과 최신 기술 동향, 주요 기업의 개발 흐름을 종합적으로 정리했습니다. 문서 AI 도입 시 특화 모델과 데이터 전략, 인프라 비용을 함께 고려할 필요가 있습니다.

#LLM#VLM#OCR
7000

AI

손글씨에 강한 Google Cloud Vision AI 사용법 총정리

Google Cloud Vision API로 OCR을 수행하는 방법을 정리했습니다. API Key 방식과 서비스 계정 인증 방식을 비교하며 Colab에서의 사용법을 소개했습니다.

#Google Cloud Vision API#OCR#Colab
11200

데브옵스

Selenium과 OCR의 혁신적 결합: Docker와 클라우드로 확장한 대규모 디지털 사이니지 마이그레이션 자동화 솔루션

Selenium과 OCR을 결합해 스마트 디스플레이 제어를 자동화한 사례를 소개했습니다. Docker와 클라우드로 대규모 디지털 사이니지 마이그레이션 확장성을 높였습니다.

#Selenium#OCR#Docker
000

AI

VLM, LLM을 사용하여 멀티모달 학습 데이터 제작하기

VLM과 LLM을 활용해 멀티모달 학습 데이터를 만드는 방법을 소개했습니다. OCR, 프롬프트 엔지니어링, 후처리로 수작업 라벨링의 비용과 시간을 줄였습니다.

#LLM#VLM#멀티모달
7000

AI

휴리봇 이야기 #2: AI가 사람처럼 말하게 만드는 5가지 프롬프트

휴리봇을 만들며 얻은 프롬프팅 팁을 소개했습니다. 역할 부여, 자연스러운 말투, OCR 활용, 반복 테스트가 핵심이었습니다.

#LLM#prompt#OCR
6800

AI

사실 GPT는 글을 잘 읽지 못합니다.

GPT는 이미지를 보고 글자를 정확히 읽는 데 한계가 있다는 점을 사례로 설명했습니다. OCR 같은 보완 방법을 시도했지만 완전한 해결책은 찾지 못했다고 정리했습니다.

#LLM#OCR#UI/UX
3100

AI

미래 교실을 만드는 콴다의 AI 기술

콴다는 AI 디지털 교과서를 위해 OCR, 문제 분류, 해설 생성, 성취도 분석 기술을 결합했습니다. 이를 통해 학생별 맞춤형 학습과 교육 격차 해소를 목표로 했습니다.

#OCR#LLM#RAG
4300

AI

2023년 콴다의 발자취 | QANDA Year in Review

콴다의 2023년 이용 데이터와 콴다과외 성과를 연말결산 형태로 정리했습니다. LLM 기반 AI 튜터를 통해 맞춤형 교육을 더 넓히겠다는 계획도 함께 소개했습니다.

#검색#OCR#LLM
1600

AI

Introduction to NAVER Place AI Development Team

NAVER GLACE AI 개발팀의 서비스 적용 사례와 운영 체계를 소개했습니다. 또한 PlaceLM을 중심으로 태그 추출과 서빙 효율 개선 방향을 설명했습니다.

#LLM#NLP#Computer Vision
3200