AI, 고객 행동의 순서를 읽다: 카카오뱅크 시퀀스 기반 FDS 모델 개발기
카카오뱅크가 보이스피싱 대응을 위해 거래 단위가 아닌 고객 행동 시퀀스를 분석하는 FDS 모델을 개발했습니다. ViT 변형, XAI, 실시간 서빙으로 대규모 탐지를 빠르게 처리했습니다.
Transformer 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.
20개 표시
카카오뱅크가 보이스피싱 대응을 위해 거래 단위가 아닌 고객 행동 시퀀스를 분석하는 FDS 모델을 개발했습니다. ViT 변형, XAI, 실시간 서빙으로 대규모 탐지를 빠르게 처리했습니다.
당근의 지역 기반 추천 시스템에서 장기 유저 로그를 Transformer로 학습해 공통 임베딩을 만들었습니다. 이를 홈피드, 후보, 광고에 적용해 학습 신호와 온라인 지표를 함께 개선했습니다.
테이블 데이터를 위한 파운데이션 모델과 TabPFN의 개념을 설명하고, 실무에서의 활용 가능성을 정리했습니다. 빠른 베이스라인과 비교 모델로서의 장점과 기존 모델과의 병행 필요성도 함께 다뤘습니다.
장바구니 맥락을 반영한 추천 모델로 Item2Vec의 한계를 개선했습니다. 오프라인 평가와 A/B 테스트에서 담기율, 다양성, 주문율이 함께 향상되었습니다.
상품 텍스트를 Semantic ID로 압축하고 유저 행동을 Transformer로 해석해 개인화 추천 모델을 구축했습니다. 지식 증류와 데이터 엔지니어링으로 정확도와 속도를 함께 개선하고 A/B 테스트 성과를 확인했습니다.

Speculative Decoding으로 AI Agent의 응답 지연을 줄이는 원리를 설명했습니다. Small Model 예측과 Large Model 검증을 결합해 속도 개선 가능성을 제시했습니다.

효율적인 광고 제작을 위한 레이아웃 생성 기술을 주요 방식별로 정리했습니다. 각 모델의 장점과 한계를 비교하며 실전 선택 기준도 함께 제시했습니다.

Attention 메커니즘의 개념과 필요성을 설명하고, Q/K/V 기반 작동 흐름을 정리했습니다. 또한 PyTorch와 TensorFlow 예제로 실제 구현 방법을 보여주었습니다.

LLM이 입력을 받아 답변을 생성하기까지의 내부 동작을 6단계로 나눠 쉽게 설명했습니다. 백엔드 개발자가 프롬프트와 활용 방식을 이해하는 데 필요한 핵심 흐름을 정리했습니다.
GPT 기반 LLM의 추론 최적화와 양자화 개념을 설명했습니다. DeepSeek의 Latent Vector 기반 방식으로 KV Cache 메모리를 줄이는 사례도 다뤘습니다.

딥러닝은 선형층과 비선형층을 여러 겹 쌓아 깊은 구조를 만드는 개념을 설명했습니다. 선형층만으로는 한계가 있어 활성화 함수를 넣는 이유를 쉽게 풀어주었습니다.

GPT의 핵심 구조인 트랜스포머 디코더와 Self Attention 흐름을 수식 없이 설명했습니다. 입력 벡터화부터 다음 단어 예측까지의 과정을 단계별로 정리했습니다.

추론 모델 학습용 데이터 레시피를 실험 중심으로 정리한 글입니다. 어려운 질문 선별, 다중 답변 생성, 데이터 확장이 성능 향상에 중요하다고 설명했습니다.

GPT를 다음 단어를 예측하는 모델로 쉽게 풀어 설명했습니다. Transformer 디코더만 사용하는 구조와 LLaMA 예시를 통해 Base Model 개념을 소개했습니다.

Qwen3의 Hybrid Thinking mode를 소개하고, 추론 On/Off를 제어하는 두 가지 방식을 설명했습니다. `/think`·`/no_think`와 `enable_thinking`의 동작 차이도 정리했습니다.

Hugging Face Transformer 모델을 AWS Inferentia/Trainium에 포팅하는 과정을 검증했습니다. return_dict=False 설정으로 tracing 오류를 줄여 12개 모델 모두 배포 가능함을 확인했습니다.

안드로이드에서 DistilKoBERT 기반 스팸 분류 모델을 온디바이스 AI로 구현한 과정을 정리했습니다.\nTFLite 변환과 양자화로 모델 크기와 추론 속도를 개선하고 단말 벤치마크 결과도 확인했습니다.

딥시크와 마누스의 등장으로 중국 오픈소스 LLM 생태계가 빠르게 다원화되고 있음을 정리했습니다. 딥시크는 고성능 개방형 LLM, 마누스는 자율 에이전트라는 서로 다른 방향을 보여주었습니다.
데이터와 AI의 발전을 두 번의 대전환으로 정리하며, 빅데이터의 양적 성장과 AI 결합의 흐름을 설명했습니다. 데이터 품질, 실시간 처리, 거버넌스의 중요성도 함께 짚었습니다.

LLM 파인튜닝에서 배치 크기, 시퀀스 길이, 메모리 최적화 기법의 영향을 실험 기반으로 정리했습니다.\nGPU 제약과 데이터 특성에 맞춰 직접 실험하며 최적값을 찾는 접근을 강조했습니다.
