모든 태그
태그

Transformer 기술 블로그 글

Transformer 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.

전체 33최신 20개 표시
홈에서 필터

최신 게시글

20개 표시

AI

AI, 고객 행동의 순서를 읽다: 카카오뱅크 시퀀스 기반 FDS 모델 개발기

카카오뱅크가 보이스피싱 대응을 위해 거래 단위가 아닌 고객 행동 시퀀스를 분석하는 FDS 모델을 개발했습니다. ViT 변형, XAI, 실시간 서빙으로 대규모 탐지를 빠르게 처리했습니다.

#FDS#시계열 분류#Transformer
6100

AI

‘로컬’ 슈퍼 앱에서 장기 유저 모델링은 어떻게 달라질까?

당근의 지역 기반 추천 시스템에서 장기 유저 로그를 Transformer로 학습해 공통 임베딩을 만들었습니다. 이를 홈피드, 후보, 광고에 적용해 학습 신호와 온라인 지표를 함께 개선했습니다.

#ML#Transformer#추천 시스템
6300

AI

테이블 데이터를 위한 트랜스포머? — 변신 로봇 아닙니다

테이블 데이터를 위한 파운데이션 모델과 TabPFN의 개념을 설명하고, 실무에서의 활용 가능성을 정리했습니다. 빠른 베이스라인과 비교 모델로서의 장점과 기존 모델과의 병행 필요성도 함께 다뤘습니다.

#Transformer#파운데이션 모델#TabPFN
6300

AI

“함께 구매하면 좋은 상품” 추천 모델 고도화

장바구니 맥락을 반영한 추천 모델로 Item2Vec의 한계를 개선했습니다. 오프라인 평가와 A/B 테스트에서 담기율, 다양성, 주문율이 함께 향상되었습니다.

#ML#추천 시스템#Transformer
6200

AI

개인화 추천 시스템 1편 - 유저의 행동은 “언어”일까? : Collaborative Embedding 구축기 (feat. Knowledge Distillation)

상품 텍스트를 Semantic ID로 압축하고 유저 행동을 Transformer로 해석해 개인화 추천 모델을 구축했습니다. 지식 증류와 데이터 엔지니어링으로 정확도와 속도를 함께 개선하고 A/B 테스트 성과를 확인했습니다.

#추천 시스템#Transformer#Knowledge Distillation
9600

AI

AI Agent 속도 최적화를 위한 Speculative Decoding

Speculative Decoding으로 AI Agent의 응답 지연을 줄이는 원리를 설명했습니다. Small Model 예측과 Large Model 검증을 결합해 속도 개선 가능성을 제시했습니다.

#LLM#Speculative Decoding#Huggingface
3900

AI

AI와 디지털 광고의 새로운 협력 모델 - Part 2. 효율적인 광고 제작을 위한 레이아웃 생성 기술

효율적인 광고 제작을 위한 레이아웃 생성 기술을 주요 방식별로 정리했습니다. 각 모델의 장점과 한계를 비교하며 실전 선택 기준도 함께 제시했습니다.

#LLM#Transformer#ML
4100

AI

Attention 메커니즘: 개념과 활용

Attention 메커니즘의 개념과 필요성을 설명하고, Q/K/V 기반 작동 흐름을 정리했습니다. 또한 PyTorch와 TensorFlow 예제로 실제 구현 방법을 보여주었습니다.

#Attention#Transformer#ML
8800

AI

백엔드 개발자의 시선으로 풀어본 LLM 내부 동작 원리: 6단계로 쉽게 이해하기

LLM이 입력을 받아 답변을 생성하기까지의 내부 동작을 6단계로 나눠 쉽게 설명했습니다. 백엔드 개발자가 프롬프트와 활용 방식을 이해하는 데 필요한 핵심 흐름을 정리했습니다.

#LLM#자연어처리#Transformer
33200

AI

수식없이 GPT(트랜스포머) 이해하기. 2편

GPT 기반 LLM의 추론 최적화와 양자화 개념을 설명했습니다. DeepSeek의 Latent Vector 기반 방식으로 KV Cache 메모리를 줄이는 사례도 다뤘습니다.

#LLM#KV Cache#quantization
6900

AI

고등학생도 이해하는 Transformer (Deep Learning) #6 - Deep Learning이란

딥러닝은 선형층과 비선형층을 여러 겹 쌓아 깊은 구조를 만드는 개념을 설명했습니다. 선형층만으로는 한계가 있어 활성화 함수를 넣는 이유를 쉽게 풀어주었습니다.

#ML#Transformer#Machine Learning
8800

AI

수식없이 GPT(트랜스포머) 이해하기. 1편

GPT의 핵심 구조인 트랜스포머 디코더와 Self Attention 흐름을 수식 없이 설명했습니다. 입력 벡터화부터 다음 단어 예측까지의 과정을 단계별로 정리했습니다.

#LLM#Transformer#Self Attention
11300

AI

Open Thoughts - 추론 모델을 위한 데이터 레시피

추론 모델 학습용 데이터 레시피를 실험 중심으로 정리한 글입니다. 어려운 질문 선별, 다중 답변 생성, 데이터 확장이 성능 향상에 중요하다고 설명했습니다.

#LLM#NLP#Transformer
5200

AI

쉽게이해하는 GPT. 1편(다음단어 예측기. Base모델)

GPT를 다음 단어를 예측하는 모델로 쉽게 풀어 설명했습니다. Transformer 디코더만 사용하는 구조와 LLaMA 예시를 통해 Base Model 개념을 소개했습니다.

#LLM#Transformer#Huggingface
10000

AI

Qwen3 의 Hybrid thinking mode

Qwen3의 Hybrid Thinking mode를 소개하고, 추론 On/Off를 제어하는 두 가지 방식을 설명했습니다. `/think`·`/no_think`와 `enable_thinking`의 동작 차이도 정리했습니다.

#LLM#NLP#Huggingface
7100

AI

Nota AI가 제안하는 Transformer 모델을 AWS Inferentia/Trainium에 손쉽게 배포하는 방법

Hugging Face Transformer 모델을 AWS Inferentia/Trainium에 포팅하는 과정을 검증했습니다. return_dict=False 설정으로 tracing 오류를 줄여 12개 모델 모두 배포 가능함을 확인했습니다.

#AWS#Transformer#LLM
3600

AI

안드로이드에서 온디바이스 AI로 스팸 분류하기

안드로이드에서 DistilKoBERT 기반 스팸 분류 모델을 온디바이스 AI로 구현한 과정을 정리했습니다.\nTFLite 변환과 양자화로 모델 크기와 추론 속도를 개선하고 단말 벤치마크 결과도 확인했습니다.

#Android#NLP#PyTorch
8400

AI

딥시크(DeepSeek)에 이어 마누스(MANUS) 까지 – 다원화되는 중국 오픈소스 LLM 생태계

딥시크와 마누스의 등장으로 중국 오픈소스 LLM 생태계가 빠르게 다원화되고 있음을 정리했습니다. 딥시크는 고성능 개방형 LLM, 마누스는 자율 에이전트라는 서로 다른 방향을 보여주었습니다.

#LLM#오픈소스#Transformer
8000

AI

데이터가 세상을 지배하는 시대 : 두 번의 대전환

데이터와 AI의 발전을 두 번의 대전환으로 정리하며, 빅데이터의 양적 성장과 AI 결합의 흐름을 설명했습니다. 데이터 품질, 실시간 처리, 거버넌스의 중요성도 함께 짚었습니다.

#빅데이터#Kafka#ML
9100

AI

실험으로 알아보는 LLM 파인튜닝 최적화 가이드 Part 1.

LLM 파인튜닝에서 배치 크기, 시퀀스 길이, 메모리 최적화 기법의 영향을 실험 기반으로 정리했습니다.\nGPU 제약과 데이터 특성에 맞춰 직접 실험하며 최적값을 찾는 접근을 강조했습니다.

#LLM#파인튜닝#LoRA
3200