태그

Transformer 기술 블로그 글

Transformer 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.

전체 33개최신 20개 표시

#LLM995 #ML283 #NLP67 #Huggingface11 #추천 시스템24 #PyTorch19 #Attention2 #AWS635 #Kafka228 #prompt217 #Android198 #Python193

AI, 고객 행동의 순서를 읽다: 카카오뱅크 시퀀스 기반 FDS 모델 개발기

카카오뱅크가 보이스피싱 대응을 위해 거래 단위가 아닌 고객 행동 시퀀스를 분석하는 FDS 모델을 개발했습니다. ViT 변형, XAI, 실시간 서빙으로 대규모 탐지를 빠르게 처리했습니다.

#FDS#시계열 분류#Transformer

6100

AI, 고객 행동의 순서를 읽다: 카카오뱅크 시퀀스 기반 FDS 모델 개발기

2026년 2월 27일

‘로컬’ 슈퍼 앱에서 장기 유저 모델링은 어떻게 달라질까?

당근의 지역 기반 추천 시스템에서 장기 유저 로그를 Transformer로 학습해 공통 임베딩을 만들었습니다. 이를 홈피드, 후보, 광고에 적용해 학습 신호와 온라인 지표를 함께 개선했습니다.

#ML#Transformer#추천 시스템

6300

‘로컬’ 슈퍼 앱에서 장기 유저 모델링은 어떻게 달라질까?

2026년 2월 12일

테이블 데이터를 위한 트랜스포머? — 변신 로봇 아닙니다

테이블 데이터를 위한 파운데이션 모델과 TabPFN의 개념을 설명하고, 실무에서의 활용 가능성을 정리했습니다. 빠른 베이스라인과 비교 모델로서의 장점과 기존 모델과의 병행 필요성도 함께 다뤘습니다.

#Transformer#파운데이션 모델#TabPFN

6300

테이블 데이터를 위한 트랜스포머? — 변신 로봇 아닙니다

2025년 12월 11일

“함께 구매하면 좋은 상품” 추천 모델 고도화

장바구니 맥락을 반영한 추천 모델로 Item2Vec의 한계를 개선했습니다. 오프라인 평가와 A/B 테스트에서 담기율, 다양성, 주문율이 함께 향상되었습니다.

#ML#추천 시스템#Transformer

6200

“함께 구매하면 좋은 상품” 추천 모델 고도화

2025년 11월 26일

개인화 추천 시스템 1편 - 유저의 행동은 “언어”일까? : Collaborative Embedding 구축기 (feat. Knowledge Distillation)

상품 텍스트를 Semantic ID로 압축하고 유저 행동을 Transformer로 해석해 개인화 추천 모델을 구축했습니다. 지식 증류와 데이터 엔지니어링으로 정확도와 속도를 함께 개선하고 A/B 테스트 성과를 확인했습니다.

9600

2025년 10월 29일

AI Agent 속도 최적화를 위한 Speculative Decoding

Speculative Decoding으로 AI Agent의 응답 지연을 줄이는 원리를 설명했습니다. Small Model 예측과 Large Model 검증을 결합해 속도 개선 가능성을 제시했습니다.

#LLM#Speculative Decoding#Huggingface

3900

AI Agent 속도 최적화를 위한 Speculative Decoding

2025년 9월 23일

AI와 디지털 광고의 새로운 협력 모델 - Part 2. 효율적인 광고 제작을 위한 레이아웃 생성 기술

효율적인 광고 제작을 위한 레이아웃 생성 기술을 주요 방식별로 정리했습니다. 각 모델의 장점과 한계를 비교하며 실전 선택 기준도 함께 제시했습니다.

#LLM#Transformer#ML

4100

AI와 디지털 광고의 새로운 협력 모델 - Part 2. 효율적인 광고 제작을 위한 레이아웃 생성 기술

2025년 9월 12일

Attention 메커니즘: 개념과 활용

Attention 메커니즘의 개념과 필요성을 설명하고, Q/K/V 기반 작동 흐름을 정리했습니다. 또한 PyTorch와 TensorFlow 예제로 실제 구현 방법을 보여주었습니다.

#Attention#Transformer#ML

8800

2025년 9월 11일

백엔드 개발자의 시선으로 풀어본 LLM 내부 동작 원리: 6단계로 쉽게 이해하기

LLM이 입력을 받아 답변을 생성하기까지의 내부 동작을 6단계로 나눠 쉽게 설명했습니다. 백엔드 개발자가 프롬프트와 활용 방식을 이해하는 데 필요한 핵심 흐름을 정리했습니다.

#LLM#자연어처리#Transformer

33200

2025년 9월 8일

수식없이 GPT(트랜스포머) 이해하기. 2편

GPT 기반 LLM의 추론 최적화와 양자화 개념을 설명했습니다. DeepSeek의 Latent Vector 기반 방식으로 KV Cache 메모리를 줄이는 사례도 다뤘습니다.

#LLM#KV Cache#quantization

6900

2025년 9월 5일

고등학생도 이해하는 Transformer (Deep Learning) #6 - Deep Learning이란

딥러닝은 선형층과 비선형층을 여러 겹 쌓아 깊은 구조를 만드는 개념을 설명했습니다. 선형층만으로는 한계가 있어 활성화 함수를 넣는 이유를 쉽게 풀어주었습니다.

#ML#Transformer#Machine Learning

8800

고등학생도 이해하는 Transformer (Deep Learning) #6 - Deep Learning이란

2025년 8월 7일

수식없이 GPT(트랜스포머) 이해하기. 1편

GPT의 핵심 구조인 트랜스포머 디코더와 Self Attention 흐름을 수식 없이 설명했습니다. 입력 벡터화부터 다음 단어 예측까지의 과정을 단계별로 정리했습니다.

#LLM#Transformer#Self Attention

11300

2025년 6월 16일

Open Thoughts - 추론 모델을 위한 데이터 레시피

추론 모델 학습용 데이터 레시피를 실험 중심으로 정리한 글입니다. 어려운 질문 선별, 다중 답변 생성, 데이터 확장이 성능 향상에 중요하다고 설명했습니다.

#LLM#NLP#Transformer

5200

2025년 5월 12일

쉽게이해하는 GPT. 1편(다음단어 예측기. Base모델)

GPT를 다음 단어를 예측하는 모델로 쉽게 풀어 설명했습니다. Transformer 디코더만 사용하는 구조와 LLaMA 예시를 통해 Base Model 개념을 소개했습니다.

#LLM#Transformer#Huggingface

10000

2025년 5월 9일

Qwen3 의 Hybrid thinking mode

Qwen3의 Hybrid Thinking mode를 소개하고, 추론 On/Off를 제어하는 두 가지 방식을 설명했습니다. `/think`·`/no_think`와 `enable_thinking`의 동작 차이도 정리했습니다.

#LLM#NLP#Huggingface

7100

2025년 4월 9일

Nota AI가 제안하는 Transformer 모델을 AWS Inferentia/Trainium에 손쉽게 배포하는 방법

Hugging Face Transformer 모델을 AWS Inferentia/Trainium에 포팅하는 과정을 검증했습니다. return_dict=False 설정으로 tracing 오류를 줄여 12개 모델 모두 배포 가능함을 확인했습니다.

#AWS#Transformer#LLM

3600

Nota AI가 제안하는 Transformer 모델을 AWS Inferentia/Trainium에 손쉽게 배포하는 방법

2025년 4월 2일

안드로이드에서 온디바이스 AI로 스팸 분류하기

안드로이드에서 DistilKoBERT 기반 스팸 분류 모델을 온디바이스 AI로 구현한 과정을 정리했습니다.\nTFLite 변환과 양자화로 모델 크기와 추론 속도를 개선하고 단말 벤치마크 결과도 확인했습니다.

#Android#NLP#PyTorch

8400

2025년 3월 31일

딥시크(DeepSeek)에 이어 마누스(MANUS) 까지 – 다원화되는 중국 오픈소스 LLM 생태계

딥시크와 마누스의 등장으로 중국 오픈소스 LLM 생태계가 빠르게 다원화되고 있음을 정리했습니다. 딥시크는 고성능 개방형 LLM, 마누스는 자율 에이전트라는 서로 다른 방향을 보여주었습니다.

#LLM#오픈소스#Transformer

8000

딥시크(DeepSeek)에 이어 마누스(MANUS) 까지 – 다원화되는 중국 오픈소스 LLM 생태계

2025년 3월 21일

데이터가 세상을 지배하는 시대 : 두 번의 대전환

데이터와 AI의 발전을 두 번의 대전환으로 정리하며, 빅데이터의 양적 성장과 AI 결합의 흐름을 설명했습니다. 데이터 품질, 실시간 처리, 거버넌스의 중요성도 함께 짚었습니다.

#빅데이터#Kafka#ML

9100

2025년 2월 3일

실험으로 알아보는 LLM 파인튜닝 최적화 가이드 Part 1.

LLM 파인튜닝에서 배치 크기, 시퀀스 길이, 메모리 최적화 기법의 영향을 실험 기반으로 정리했습니다.\nGPU 제약과 데이터 특성에 맞춰 직접 실험하며 최적값을 찾는 접근을 강조했습니다.

#LLM#파인튜닝#LoRA

3200

관련 태그

최신 게시글

AI, 고객 행동의 순서를 읽다: 카카오뱅크 시퀀스 기반 FDS 모델 개발기

‘로컬’ 슈퍼 앱에서 장기 유저 모델링은 어떻게 달라질까?

테이블 데이터를 위한 트랜스포머? — 변신 로봇 아닙니다

“함께 구매하면 좋은 상품” 추천 모델 고도화

개인화 추천 시스템 1편 - 유저의 행동은 “언어”일까? : Collaborative Embedding 구축기 (feat. Knowledge Distillation)

AI Agent 속도 최적화를 위한 Speculative Decoding

AI와 디지털 광고의 새로운 협력 모델 - Part 2. 효율적인 광고 제작을 위한 레이아웃 생성 기술

Attention 메커니즘: 개념과 활용

백엔드 개발자의 시선으로 풀어본 LLM 내부 동작 원리: 6단계로 쉽게 이해하기

수식없이 GPT(트랜스포머) 이해하기. 2편

고등학생도 이해하는 Transformer (Deep Learning) #6 - Deep Learning이란

수식없이 GPT(트랜스포머) 이해하기. 1편

Open Thoughts - 추론 모델을 위한 데이터 레시피

쉽게이해하는 GPT. 1편(다음단어 예측기. Base모델)

Qwen3 의 Hybrid thinking mode

Nota AI가 제안하는 Transformer 모델을 AWS Inferentia/Trainium에 손쉽게 배포하는 방법

안드로이드에서 온디바이스 AI로 스팸 분류하기

딥시크(DeepSeek)에 이어 마누스(MANUS) 까지 – 다원화되는 중국 오픈소스 LLM 생태계

데이터가 세상을 지배하는 시대 : 두 번의 대전환

실험으로 알아보는 LLM 파인튜닝 최적화 가이드 Part 1.