Velopers 홈

오늘 새 글

0개

오늘 조회수

220회

필터 1

· 2025년 6월 16일

Open Thoughts - 추론 모델을 위한 데이터 레시피

추론 모델 학습용 데이터 레시피를 실험 중심으로 정리한 글입니다. 어려운 질문 선별, 다중 답변 생성, 데이터 확장이 성능 향상에 중요하다고 설명했습니다.

#LLM#NLP

52005분

· 2025년 5월 12일

쉽게이해하는 GPT. 1편(다음단어 예측기. Base모델)

GPT를 다음 단어를 예측하는 모델로 쉽게 풀어 설명했습니다. Transformer 디코더만 사용하는 구조와 LLaMA 예시를 통해 Base Model 개념을 소개했습니다.

#LLM#Transformer

99005분

· 2025년 5월 9일

Qwen3 의 Hybrid thinking mode

Qwen3의 Hybrid Thinking mode를 소개하고, 추론 On/Off를 제어하는 두 가지 방식을 설명했습니다. `/think`·`/no_think`와 `enable_thinking`의 동작 차이도 정리했습니다.

#LLM#NLP

71005분

Nota AI가 제안하는 Transformer 모델을 AWS Inferentia/Trainium에 손쉽게 배포하는 방법

· 2025년 4월 9일

Nota AI가 제안하는 Transformer 모델을 AWS Inferentia/Trainium에 손쉽게 배포하는 방법

Hugging Face Transformer 모델을 AWS Inferentia/Trainium에 포팅하는 과정을 검증했습니다. return_dict=False 설정으로 tracing 오류를 줄여 12개 모델 모두 배포 가능함을 확인했습니다.

#AWS#Transformer

36005분

· 2025년 4월 2일

안드로이드에서 온디바이스 AI로 스팸 분류하기

안드로이드에서 DistilKoBERT 기반 스팸 분류 모델을 온디바이스 AI로 구현한 과정을 정리했습니다.\nTFLite 변환과 양자화로 모델 크기와 추론 속도를 개선하고 단말 벤치마크 결과도 확인했습니다.

#Android#NLP

84005분

딥시크(DeepSeek)에 이어 마누스(MANUS) 까지 – 다원화되는 중국 오픈소스 LLM 생태계

· 2025년 3월 31일

딥시크(DeepSeek)에 이어 마누스(MANUS) 까지 – 다원화되는 중국 오픈소스 LLM 생태계

딥시크와 마누스의 등장으로 중국 오픈소스 LLM 생태계가 빠르게 다원화되고 있음을 정리했습니다. 딥시크는 고성능 개방형 LLM, 마누스는 자율 에이전트라는 서로 다른 방향을 보여주었습니다.

#LLM#오픈소스

80005분

· 2025년 3월 21일

데이터가 세상을 지배하는 시대 : 두 번의 대전환

데이터와 AI의 발전을 두 번의 대전환으로 정리하며, 빅데이터의 양적 성장과 AI 결합의 흐름을 설명했습니다. 데이터 품질, 실시간 처리, 거버넌스의 중요성도 함께 짚었습니다.

#빅데이터#Kafka

91005분

· 2025년 2월 3일

실험으로 알아보는 LLM 파인튜닝 최적화 가이드 Part 1.

LLM 파인튜닝에서 배치 크기, 시퀀스 길이, 메모리 최적화 기법의 영향을 실험 기반으로 정리했습니다.\nGPU 제약과 데이터 특성에 맞춰 직접 실험하며 최적값을 찾는 접근을 강조했습니다.

#LLM#파인튜닝

32005분

· 2024년 11월 15일

AI, 채팅창을 벗어나 로봇의 두뇌가 되다

AI가 채팅창을 넘어 로봇의 인지, 판단, 행동을 담당하는 흐름을 정리했습니다. 휴머노이드와 로봇 파운데이션 모델의 최신 사례도 함께 소개했습니다.

#LLM#로봇

24005분

고등학생도 이해하는 Transformer (Deep Learning) #5

· 2024년 11월 13일

고등학생도 이해하는 Transformer (Deep Learning) #5

벡터 내적과 Linear Layer를 MNIST 분류 예제로 풀어 설명했습니다. 학습이 진행되며 가중치가 숫자 이미지와 닮아가는 과정을 통해 원리를 이해하도록 돕습니다.

#Transformer#ML

16005분

고등학생도 이해하는 Transformer (Deep Learning) #4

· 2024년 11월 7일

고등학생도 이해하는 Transformer (Deep Learning) #4

4차원 이상 벡터의 내적을 유사도 관점에서 쉽게 설명했습니다. DCT Basis Vector와 Softmax를 통해 분류와 주파수 변환의 연결도 소개했습니다.

#Transformer#ML

23005분

고등학생도 이해하는 Transformer (Deep Learning) #3

· 2024년 11월 6일

고등학생도 이해하는 Transformer (Deep Learning) #3

그래픽스의 Affine 변환을 내적과 매트릭스 연산으로 설명했습니다. 내적의 의미를 이해하면 Transformer와 다차원 공간을 더 쉽게 볼 수 있다고 강조했습니다.

#Transformer#ML

21005분