필터 1
DeepSeek-R1 기술 분석
한글과컴퓨터
· 2025년 3월 10일
AI

DeepSeek-R1 기술 분석

DeepSeek-R1의 구조와 학습 방식, GRPO와 지식 증류의 특징을 OpenAI o1과 비교해 정리했습니다. 비용 절감과 추론 성능 강점, 한국어 적용 시 주의점도 함께 살펴봤습니다.

#LLM#ML
57005분
LLM as a Judge를 활용한 CodeBuddy 성능 평가
카카오
· 2025년 3월 7일
AI

LLM as a Judge를 활용한 CodeBuddy 성능 평가

LLM as a Judge를 활용해 CodeBuddy의 성능 평가를 다룬 글입니다. AI 모델과 응답 품질을 평가하는 방법론을 소개했습니다.

#LLM
32005분
Amazon Bedrock에서 DeepSeek-R1 Distilled Llama 모델 배포하기
AWS
· 2025년 3월 5일
AI

Amazon Bedrock에서 DeepSeek-R1 Distilled Llama 모델 배포하기

Amazon Bedrock 사용자 지정 모델로 DeepSeek-R1 Distill Llama를 배포하는 방법을 안내했습니다.\n서버리스 호스팅, 비용 구조, 버전 관리와 모니터링 포인트도 함께 정리했습니다.

#Amazon Bedrock#LLM
29005분
에이닷의 AI 에이전트는 어디까지 발전할 수 있을까? Code Interpreter 가 가져올 AI 에이전트 패러다임의 혁신
데보션
· 2025년 3월 5일
AI

에이닷의 AI 에이전트는 어디까지 발전할 수 있을까? Code Interpreter 가 가져올 AI 에이전트 패러다임의 혁신

LLM 기반 AI 에이전트의 Tool Calling 한계를 Code Interpreter로 확장하는 흐름을 설명했습니다. Docker 샌드박스와 LangGraph로 안전하게 적용하는 예시도 함께 다뤘습니다.

#LLM#Python
31005분
에이전트 내 자연어 검색 품질 향상 기법 : Entity RAG, Knowledge-aware retrieval
데보션
· 2025년 3월 5일
AI

에이전트 내 자연어 검색 품질 향상 기법 : Entity RAG, Knowledge-aware retrieval

자연어 검색 에이전트의 품질을 높이기 위해 Entity RAG와 Knowledge-aware retrieval을 적용한 사례를 소개했습니다. 신규 개체 인식과 테마 질의 대응 성능이 개선되었고, 향후 적용 범위 확대도 제시했습니다.

#LLM#RAG
31005분
AI 응답성 최적화하기: Amazon Bedrock 지연 시간 최적화 추론에 대한 실용적인 가이드
AWS
· 2025년 3월 4일
AI

AI 응답성 최적화하기: Amazon Bedrock 지연 시간 최적화 추론에 대한 실용적인 가이드

Amazon Bedrock의 지연 시간 최적화 추론이 LLM 응답성 개선에 어떻게 기여하는지 정리했습니다. TTFT, OTPS, E2E 지표와 함께 프롬프트·아키텍처 최적화 방법도 살펴보았습니다.

#AWS#LLM
45005분
AI Agent 개발의 핵심: RAG와 LangChain, LangGraph 비교 분석
교보DTS
· 2025년 2월 28일
AI

AI Agent 개발의 핵심: RAG와 LangChain, LangGraph 비교 분석

RAG와 LangChain, LangGraph의 역할과 구조를 비교해 AI Agent 개발 관점을 정리했습니다. 빠른 개발에는 LangChain, 복잡한 워크플로우에는 LangGraph가 적합하다고 설명했습니다.

#LLM#RAG
62005분
HTML 문서의 실시간 본문 추출기: 노이즈 적은 콘텐츠 수집의 비밀
데보션
· 2025년 2월 27일
백엔드

HTML 문서의 실시간 본문 추출기: 노이즈 적은 콘텐츠 수집의 비밀

HTML 문서에서 실시간으로 본문만 빠르게 추출하기 위한 PAAS의 로직을 소개했습니다. 트리 구조 feature와 entropy를 활용해 노이즈를 줄이면서 핵심 정보 유실을 막았습니다.

#HTML#LLM
29005분
카카오의 언어모델, Kanana 테크니컬 리포트 공개
카카오
· 2025년 2월 27일
AI

카카오의 언어모델, Kanana 테크니컬 리포트 공개

카카오가 서비스 적용에 최적화한 언어모델 Kanana의 테크니컬 리포트를 공개했습니다. 높은 성능, 비용 효율성, 안전성을 함께 고려한 자체 AI 모델 방향을 소개했습니다.

#LLM
27005분
LLM을 활용한 스마트폰 시세조회 서비스 구축
당근마켓
· 2025년 2월 26일
AI

LLM을 활용한 스마트폰 시세조회 서비스 구축

LLM으로 중고 스마트폰 게시글에서 시세 산정용 정보를 추출하고 후처리하는 서비스를 구축했습니다. BigQuery, MySQL, 벡터 DB를 조합해 시세 조회와 유사 게시글 추천을 구현했습니다.

#LLM#BigQuery
53005분
iOS 개발을 위한 Cursor Rules
딜라이트룸
· 2025년 2월 24일
프론트엔드

iOS 개발을 위한 Cursor Rules

Cursor의 Rules 기능으로 iOS 개발용 AI 동작을 프로젝트 단위로 제어하는 방법을 소개했습니다. 규칙을 적용한 뒤 오류와 중복 작업이 줄어든 경험도 공유했습니다.

#iOS#Cursor
53005분
SK하이닉스의 RAG 플랫폼 구축 및 성능 평가/분석 연구 사례
AWS
· 2025년 2월 24일
AI

SK하이닉스의 RAG 플랫폼 구축 및 성능 평가/분석 연구 사례

SK하이닉스가 AWS 환경에서 RAG 플랫폼을 구축하고 성능을 평가한 사례를 소개했습니다. 데이터셋 크기와 인덱스 메모리가 검색 지연과 TTFT에 미치는 영향을 분석했습니다.

#RAG#LLM
82005분