[인프라를 소프트웨어처럼 3/5] 환경은 브랜치에서 태어난다: Environment Variant
공유 dev 병목을 없애기 위해 브랜치 하나로 격리 환경을 만드는 Environment Variant 설계를 소개했습니다. ArgoCD ApplicationSet으로 생성과 회수를 자동화해 환경 생명주기를 git과 연결했습니다.
gRPC 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.
20개 표시
공유 dev 병목을 없애기 위해 브랜치 하나로 격리 환경을 만드는 Environment Variant 설계를 소개했습니다. ArgoCD ApplicationSet으로 생성과 회수를 자동화해 환경 생명주기를 git과 연결했습니다.
Istio Ambient mode에서 워크로드 재시작 시 간헐적 503이 발생한 원인을 추적했습니다. 오래된 HBONE connection 재사용과 ztunnel의 graceful close 부재가 핵심이었고, reset retry로 증상을 완화했습니다.
Spark Connect를 멀티세션 서비스로 운영하며 생기는 단일 장애점과 리소스 경합 문제를 다뤘습니다. replica, Gateway, 부하 점수 기반 세션 배치로 안정성을 높인 과정을 정리했습니다.

GPU 수량 경쟁보다 풀스택 최적화가 AI 인프라 비즈니스의 핵심이라고 설명했습니다. 운영 효율과 총비용 관점에서 AI NIC와 베어메탈 아키텍처의 중요성을 짚었습니다.
티빙에서 자주 쓰는 업무용어를 분야별로 정리한 글입니다. 낯선 용어를 빠르게 익혀 정확하고 효율적인 소통에 도움을 주고자 했습니다.
도메인에 의존하지 않는 채팅 플랫폼 MessagingHub의 설계와 연동 구조를 소개했습니다. 웹 기반 공통 클라이언트와 정책 분리로 확장성과 이식성을 높였습니다.

Strands Agents SDK로 TwelveLabs와 AWS 서비스를 결합한 에이전틱 비디오 엔진 구현 방식을 소개했습니다. 단일 에이전트와 멀티 에이전트 구조로 영상 검색, 요약, 자막 처리 흐름을 구성했습니다.

AI가 대신 쇼핑하는 미래를 위해 UCP, AP2, x402와 USDC 기반 결제 구조를 설명했습니다. 또한 통제 가능한 자동화가 AI 커머스의 핵심이라는 점을 정리했습니다.

AWS 세션에서 AI 에이전트로 유전체 분석을 민주화하는 사례를 소개했습니다. 자연어 기반 분석, 표준화된 도구 연결, 대규모 데이터 처리를 중심으로 정리했습니다.
![[세션 리뷰] The 22nd KOGO Winter Symposium(1): AI를 통한 유전체 분석의 민주화](https://tech.cloud.nongshim.co.kr/wp-content/uploads/image-583-scaled.png)
AWS re:Invent 2025의 핵심 키노트와 신규 발표를 정리한 글입니다. AI 인프라 확장과 에이전트 시대를 위한 AWS의 방향을 요약했습니다.

OpenTelemetry와 Kafka를 활용해 마이크로서비스 환경의 Observability 파이프라인을 구축한 사례를 소개했습니다.\n자동 계측, 중앙 Collector, Signal별 분리로 안정성과 확장성을 높였습니다.
대규모 Lustre 환경에서 rsync 기반 DR의 한계를 Changelog로 보완한 구조를 소개했습니다. 배치 기반 증분 동기화와 체크포인트 관리로 RPO를 낮춘 사례를 다뤘습니다.

카카오뱅크가 펀드 시스템 구축 과정에서 사내 Spring Boot Starter barcelona를 개발한 사례를 소개했습니다. FixedLength 전문, HTTP Client, 분산 트레이싱을 추상화해 생산성과 일관성을 높였습니다.
LLM 멀티 에이전트로 API 문서 기반 E2E 테스트 생성 파이프라인 MAFT를 소개했습니다. Noir의 테스트 공백을 줄이기 위해 의존성 분석, 시나리오 생성, 코드 검증을 자동화했습니다.
Python 기반 에이전트 워크플로우 엔진을 Golang으로 전환한 사례를 소개했습니다. 고루틴과 채널로 스트리밍과 병렬 오케스트레이션을 구현해 응답 시간과 인프라 효율을 개선했습니다.

A2A 프로토콜을 활용한 실무 사례와 동작 구조를 소개했습니다. 호스트 에이전트가 여러 리모트 에이전트를 호출해 결과를 종합하는 흐름을 설명했습니다.

요기요는 사내 AI 챗봇 ‘조리’로 반복적인 IT/HR 문의와 일부 업무를 자동화했습니다. Slack 기반 멀티에이전트 구조와 외부 시스템 연동으로 응답과 액션을 함께 처리했습니다.

LLM 품질 평가 도구 SPeCTRA를 채팅플러스 검증에 확장 적용한 사례를 소개했습니다. Postman 자동화와 Judge 프롬프트 튜닝으로 커버리지와 효율을 높였습니다.

AI가 SRE의 역할을 장애 대응 중심에서 예측과 품질 관리 중심으로 바꾸고 있음을 설명했습니다. 메르카리와 AIOps 사례를 통해 AI 신뢰성과 인간 협업의 필요성을 정리했습니다.

Tech-Verse 2025에서 LY의 다양한 AI 서비스 적용 사례를 살펴보았습니다. 기술 구현뿐 아니라 평가, 운영, 사용자 경험까지 함께 보는 관점이 인상적이었습니다.
