

워드 문서 파일 형식: DOCX 포맷의 구조와 이해 (1)
DOCX 포맷이 ZIP 기반 XML 구조라는 점과 주요 파일의 역할을 정리했습니다. WordprocessingML의 계층과 단위 체계를 통해 문서 자동화 활용 가능성도 소개했습니다.
#DOCX#OOXML
44005분


DOCX 포맷이 ZIP 기반 XML 구조라는 점과 주요 파일의 역할을 정리했습니다. WordprocessingML의 계층과 단위 체계를 통해 문서 자동화 활용 가능성도 소개했습니다.


HWPX 본문 구조와 section.xml·header.xml의 참조 관계를 Python으로 파싱하는 과정을 설명했습니다.문단과 run, 서식 정보를 연결해 텍스트·표·그림을 추출하는 방법을 다루었습니다.


AWS Lambda와 S3 이벤트를 이용해 사이트맵 갱신을 자동화한 사례를 소개했습니다. CloudFront 캐시 무효화까지 연결해 신규 제휴점이 검색엔진에 빠르게 반영되도록 구성했습니다.


HWPX를 ZIP 기반 XML 포맷으로 보고 Python 내장 라이브러리로 메타정보를 추출하는 방법을 설명했습니다. 문서 시작 번호, 커서 위치, 바이너리 목록을 `Document` 객체로 구조화하는 흐름을 다뤘습니다.


HWPX는 XML 기반의 ZIP 패키지 구조로 문서 데이터를 저장하는 개방형 포맷입니다. 주요 파일과 폴더의 역할, 본문과 메타데이터가 어떻게 구성되는지 정리했습니다.
RSS로 사이트 업데이트를 자동으로 받아보는 방법과 활용법을 정리했습니다. 또한 잦은 조회로 생길 수 있는 서버 부하와 RSS의 한계도 함께 설명했습니다.
RSS의 개념과 리더를 통한 자동 구독 방법을 설명했습니다. 또한 서버 부하와 실시간성 한계, 여전히 유용한 활용처를 함께 정리했습니다.