
백엔드
워드 문서 파일 형식: DOC 포맷의 구조와 이해 (1)
두줄요약
DOC 바이너리 포맷의 내부 구조와 파싱 절차를 설명했습니다. FIB, CP, PLC, Clx를 중심으로 공식 명세와 C++ 예시로 읽는 방법을 정리했습니다.
핵심 내용
- DOC(.doc) 바이너리 포맷의 내부 저장 구조와 파싱 흐름 설명
- OLE2 기반 Storage/Stream, FIB, CP, PLC·STTB·RG 개념을 중심으로 한 데이터 해석 방식 정리
- MS-DOC 공식 명세와 C++ 예제를 활용한 텍스트 정보 읽기와 구조 탐색 방법 소개
적용해볼 점
- 바이너리 문서 해석 시 FIB를 기준으로 위치와 크기 추적
- 공식 명세와 데이터 구조명을 함께 활용해 필요한 필드 탐색
- Clx 같은 중첩 구조는 leaf 데이터까지 단계적으로 분해해 읽기
