MS워드에 첨부한 이미지 파일들만 추출하기

MS워드에 사용한 원본 이미지들을 가져와 다른 프로그램에서 사용하거나 이미지 파일로 따로 저정하려면 MS워드의 이미지 컨텍스트 메뉴를 이용해서 별도의 파일로 저장하면 됩니다.

문서 안에 사용한 이미지 파일이 많을 경우 상당히 번거로운 반복 작업을 해야 합니다.

이미지를 하나씩 선택해서 파일로 저장하는 번거로움을 줄일 수 있습니다.

MS워드 문서 포맷은 기본적으로 ZIP 압축 파일입니다.

확장자가 doc, docx 지만 실제 파일 내용은 zip 압축 파일입니다.

MS워드에서 문서를 작성한 후 저장을 하면 텍스트 데이터와 이미지 데이터, 또는 문서 안에 첨부된 멀티미디어 데이터, 파일 등을 하나의 압축 파일로 압축해서 저장합니다.

워드문서.docx -> 워드문서.zip 으로 확장자 변경 -> 압축해제 프로그램으로 압축 해제

그러니까 .docx 확장자를 .zip으로 바꾸면 MS워드 파일의 압축을 풀 수 있습니다. MS워드파일의 확장자를 zip으로 바꾼 후 압축을 풀면 다음과 같은 폴더 구조로 압축이 풀립니다.

압축을 푼 MS워드 문서

문서 안에 첨부된 이미지들은 별도의 폴더로 구분되어 따로 모아져 있습니다.

"압축푼 폴더 > word > media"

폴더를 열면 다음처럼 문서안의 이미지 파일명이 "image숫자"로 순서대로 번호가 붙어서 따로 모아져 있습니다.

폴더 안의 이미지 파일들은 친절하게도 "image+숫자번호.확장자" 형태로 파일 이름까지 순서대로 숫자 번호가 붙어서 정리되어 생성됩니다.

이미지 파일의 숫자 일련 번호는 문서 안에 이미지 파일이 위치하는 순서대로 매겨집니다.

이미지 파일 이름만 보면 대충 문서의 어느 위치라는 것도 알 수 있습니다.