업무 자동화를 하다보면 PDF에서 막힐 때가 많습니다.
데이터를 엑셀로 받았으면 그대로 엑셀 VBA를 하든, 파이썬을 하든 자동화를 하면 되는데요,
다른 부서, 특히 다른 회사로 보낼 때는 수정 편집을 막기 위해 꼭 PDF로 보내는 경우가 많죠.
우선, 여러가지 방법을 알아내기 위해 역시나 GPT부터 불러봅니다.
여러가지 방법들을 잘 알려주네요.
다른 방법도 알려 달라고 여러 번 물어봤습니다.
아래와 같은 방법들이 있다고 하네요.
1.
PDF 파일에서 드래그해서 복사 + 엑셀에서 붙여넣기
2.
엑셀 > 데이터 > 데이터 가져오기 > 파일에서 > PDF
3.
PDF 핸들링 프로그램 활용하기
4.
OCR(광학문자인식) 해서 인식하기
PDF 파일에서 드래그해서 복사 + 엑셀에서 붙여넣기
PDF 파일을 열고 마우스로 드래그를 해서 콘트롤C 누릅니다.
엑셀에 붙여넣기 하면 그냥 텍스트로 한줄에 다 들어가 버릴 때가 많습니다.
그럼 선택하여 붙여넣기 눌러보세요. HTML, 유니코드 텍스트, 텍스트 이렇게 3가지 옵션이 있어요.
이 중에 가장 표와 비슷하게 삽입되는 형태로 하세요.
이 정도면 살짝 수정하면 표로 살릴 수 있을 것 같네요.
데이터 > 텍스트 나누기 메뉴로 갑니다.
띄워쓰기로 구분이 되고 있으니 구분기호를 ‘공백’으로 선택할게요.
이 정도면 완벽하진 않지만 그래도 꽤 원본 흉내는 냈어요.
오른쪽에 주관식은 빈 칸으로 너무 쪼개져버려서 거의 못 쓰겠네요.
복사 붙여넣기는 이 정도가 한계에요.
엑셀 > 데이터 > 데이터 가져오기 > 파일에서 > PDF
GPT가 알려준 메뉴를 엑셀에서 찾아봅니다.
데이터 > 데이터 가져오기 > 파일에서 > PDF에서
이 메뉴 누르고 PDF 파일을 선택합니다.
PDF 파일을 읽으면 이렇게 뜨고요,
데이터 변환을 누르면 마이크로소프트의 파워쿼리 편집기가 뜹니다.
PowerBI라는 데이터 시각화 툴에서 가장 중요한 역할을 하는 파워쿼리 편집기입니다.
엑셀에서도 만나니까 반갑네요.
특정 행 데이터를 지우거나, 열을 추가하거나, 열의 데이터 유형을 수치형으로 변환하거나
데이터베이스를 정리하는 여러가지 기능들을 합니다.
이번엔 업로드한 PDF 파일 속의 테이블은 깔끔한 데이터 테이블이라서 손 볼 곳이 없네요.
‘닫기 및 로드’ 눌러줍니다.
짜잔~ 표가 잘 들어왔네요.
혹시 모르니 숫자가 틀리지 않았는지 확인도 좀 해주시고요.
이 표가 표 이름까지 붙여져있고 고정되어 있어요.
간단하게 편집하려면 표 지정을 해제하고 일반적인 범위로 변환을 해야 합니다.
해당 메뉴는 ‘테이블 디자인 > 범위로 변환’에 있어요.
PDF 핸들링 프로그램 활용하기
이번에는 PDF 전문 프로그램 써볼게요.
국민 압축 프로그램 알집 시리즈에 포함되어 있는 알PDF 입니다.
무료니까 설치하고 실행해줍니다.
‘PDF 열기’ 눌러서 PDF 파일 로딩합니다.
짜잔~ 우측 상단에 무려 ‘PDF를 Excel로’ 라는 메뉴가 있어요.
그리고 PDF를 Word로, Image로, Powerpoint로 메뉴가 다 있습니다.
대단하네요.
PDF 핸들링하는 기본 기능만 해도 PDF 변환, 편집, PDF 통합 메뉴도 보여요.
여기서 PDF를 Excel 메뉴 눌러주면 아주 깔끔하게 엑셀 파일로 변환됩니다.
OCR(광학문자인식) 해서 인식하기
알PDF에는 ‘OCR’ 메뉴도 보여요.
눌러보면 별도의 프로그램을 설치하고 뜹니다. 네~ 설치해줍니다.
설치 후에 OCR 기능 눌러보면 PDF 파일에 있던 모든 글자와 숫자가 복사 가능하게 셋팅됩니다.
필요한 부분을 복사해서 쓰면 됩니다.
이걸 복사해서 엑셀에 표 모양 그대로 삽입하는 건 안 됩니다.
그냥 텍스트를 다 복사할 수 있다는 것에 만족해야 합니다.
OCR 할 수 있는 툴 하나 더 소개드립니다.
윈도우11에 번들로 탑재되어 있는 ‘캡처 도구’ 입니다.
윈도우 버튼 누르시고 검색창에서 ‘캡처 도구’ 찾아보세요.
아래와 같이 캡처 화면에서 모든 글자와 숫자를 복사 가능하게 인식해줍니다.
한 번 하고 두 번 하고 세 번 해야 하는 작업은
자동화해야죠~
GPT에게 어떻게 하면 자동화 할 수 있냐는 질문으로 시작해보세요.
생각보다 우리가 스스로 자동화 할 수 있는 일들이 많습니다.