생성형 AI를 활용하여 PDF 파일과 대화를 나눌 수 있는 6가지 방법을 알아봅니다.
무료 사이트부터 유료 서비스, 웹 브라우저까지 다양하게 준비했습니다!
[1] 무료 사이트 이용하기
PDF와의 대화를 지원하는 무료 사이트를 이용합니다.
메인 페이지부터 이미 파일 업로드하는 창이 보입니다.
저기다가 PDF 파일을 드래그(drag)해서 넣어주면 됩니다.
왼쪽에는 Chat history가 있구요(ChatGPT의 UI와 비슷하네요)
가운데에는 제가 업로드한 PDF 파일이 보여집니다.
우측에 생성형AI와 대화할 수 있는 대화창이 뜹니다.
국민은행에서 발행한 [2022 한국 부자보고서.pdf] 파일과 대화를 나눠봅니다.
부자들의 자산 포트폴리오를 물어보니 PDF 파일을 검색하고 분석해서 이렇게 대답해주네요.
답변 내용 중간에는 숫자로 레퍼런스 표시가 되어 있습니다.
숫자 16을 눌러보니 PDF 파일에서 해당되는 부분을 이렇게 컬러링 해서 보여줍니다.
원문을 찾아서 읽어보기도 너무 편하고,
혹시나 할루시네이션이 생기진 않았는지 확인해 볼 수 있어서 너무 좋습니다.
영어로 작성된 PDF 문서를 올려놓고 한글로 질문하고 한글로 대답을 받아볼 수 있다는 것은 정말 축복이 아닌가요.
아주 좋습니다.
이 외에도 유사한 기능을 하는 여러 사이트가 있습니다.
대부분의 사이트는 처음에 일정량을 무료로 제공합니다.
사용량이 많아지거나 PDF 파일 분량 또는 용량이 커지면 구독을 요구하는 경우가 많습니다.
[2] GPT plus 요금제 구독하고 GPT-4 기능에서 대화하기
무료 버전인 GPT-3.5 대화창에서는 파일 업로드가 불가능하지만,
유료 버전인 GPT plus를 구독하고 GPT-4 기능으로 대화창을 열면 업로드 버튼이 생깁니다.
업로드 버튼 누르고 파일을 선택해주면 GPT가 일단 파일을 파악합니다.
그리고 대화를 시작하면 됩니다.
이렇게 PDF 내용 찾아서 잘 대답해줍니다.
맨 뒤에 쌍따옴표는 레퍼런스 위치를 파악해주는 기능입니다만,
특정 문단을 찍어주지는 못하고 그냥 파일명 단위로 알려줍니다.
파일 하나만 업로드해서 대화를 나누는 경우에는 아무 도움도 안 됩니다.
파일 여러개를 올려놓고 대화를 나누었다면 어느 파일에서 찾아서 대답한건지 알려줄테니 도움이 되겠지요.
구체적인 숫자까지 잘 찾아서 답변을 생성해주네요.
하지만 할루시네이션은 항상 조심해야 합니다.
보시는 것처럼 쌍따옴표에서 파일 이름만 알려주니까,
할루시네이션 여부를 확인하는 것이 좀 어렵습니다.
대화가 길어지면 처음에 업로드 했던 파일 내용을 점점 까먹을수도 있으니
필요하다면 중간에 한번씩 다시 업로드 해주세요.
그리고 무조건 업로드 한 파일에서 찾아서 대답하는 것은 아니고,
GPT 자신의 지식을 섞어서 대답할 수도 있습니다.
만약 무조건 업로드 파일 기준으로만 대답을 받고 싶으시다면
“내가 준 파일의 내용을 찾아서 답변을 해라. 만약 파일에 나의 질문과 관련된 내용이 없다면 해당 내용이 없다라고 답변을 해라”
이렇게 프롬프트로 각인을 시켜놓고 대화를 시작하세요.
[3] GPTs에서 찾기
유료 버전인 GPT plus 요금제를 구독하면 GPTs 기능을 사용할 수 있죠.
Explore GPTs 눌러봅니다.
GPTs를 검색하는 창에 PDF 라고만 입력해봐도 아주 많은 결과가 나옵니다.
무려 1M+ (1백만개 이상의 Chat이 사용된 인기 GPTs)도 있네요.
설명을 보니 무료 버전이고, 크롬확장프로그램도 있다고 합니다.
Pro(이건 아마 유료 버전) 등급에서는 폴더 search도 되고 OCR도 된다고 하네요.
Starts Chat 눌러봅니다.
START HERE: HOW TO UPLOAD FILE 눌러보면 친절하게 설명 나옵니다.
누구와 대화하고 있는지를 나타내는 부분에 GPT-3.5도 아니고 GPT-4도 아니고, GPTs의 이름인 “PDF Ai PDF”가 떠 있습니다.
AI Drive 저 부분에 링크되어 있는 사이트로 가서 회원가입하고 파일 업로드하면 됩니다.
그럼 PDF 파일에 대한 url이 생기고, 이 url을 GPT 대화창에다가 넣어주면 파일이 인식됩니다.
[4] GPTs를 직접 만들기
이런 GPTs를 내가 직접 만들어도 됩니다.
Explore GPTs에서 우측 상단에 있는 Create를 눌러줍니다.
왼쪽은 GPTs를 만드는 공간이고, 오른쪽은 이렇게 만들어진 GPTs와 샘플 대화를 해보는 공간입니다.
왼쪽에서 GPT Builder가 안내해주는 것에 따라서 무엇을 만들 것인지, 이름, 아이콘 이미지, 역할, 말투 등등을 지정해주면 됩니다.
이렇게 자연어로 시키면 됩니다.
그럼 이렇게 Configure쪽에 Instructions으로 반영이 됩니다.
이렇게 만들어진 My GPTs는 모든 질문과 답변 과정에서 이 Instructions를 잘 지킵니다.
Configure 메뉴에서 아래쪽을 보면 Knowledge를 첨부할 수 있습니다.
여기에서 대화하고 싶은 파일을 첨부해줍니다.
다시 Create 대화창으로 가서 이름도 정해주고 아이콘 이미지도 정해줍니다.
이렇게 만든 My GPTs는 다양한 범위로 공유를 설정할 수 있습니다.
GPT 모델명 뜨는 부분에 [GPT File Chat]이라고 제가 만든 My GPTs가 떴네요.
한가운데 보시면 [By 버프]라고 GPTs 만든 사람 이름이 뜹니다.
역시나 내용 잘 찾아서 대답 잘 해 줍니다.
GPTs 이름을 그냥 “2022 한국 부자보고서”라고 지어줘도 좋을 것 같네요.
GPT-4 대화창에서 업로드 했을 때는 업로드 된 파일마저도 대화의 일부이기 때문에
시간이 많이 지나고 대화가 길어지면 GPT가 까먹을 수도 있습니다.
하지만 이렇게 GPTs 만들기에서 Knowledge로 넣어두면
지속적으로 참고자료로 처리가 되므로 까먹지 않습니다.
[5] MS Edge 브라우저에서 MS Copilot 활용하기
Microsoft의 인터넷 검색 브라우저인 Edge를 열어보면 우측 상단 코파일럿 아이콘이 있습니다.
코파일럿 아이콘 눌러주면 우측 사이드바에 코파일럿 대화창이 뜹니다.
해당 보고서를 검색해서 페이지를 찾아서 PDF 파일을 열어줍니다.
그냥 다운받은 PDF 파일을 드래그(drag)해서 edge 브라우저 위에 던져도 됩니다.
그럼 이렇게 Edge 브라우저 상에서 왼쪽에는 PDF 파일, 오른쪽에는 코파일럿 대화창으로 셋팅이 됩니다. 이제 질문하면 됩니다.
이렇게 답변을 해줬네요. 하지만 이건 PDF 파일의 내용이 아니네요.
코파일럿은 알려진 바와 같이 OpenAI의 GPT-4 모델을 빌려와서 쓰고 있습니다.
사전학습된 지식도 많고, MS Bing 기술로 인터넷 검색도 할 줄 알고,
Edge 브라우저가 열고 있는 페이지나 문서에 접근도 가능하니다.
지금은 “웹 사용”이라고 뜬 걸 보니 인터넷 검색을 해서 대답을 했네요. 그리고 대답의 근거가 되는 사이트를 레퍼런스 링크로 같이 제공해주고 있습니다.
“웹 사용” 옆에 화살표 눌러보면 이렇게 뜹니다. PDF 파일 사용해서 응답하라고 눌러봅니다.
PDF 파일을 지정해준 상태에서 질문 프롬프트를 입력합니다.
(※ 이 부분에서 오늘은 많이 막히네요… 코파일럿과 Edge의 연결성이 조금 불안정합니다.)
예전에 사용했었던 화면을 보여드립니다.
[6] 구글 제미니
우선 구글 제미니에 접속합니다.
제미니에는 대화창 옆에 파일 업로드 버튼이 안 보입니다. 이미지 업로드만 있네요.
설정 > 확장 프로그램 들어가서 구글 워크스페이스를 연결해줍니다.
이렇게 연결해주고 질문을 하면 제미니는 이제 저의 워크스페이스를 찾아볼 수 있습니다.
구글은 문서를 보관하는 워크스페이스(구글 드라이브)도 있고, 생성형 AI인 제미니도 있으니 이런 것도 가능하네요.
Microsoft도 클라우드 공간인 원드라이브를 가지고 있고 생성형 AI 코파일럿이 있으니 이런 연결이 가능합니다.
심지어 PPT, XLS, WORD 등 오피스를 모두 가지고 있으니 PDF 파일 뿐만 아니라 워드, 파워포인트, 엑셀 파일과의 대화도 가능합니다.
다만, MS365와 코파일럿 유료 구독이 필요합니다.
자~ 이렇게 오늘은 PDF 파일과의 대화 방법을 여러가지 알아보았습니다.
업무상 기술 자료, 산업 분석 자료, 보도 자료, 특허, 논문 등 정말 여러가지 파일들을 찾고 분석하고 정리하는데요,
이런 툴들이 있어서 일이 한결 수월해졌습니다.
여러분들도 잘 활용하고 계신가요?