Windows에서 PDF 파일 내용 검색하는 4가지 방법
PDF 파일이 가득한 폴더가 있습니다. 정보가 어딘가에 있는 건 아는데, 어떤 파일인지 모릅니다. 수십, 수백 개의 파일을 하나하나 열어서 Ctrl+F를 누르는 건 현실적인 방법이 아닙니다. Windows에서 PDF 파일 안을 검색하는 4가지 방법을 비교합니다.
방법 1: Windows 파일 탐색기 (기본 내장, 제한적)
Windows는 이론적으로 PDF 내용을 검색할 수 있습니다. 파일 탐색기 검색창에 content:"검색어"를 입력하면 됩니다. 하지만 이것이 작동하려면:
- 대상 폴더에 Windows 검색 인덱싱 활성화
- PDF iFilter 설치 (Windows 10/11에 기본 포함되지만 불안정)
- 인덱싱 옵션 → 고급 → 파일 형식 → PDF → "속성 및 파일 내용 인덱싱" 설정
현실: 모든 설정을 올바르게 해도 Windows 탐색기는 PDF 내용을 자주 놓칩니다. 큰 폴더에서는 느립니다. 대부분 한 번 시도하고 포기합니다.
방법 2: Adobe Acrobat (유료, PDF 전용)
Adobe Acrobat Pro나 무료 Acrobat Reader가 있다면:
- Acrobat 열기 → 편집 → 고급 검색 (Shift+Ctrl+F)
- "다음 위치의 모든 PDF 문서"를 선택하고 폴더 지정
- 검색어 입력
한 폴더 내 여러 PDF를 검색하는 데는 잘 작동합니다. 정확한 구문, 불리언 연산자를 지원하고 북마크와 주석도 검색합니다.
한계: PDF 파일만 검색 — Word, Excel 등 다른 포맷 불가. 무료 Reader는 검색 기능 제한. 파일을 인덱싱하지 않아 매번 처음부터 스캔 (100개 이상에서 느림).
방법 3: PowerShell + pdftotext (기술적, 무료)
기술 사용자라면 pdftotext 유틸리티(Xpdf 또는 Poppler 툴킷)로 PDF 텍스트를 추출하고 PowerShell로 검색할 수 있습니다:
Get-ChildItem *.pdf | ForEach-Object {
$text = & pdftotext $_.FullName -
if ($text -match "검색어") { $_.Name }
}
장점: 무료, 스크립트 가능, 자동화 파이프라인에 적합.
단점: pdftotext 설치 필요. 인덱싱 없음 — 매번 전체 스캔. PDF만 처리. 관련도 정렬 없음. 일상적 사용에 비현실적.
방법 4: LocalSynapse (무료, 한 번 인덱싱 후 즉시 검색)
LocalSynapse는 PDF 파일을 한 번 인덱싱한 후 1초 이내에 내용을 검색합니다. Word, Excel, PowerPoint, HWP 등 8종 이상의 포맷도 동시에 검색합니다.
PDF 검색의 핵심 장점:
- 인코딩 감지: v2.5.3에서 CMap 인코딩 실패로 깨진 텍스트를 감지하고, 쓰레기 결과 대신 해당 PDF를 플래그 처리
- 시맨틱 검색: 정확한 키워드가 아닌 의미로 검색 — "매출 보고서"를 검색하면 "Q3 실적 요약"이 포함된 PDF도 찾음
- 크로스 포맷: 한 번의 검색으로 PDF, Word, Excel 등 모든 포맷을 동시 확인
- 빠름: 초기 인덱싱(v2.5.3 기준 6,500개 파일 ~30분) 후 밀리초 단위 검색
100% 오프라인, 파일 업로드 없음, 무료, 오픈소스 (Apache 2.0).
어떤 방법을 선택할까?
| 상황 | 최적 방법 |
|---|---|
| 몇 개 PDF에서 일회성 검색 | Adobe Acrobat 고급 검색 |
| 자동화 파이프라인 / 스크립팅 | PowerShell + pdftotext |
| 많은 PDF + 다른 포맷을 정기적 검색 | LocalSynapse |
| 설치 불가 환경 | Windows 탐색기 (제한적) |
PDF 내용을 주 1회 이상 검색한다면, 한 번의 인덱싱 투자가 즉시 돌아옵니다. LocalSynapse를 사용해보세요 — PDF뿐 아니라 문서 라이브러리 전체를 다룹니다.