如何使用 Umi-OCR 從掃描版 PDF 中擷取文字
了解如何使用 Umi-OCR 從掃描版 PDF 中擷取文字、建立可搜尋的雙層 PDF,以及高效批次處理多個檔案。
掃描版 PDF 本質上是包裹在 PDF 容器中的圖片。Umi-OCR 為從中擷取文字提供了強大、免費且完全離線的解決方案。
分步指南
1. 開啟 Umi-OCR,導覽到「批次處理」分頁。
2. 將 PDF 檔案拖曳到檔案清單區域。
3. 選擇輸出格式:純文字檔案或可搜尋的雙層 PDF。
4. 點擊開始按鈕。
雙層 PDF 的頂層保留原始掃描影像,底層包含辨識出的文字,位置精確對齊。最終的 PDF 看起來與原始掃描件完全一樣,但可以搜尋和複製文字。
批次處理
Umi-OCR 支援批次操作,可以將整個資料夾拖入介面。軟體會依次處理每個檔案,對數十甚至數百個文件進行 OCR 處理特別實用。
獲得最佳結果的技巧
• 掃描解析度設為 300 DPI 或更高。
• 確保頁面對齊平直。
• 排版越整潔效果越好。
• 支援超過 100 種語言,混合語言內容會自動處理。
總結
從掃描版 PDF 中擷取文字不必複雜或昂貴。Umi-OCR 提供了簡單、強大且免費的解決方案,在你的電腦上離線運行,保護你的資料隱私。