Umi-OCR | 如何使用 Umi-OCR 從掃描版 PDF 中擷取文字

掃描版 PDF 本質上是包裹在 PDF 容器中的圖片。Umi-OCR 為從中擷取文字提供了強大、免費且完全離線的解決方案。

分步指南

1. 開啟 Umi-OCR，導覽到「批次處理」分頁。 2. 將 PDF 檔案拖曳到檔案清單區域。 3. 選擇輸出格式：純文字檔案或可搜尋的雙層 PDF。 4. 點擊開始按鈕。雙層 PDF 的頂層保留原始掃描影像，底層包含辨識出的文字，位置精確對齊。最終的 PDF 看起來與原始掃描件完全一樣，但可以搜尋和複製文字。

批次處理

Umi-OCR 支援批次操作，可以將整個資料夾拖入介面。軟體會依次處理每個檔案，對數十甚至數百個文件進行 OCR 處理特別實用。

獲得最佳結果的技巧

• 掃描解析度設為 300 DPI 或更高。 • 確保頁面對齊平直。 • 排版越整潔效果越好。 • 支援超過 100 種語言，混合語言內容會自動處理。

總結

從掃描版 PDF 中擷取文字不必複雜或昂貴。Umi-OCR 提供了簡單、強大且免費的解決方案，在你的電腦上離線運行，保護你的資料隱私。