如何使用 Umi-OCR 從掃描版 PDF 中擷取文字

了解如何使用 Umi-OCR 從掃描版 PDF 中擷取文字、建立可搜尋的雙層 PDF,以及高效批次處理多個檔案。

掃描版 PDF 本質上是包裹在 PDF 容器中的圖片。Umi-OCR 為從中擷取文字提供了強大、免費且完全離線的解決方案。

分步指南

1. 開啟 Umi-OCR,導覽到「批次處理」分頁。 2. 將 PDF 檔案拖曳到檔案清單區域。 3. 選擇輸出格式:純文字檔案或可搜尋的雙層 PDF。 4. 點擊開始按鈕。 雙層 PDF 的頂層保留原始掃描影像,底層包含辨識出的文字,位置精確對齊。最終的 PDF 看起來與原始掃描件完全一樣,但可以搜尋和複製文字。

批次處理

Umi-OCR 支援批次操作,可以將整個資料夾拖入介面。軟體會依次處理每個檔案,對數十甚至數百個文件進行 OCR 處理特別實用。

獲得最佳結果的技巧

• 掃描解析度設為 300 DPI 或更高。 • 確保頁面對齊平直。 • 排版越整潔效果越好。 • 支援超過 100 種語言,混合語言內容會自動處理。

總結

從掃描版 PDF 中擷取文字不必複雜或昂貴。Umi-OCR 提供了簡單、強大且免費的解決方案,在你的電腦上離線運行,保護你的資料隱私。
Umi-OCR | 如何使用 Umi-OCR 從掃描版 PDF 中擷取文字