
umiocr識別工具
詳情介紹
umiocr識別工具,又名Umi?OCR,是一款免費開源的OCR軟件,下載后解壓即可使用,無需聯(lián)網(wǎng)。軟件內(nèi)置高效的OCR引擎,可以從圖片和文檔中批量提取文字,還能讀取二維碼中的內(nèi)容,以及輸入文字生成二維碼。除了上述功能之外,umiocr官方版還提供命令行和HTTP接口調(diào)用,同時支持多語言識別,能夠滿足不同場景的文字提取需求,適合日常文字提取、批量文檔處理,以及開發(fā)者和技術(shù)用戶等人群使用。
軟件特色
1、免費:本項目所有代碼開源,完全免費。
2、方便:解壓即用,離線運行,無需網(wǎng)絡(luò)。
3、高效:自帶高效率的離線OCR引擎,內(nèi)置多種語言識別庫。
4、靈活:支持命令行、HTTP接口等外部調(diào)用方式。
5、功能:截圖OCR / 批量OCR / PDF識別 / 二維碼 / 公式識別。
umiocr識別工具怎么使用
一、啟動umiocr識別工具官方版軟件
1、在本站下載后雙擊【Umi-OCR_Rapid_v2.1.5.7z.exe】,軟件發(fā)布包下載為 .7z 壓縮包或 .7z.exe 自解壓包。自解壓包可在沒有安裝壓縮軟件的電腦上,解壓文件。
2、選擇一個解壓路徑,點擊【Extract】,等待一會。
3、之后就會出現(xiàn)一個【Umi-OCR_Rapid_v2.1.5】的文件夾,點擊進去后雙擊【Umi-OCR.exe】即可啟動。
二、更換界面語言
Umi-OCR 支持的界面多國語言。在第一次打開軟件時,將會按照你的電腦的系統(tǒng)設(shè)置,自動切換語言。
如果需要手動切換語言,可參考以下步驟:
點擊右邊的【全局設(shè)置】-選擇【語言/Language】即可更換。
三、OCR功能
1、截圖OCR
打開這一頁后,就可以用快捷鍵進行操作,識別圖中的文字。
左側(cè)的圖片預覽欄,可直接用鼠標劃選復制。
右側(cè)的識別記錄欄,可以編輯文字,允許劃選多個記錄復制。
也支持在別處復制圖片,粘貼到Umi-OCR進行識別。
文本后處理
關(guān)于OCR文本后處理 - 排版解析方案: 可以整理OCR結(jié)果的排版和順序,使文本更適合閱讀和使用。
預設(shè)方案:
多欄-按自然段換行:適合大部分情景,自動識別多欄布局,按自然段規(guī)則進行換行。
多欄-總是換行:每段語句都進行換行。
多欄-無換行:強制將所有語句合并到同一行。
單欄-按自然段換行/總是換行/無換行:與上述類似,不過 不區(qū)分多欄布局。
單欄-保留縮進:適用于解析代碼截圖,保留行首縮進和行中空格。
不做處理:OCR引擎的原始輸出,默認每段語句都進行換行。
上述方案,均能自動處理橫排和豎排(從右到左)的排版。(豎排文字還需要OCR引擎本身支持)
2、批量OCR
這一頁用于批量導入本地圖片進行識別。
支持格式:jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff。
保存識別結(jié)果的支持格式:txt, jsonl, md, csv(Excel)。
與截圖OCR一樣,支持文本后處理功能,整理OCR文本的排版和順序。
沒有數(shù)量上限,可一次性導入幾百張圖片進行任務(wù)。
支持任務(wù)完成后自動關(guān)機/待機。
如果要識別像素超大的長圖或大圖,請調(diào)整:頁面的設(shè)置→文字識別→限制圖像邊長→【調(diào)高數(shù)值】。
擁有特殊功能 忽略區(qū)域 。
3、文檔識別
支持格式:pdf, xps, epub, mobi, fb2, cbz。
對掃描件進行OCR,或提取原有文本。可輸出為 雙層可搜索PDF 。
支持設(shè)定 忽略區(qū)域 ,可用于排除頁眉頁腳的文字。
可設(shè)置任務(wù)完成后 自動關(guān)機/休眠 。
4、二維碼
掃碼:
截圖/粘貼/拖入本地圖片,讀取其中的二維碼、條形碼。
支持一圖多碼。
支持19種協(xié)議,
生成碼:
輸入文本,生成二維碼圖片。
支持19種協(xié)議和糾錯等級等參數(shù)。
5、全局設(shè)置
在這里可以調(diào)整軟件的全局參數(shù)。常用功能如下:
1)一鍵添加快捷方式或設(shè)置開機自啟。
2)更改界面語言。Umi支持繁中、英語、日語等語言。
3)切換界面主題。Umi擁有多個亮/暗主題。
4)調(diào)整界面文字的大小和字體。
5)切換OCR插件。
6)渲染器:軟件界面默認支持顯卡加速渲染。如果在你的機器上出現(xiàn)截屏閃爍、UI錯位的情況,請調(diào)整界面和外觀 → 渲染器 ,7)嘗試切換到不同渲染方案,或關(guān)閉硬件加速。
適合用戶
1、普通用戶:想快速從屏幕或圖片提取文字,不想上傳隱私數(shù)據(jù)。
2、批量文檔處理:大量圖片或 PDF 需要轉(zhuǎn)換成文本、CSV、MD 等。
3、多語言/二維碼需求:識別多種語言、條形碼和二維碼。
更新日志
v2.1.5版本
1、新增:日志機制。在命令行中啟動 Umi-OCR 可查看實時日志。指定級別以上(默認為ERROR)的日志被保存到 Umi-OCR/UmiOCR-data/logs 目錄中,保存級別可以在全局設(shè)置標簽頁中更改。
2、新增:大部分標簽頁能手動切換左右/上下雙欄模式。
3、新增:Esc鍵隱藏主窗口。
4、新增:調(diào)整二維碼生成相關(guān)參數(shù)后,自動刷新二維碼生成。
5、新增:命令行指令 --reload ,用于重新加載配置文件。
6、修復:文檔識別提取PDF自帶的文本內(nèi)容時,未考慮頁面旋轉(zhuǎn)的影響。
7、修復:文檔識別生成單層PDF時,未寫入原PDF自帶的文本內(nèi)容。
8、修復:OCR結(jié)果展示列表的一些顯示Bug和鼠標劃選Bug。
9、修復:調(diào)整標簽頁順序或刪除標簽頁后,未及時保存順序信息。
10、修復:HTTP接口 /api/doc/download 參數(shù) ignore_blank 的錯誤。
11、修復:Linux版本截圖時,系統(tǒng)任務(wù)欄推移頂層窗口,導致截圖位置偏移。
12、修復:Linux版本截圖后,主窗口的位置與操作前不一致。
13、優(yōu)化:圖片/文檔的異步加載機制?,F(xiàn)在可以流暢地加載含有數(shù)萬個子文件的文件夾,且能預覽加載進度。
14、Windows 版本更新第三方依賴庫:PyMuPDF 1.24.11 ,fontTools 4.56.0 ,Pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0
15、新增UI語言:俄語 Русский ,譯者:Вячеслав Анатольевич Малышев、Muhammadyusuf Kurbonov。泰米爾語 ????? ,譯者:??????????。
下載地址
- 電腦版
- 本地下載通道:
- 江蘇電信下載
- 廣東電信下載
- 北京聯(lián)通下載
- 浙江電信下載
猜您喜歡
- 電腦文字識別軟件合集
- 日常工作中,常會遇到文字識別的場景,好用的文字識別軟件能大大提高效率。故此3322軟件站整理了電腦文字識別軟件合集,提供了多款好用的OCR文字識別工具,如神奇OCR文字識別、風云OCR文字識別、閃電OCR圖片文字識別、金鳴表格文字識別大師、轉(zhuǎn)轉(zhuǎn)大師ocr文字識別軟件、MiniOCR、得力OCR文字識別軟件等,部分軟件不僅免費還支持批量識別,心動不如行動,快來選擇適合你的電腦ocr文字識別軟件吧!
-
神奇OCR文字識別軟件官方版 v3.0.0.327 文件處理 / 41.47M
-
風云OCR文字識別 v1.24.5.101官方版 圖像捕捉 / 749K
-
閃電OCR圖片文字識別軟件官方版 v2.2.8 文字處理 / 51.02M
-
金鳴表格文字識別大師官方版 v5.72.6 文字處理 / 80.24M
-
截圖文字識別和翻譯工具 v3.9 文字處理 / 619K
-
轉(zhuǎn)轉(zhuǎn)大師ocr文字識別軟件 v4.0.0.0 文字處理 / 29.84M



























贛公網(wǎng)安備 36010602000087號