Umi-OCR文字识别工具
免费、开源、可批量的离线OCR软件
- 免费:本项目所有开源代码,完全免费。
- 方便:解压即用,离线运行,消耗网络。
- 高效:自带高效率离线OCR引擎。只要电脑性能足够,就可以比在线OCR服务更快。
- 灵活:支持命令行、HTTP接口等多种调用方式。
- 功能:截图OCR / 批量OCR / 二维码 / 数学公式识别(测试中)
目录
使用源码
开发者请务必阅读构建项目。
下载发行版
可选择以下方式下载:
- 文件差别见文章末尾
开始使用
软件发布包下载为.7z
压缩包或.7z.exe
自解压包。自解压包可在没有安装压缩软件的电脑上,解压文件。
本软件无需安装。解压后,点击Umi-OCR.exe
即可启动程序。
遇到任何问题,请提问题,我会帮助你。
界面语言
Umi-OCR支持多国界面。在第一次打开软件时,将会按照您电脑的系统语言设置,自动切换语言。
如果需要手动切换语言,请参考下图,全局设置
→ 语言/Language
。
标签页
Umi-OCR v2由一系列灵活好用的标签页组成。您可以按照自己的喜好,打开需要的标签页。
标签栏左上角可以切换窗口置顶。右上角能够锁定标签页,以防止日常使用中误触关闭标签页。
截图OCR
截图OCR:打开本页后,就可以用快捷键调起截图,识别出的文字。
- 右侧的图片预览栏,可直接用鼠标划选复制。
- 右侧的识别记录栏,可以编辑文字,划选多个记录复制。
- 也支持在别处复制图片,粘贴到Umi-OCR进行识别。
段落合并
关于OCR文本后期处理-段落合并:可以整理OCR结果的排版和顺序,使文本更适合阅读和使用。默认方案:
- 单行:合并同一行的文字,适合情景。
- 多行自然段:智能识别、合并属于相同段落的文字,适合场景场景,如上图所示。
- 多行代码段:要求原始排版的压缩进与空格。适合识别代码片段,或需要保留空格的场景。
- 竖排:适合竖排版本。需要同样支持竖排识别的模型库搭配使用。
批量OCR
批量OCR:此页支持批量导入本地图片并识别。
- 识别内容可以保存为txt / jsonl / md / csv(Excel)等多种格式。
- 支持
文本后处理
技术,能够识别属于同一自然段的文字,并将其合并。还支持代码段、垂直排列文本等多种处理方案。 - 没有数量上限,可一次性导入几十张图片进行任务。
- 支持任务完成后自动关闭/处理。
忽略区域
关于OCR文本后处理-忽略区域:批量OCR中的一种特殊功能,适用于排除图片中不需要的文字。
- 在批量识别页的右栏设置中可进入忽略区域编辑器。
- 如上方样例,图片顶部和右下角存在多个水印/LOGO。如果批量识别出此类图片,水印就会识别结果造成干扰。
- 按住右侧,多个预定框。这些区域内的文字将在任务中被忽略。
- 请尽量将图形框画得大部分,完全包围住水印所有可能出现的位置。
二维码
扫码:
- 可读取截图/粘贴/拖入本地图片,其中的二维码、条形码。
- 支持一图多码。
- 支持19种协议,如下:
Aztec
,,,,,,,,,,,,,,,,,,,,,,,,,,,, Codabar
_ Code128
_ Code39
_ Code93
_ DataBar
_ DataBarExpanded
_ DataMatrix
_ EAN13
_ EAN8
_ ITF
_ LinearCodes
_ MatrixCodes
_ MaxiCode
_ MicroQRCode
_ PDF417
_ QRCode
_ UPCA
_ UPCE
_
生成码:
- 输入文本,生成二维码图片。
- 支持19种协议和纠错等级等参数。
全局设置
全局设置:这里可以调整软件的全局参数。常用功能如下:
- 一键添加快捷方式或设置开机自启动。
- 更改界面语言。Umi支持繁中、英语、日语等语言。
- 切换界面主题。Umi拥有多个亮/暗主题。
- 调整界面文字的大小和字体。
- 切换 OCR 插件。
- 渲染器:软件界面默认支持显卡加速渲染。如果在你的机器上出现断屏提示、UI错位的情况,请调整
界面和外观
→渲染器
,尝试切换到不同的渲染方案,或者关闭硬件加速。 下载说明
不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错
[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。Umi-OCR_Paddle_v2.0.2.7z.exe (118.5MB)
SHA256:28875194a3c78d2d88ad7f2cb44a4da4a1976e372b84e7dd5864dddf220eba63
Rapid 引擎插件版
(速度稍慢,内存占用低,适合低配机器,兼容性好)
暂无评论内容