Umi-OCR 2.1.5 绿色版

Umi-OCR图片转文字识别软件，也是完全离线的ORC软件。Umi-OCR支持截屏/批量导入图片，支持多国语言、合并段落、竖排文字。可排除水印区域，提取干净的文本，基于 PaddleOCR 进行开发。

项目地址：

截屏

Umi-OCR 截屏

功能摘要

方便：解压即用，离线运行，无需网络。
批量：可批量导入处理图片，结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
高效：采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够，通常比在线OCR服务更快。
精准：默认使用PPOCR-v3模型库。除了能准确辨认常规文字，对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落，得到规整的文本。

更新日志

https://github.com/hiroi-sora/Umi-OCR/releases/

Version 2.1.5

2025-03-26
新增：日志机制。在命令行中启动 Umi-OCR 可查看实时日志。高于指定级别（默认为ERROR）的日志被保存到 Umi-OCR/UmiOCR-data/logs 目录中，保存级别可以在全局设置标签页中更改。
新增：大部分标签页能手动切换左右/上下双栏模式。 (#789)
新增：Esc键隐藏主窗口。 (#652)
新增：调整二维码生成相关参数后，自动刷新二维码生成。 (#690)
新增：命令行指令 --reload ，用于重新加载配置文件。 👉 文档
修复：文档识别提取PDF自带的文本内容时，未考虑页面旋转的影响。 (#785)
修复：文档识别生成单层PDF时，未写入原PDF自带的文本内容。
修复：OCR结果展示列表的一些显示Bug和鼠标划选Bug。
修复：调整标签页顺序或删除标签页后，未及时保存顺序信息。
修复：HTTP接口 /api/doc/download 参数 ignore_blank 的错误。
修复：Linux版本截图时，系统任务栏推移顶层窗口，导致截图位置偏移。 (#778)
修复：Linux版本截图后，主窗口的位置与操作前不一致。
优化：图片/文档的异步加载机制。现在可以流畅地加载含有数万个子文件的文件夹，且能预览加载进度。 (#710)
Windows 版本更新第三方依赖库：PyMuPDF 1.24.11 ,fontTools 4.56.0 ,Pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0
新增UI语言：俄语 Português ，译者：Вячеслав Анатольевич Малышев、Muhammadyusuf Kurbonov。泰米尔语 தமிழ் ，译者：தமிழ்நேரம்。

Version 2.1.4

2024-08-31
修复：引擎原始输出项的"text"为空时，导致文本分析越界的错误。
新增UI语言：葡萄牙语 Português 。
PaddleOCR 插件相关：
修复：布尔类型选项不生效的问题。
修复：繁体中文配置文件错误的问题。
优化：调整默认线程/内存限制，默认内存占用不超过系统总内存的一半。
优化：调整识别语言库结构，精简不必要的文件。
Linux 版本相关：
优化：glibc 依赖降级至 2.31 ，兼容 Debian-11 等发行版。
修复：Docker 部署在部分旧系统中报错 'code': 803 的问题。

Version 2.1.3

2024-07-24
新推出 Linux (Debian) 平台版本。
新增：HTTP 文档识别接口。👉 文档
修复：文档中宽高为0的异常图片会导致任务卡住。

bate.1 版本之后的更新：
修复：HTTP文档识别接口上传的文件名含非ascii字符时，该字符可被保留。
优化：HTTP文档识别接口的 Python示例和 Html示例代码。
优化：排版解析的单栏-单行方案，对于间隔较大的两个相邻文本块，会添加空格作为间隔符。

Version 2.1.2

新增：批量任务（图片、文档）支持暂停任务。只要不退出软件，在待机/休眠后可以恢复任务。
新增：文档任务支持保存为单层纯文本PDF 。
新增：HTTP OCR接口允许设置忽略区域参数。
新增：HTTP 二维码接口允许设置图像预处理参数。
新增：命令行--screenshot允许指定屏幕范围，自动进行截图。
修复：文档内容提取和写入时的坐标旋转、比例适配问题。
修复：截图预览 & 记录面板中，跨区块复制文本时，尾块的复制字数不正确。
优化：批量文档标签页，拖入大量文件、提交大批任务时的性能和流畅度。
优化：文档任务保存的文件名规则。
UI：优化一些布局，调整一些文本，美化一些视觉效果。