Tuesday 30 April 2019

¶videocr

我写的一个 Python 库，用图像识别技术提取视频中的硬字幕（画面内嵌字幕），并输出成带时间轴的 SRT 文本字幕。使用了开源的 Tesseract 神经网络 OCR 引擎，支持识别几乎任何语言文字，包括英文、中文和日文。

在我自己的测试中准确度不错，就是比较吃 CPU 资源。虽然不知道对谁有用，说不定字幕组能用上？

欢迎试用反馈。