Tuesday 30 April 2019

videocr

https://github.com/apm1467/videocr

我写的一个 Python 库,用图像识别技术提取视频中的硬字幕(画面内嵌字幕),并输出成带时间轴的 SRT 文本字幕。使用了开源的 Tesseract 神经网络 OCR 引擎,支持识别几乎任何语言文字,包括英文、中文和日文。

在我自己的测试中准确度不错,就是比较吃 CPU 资源。虽然不知道对谁有用,说不定字幕组能用上?

欢迎试用反馈。