OCR

By youfang

OCR

OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;

JS实现

面向纯JavaScript的OCR识别引擎——Tesseract.js

tesseract.js 官网
tesseract.js 离线版本
多语言 语言包

第三方

百度 - 文字识别
百度 - 文字识别(文档)