これ、日本語 OCR触る人、皆試してみてほしい。
OSSの OCRプロダクト、「Yomitoku」。
しばらく前に見て、使ってみようと思ってから、バタバタしてさわれていなかったのだけど、存在を知り合いの方に思い出させてもらって、そういや触っていなかったと思い触った。
これ、日本国内でもっと普及して良い、かなりの品質。
テーブルや画像の抜き出しも日本語がかなり正確で、セクションヘッダーなどが多少誤りはあるものの、ここまで高精度で日本語をPDFや、その中のテーブル、図から抜き出せるのは、有償のAzure Document Intelligenceくらい。
それぞれ動きは異なるけど、オフラインで、cpuでも動き、数百ファイルの解析に1、2時間。そして、githubに上がっているサンプルって、だいたいそれ通りにうまくいかないことが多いのだけど、これは違う。本当にこの通り、このレベルで出た。
国内発の OCRプロダクトのOSS、cc-byとはいえど、有償で商用利用可能、オフラインでCPUでも全く重たくないこれ、今後めちゃくちゃ実例が出てくると思うから、皆さん触ってみた方が良い。
僕はオフラインの国産で、このレベルは真面目に見たことがない。
しかも、MCPにまで最近対応していて、時代に追いつくプロダクト。
真面目にこれをオープンに出してくれていることに感謝。