Post

Conversation

これ、日本語 OCR触る人、皆試してみてほしい。 OSSの OCRプロダクト、「Yomitoku」。 しばらく前に見て、使ってみようと思ってから、バタバタしてさわれていなかったのだけど、存在を知り合いの方に思い出させてもらって、そういや触っていなかったと思い触った。 これ、日本国内でもっと普及して良い、かなりの品質。 テーブルや画像の抜き出しも日本語がかなり正確で、セクションヘッダーなどが多少誤りはあるものの、ここまで高精度で日本語をPDFや、その中のテーブル、図から抜き出せるのは、有償のAzure Document Intelligenceくらい。 それぞれ動きは異なるけど、オフラインで、cpuでも動き、数百ファイルの解析に1、2時間。そして、githubに上がっているサンプルって、だいたいそれ通りにうまくいかないことが多いのだけど、これは違う。本当にこの通り、このレベルで出た。 国内発の OCRプロダクトのOSS、cc-byとはいえど、有償で商用利用可能、オフラインでCPUでも全く重たくないこれ、今後めちゃくちゃ実例が出てくると思うから、皆さん触ってみた方が良い。 僕はオフラインの国産で、このレベルは真面目に見たことがない。 しかも、MCPにまで最近対応していて、時代に追いつくプロダクト。 真面目にこれをオープンに出してくれていることに感謝。
The image shows a comparison between two documents: one labeled '入力画面' (Input Screen) and the other 'OCR の結果' (OCR Result). The left side displays the original document, while the right side shows the output after applying the OCR tool 'Yomitoku'. The post text highlights the effectiveness of Yomitoku, an open-source OCR product from Japan, praising its high accuracy in extracting Japanese text from PDFs, including tables and images. The user emphasizes the tool's quality, offline capability, and CPU efficiency, suggesting it's comparable to paid services like Azure Document Intelligence. The image is a clear demonstration of Yomitoku's capabilities, showcasing its potential for widespread adoption in Japan.