Post

Conversation

結構単純でPythonで 1. AppleScriptで、いまアクティブなウインドウの名前を取得 2. macOSの標準にあるscreencaptureを使って画面全体をスクショ 3. macOSのVision Frameworkを使ってOCRで中身を読み取る 4. 取得した情報をJSONL形式でログを保存 5. キャプチャの画像を削除 をやってるだけです!OCRをAIでやると料金がえぐくなるので、精度は低いけど、OCRはローカルでやってます。まあ、そんなに精緻に取る必要もないので、、