高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

PaddleOCRv5をONNXに変換してお試し🦔

PaddleOCRv5をONNX変換して、推論スクリプトからpyclipperとshapely依存を排除したサンプルコードです👀

精度を追い求めたいならPaddleOCR-VLのほうが良いです(もちろん相応に処理が重いですが)

実は国交省の看板での検出率はv3よりちょっと劣化していたり。。。

 

ソースコードと変換したモデルは以下にコミットしています。

github.com

ノードエディタ形式の画像・オーディオ処理ツール「Multimodal-Node-Editor」を公開しました🍜

ノードエディタ形式の画像・オーディオ処理ツール「Multimodal-Node-Editor」を公開しました🍜

今まで、ノードエディタ形式の画像処理ツール「Image-Processing-Node-Editor」、オーディオ処理ツール「Audio-Processing-Node-Editor」を作ってきましたが、、、

色々設計が微妙なところとか、実装が微妙なところとか、
良かれと思って入れた設計が裏目に出ていたところとか、
ちょいちょいあり、ずーっと作り直したいなー。と思っていました。
(特にノード追加方法とか、GUIに自由度を持たせようとした結果、実装漏れが発生しやすいつくりになっていたり。。。)

改めて、設計・実装を刷新し、画像やオーディオを1つのノードエディターで扱えるようにしたのが、「Multimodal-Node-Editor」です。

 

特徴の紹介記事は以下です🦔

zenn.dev

 

ソースコードは以下にコミットしています🦔

github.com

 

2026/01/07 追記:

コード量など覚書👀

 

2025年振り返り

はじめに

12/25(木)に仕事納めしました(26(金)は所用で有給休暇取得)
冬休み中は、以下のノードエディター作ったり、年明けのLT資料や登壇資料を作ってすごす予定です🦔

GitHub

リポジトリ

リポジトリ数:603 → 704
作成リポジトリ:531 → 624
フォークリポジトリ:72 → 80

作成リポジトリの内、Public/Privateの内訳は以下↓
Publicリポジトリ:278 → 323
Privateリポジトリ:325 → 381

今年は昨年と同じくらいの作成数です(Publicリポジトリは45作成、昨年は50作成)
正直あんまり何か作った記憶はないのですが、サンプルコードとかちょこちょこ作っている感じですかね。おそらく。

フォロー/フォロワー

フォロワー:675人 → 736人
フォロー:103人 → 106人

ここは特に言うことなし👀

スター数合計

スター数総合計:4,023 → 4507
スター数平均:6.67→ 6.4

合計4500越えました👾
最近作ったものでスター数が多いものはないので、いまだに昔のリポジトリが見られているみたいな感じですね。
スター数を求めて何かを作っているわけではありませんが、来年は、また気合の入ったものを作りたい気分です。

スター数トップ10

昨年のTop10↓
今年のTop10↓
顔ぶれ変わらず。
ただ、今年作ったサンプルコードのリポジトリなども、使用報告などはちょくちょく貰えるので、参考にはしていただいているようです。

Kindle

蔵書数

12,158になりました。
昨年から1,295冊増加です。

実は今年「今年は衝動買いとかやめよう」と思い、クレジットカードでKindle本買うのやめました。
基本的にコンビニでアマギフ買ってチャージする感じ。

なのですが、あんま購入数変わっとらんやんけ。。。※昨年は1,366冊購入
無駄遣いは減っているはず。。。

Twitter

銃口の数

フォロワー:4,563 → 4,756

微増って感じです。

目標達成状況

  • Pyxel & 機械学習で何か作りたい
    →Pyxelでモノづくり系イベントの「つくろがや」参加しました
    この手のイベント出るのは超久々だったのですが、やっぱり楽しかったです👀 kazuhito00.hatenablog.com

  • 2024年は引きこもりだったので、イベント参加とか登壇とか増やしたい
    →微増です。
    本当は以下に加えて、Pycon mini Shizuokaにも登壇予定だったのですが、外せない用事が重なってしまい急遽キャンセルしました(スタッフ様にはご迷惑を。。。 kazuhito00.hatenablog.com kazuhito00.hatenablog.com kazuhito00.hatenablog.com

NGKとPycon miniに出没するオジサンと化している。。。👀

コロナを境に、見境なくアレやコレやの勉強会に行かなくなったのと、
コロナを境に、よくお世話になっていた勉強会(機械学習関連など)が休眠状態になっているのが重なってしまったのもありますが。

どんな年だったか?

約3年ぶりに所属チーム異動になり、キャッチアップとかちょいちょいバタバタした年でした。

自称レイトマジョリティですが、今年の後半に入って、
ようやくClaude Codeなどコーディングエージェントを(趣味開発で)気合を入れて使うようになりました。
(それまでは小さな機能追加・修正、サンプルコードの作成のみ)
→ 設計・実装を刷新して、Image-Processing-Node-EditorとAudio-Processing-Node-Editorを統合したアプリを、フルコーディングエージェント製で作っている ※冬休み中には初回リリースしたい

僕は、新しい技術に対して腰が重いところあるので、来年はもっとフットワーク軽く色々ためしたいですね。

アウトプットしたもの

LT

対外的なLTや登壇は2本ですね。
上述のNGKとPycon mini 東海。

GitHub

作成リポジトリの傾向は、今年も推論サンプルとかトレーニングサンプル、画像処理サンプルがメインで小さいものが多いです。

ちょっと気合入っているのは以下2点。

業務で久々にオーディオ系触ることがあり、検証などに使うためにノードエディターを作成。
※上述の統合版をリリース予定のため、年明けにはアーカイブされる予定 github.com
これは。最近の自分的知見を取り込んで、物体検出やクラス分類を作りたかったため作ったリポジトリ
github.com

Qiita

Qiitaは投稿5件でした。
今年もQiitaへの投稿は全てアドベントカレンダーの投稿ですね👀
OpenCVのアドカレを完走させたくて、ひねり出した系のやつもありますが。。。

qiita.com qiita.com qiita.com qiita.com qiita.com

Zenn

Zennは記事3件でした。
ふり返ってみると、あんまり投稿してねーな🤔

zenn.dev zenn.dev zenn.dev

その他

所属組織のNote1件👀
びみょーにアウトプットする機会のなかったプチ知見ですが、まあちょうど良かったかしら。 note.com

2026年は

LTとか登壇とか増やしていきたいですね(あれ?これ昨年も言った?)
NGK2026Sに採択されているので、参加される方は、愛知の大名古屋ビルヂングで僕と握手🤝
Pycon mini Shizuokaにも採択されているので、参加される方は、静岡市コ・クリエーションスペースで僕と握手🤝

2026年は、ひとまず以下のような感じ?

  • 今年、昨年腰が重かったコーディングエージェント系のキャッチアップ&トライをしっかりやりたい
  • イベント参加とか登壇とか増やしたい(個人的には技術書展トライしたい)

おわりに

2025年ありがとうございました。
2026年もよろしくお願いいたします🦔

Pythonで日本株の自動売買システムトレードに入門しました🦔

株のデイトレード自体は8年くらい前に手を出して、全然ダメダメだったので、それ以降は積立投資のみをやっていました。

システムトレード自体にも興味あったのですが「株を勉強する情熱ないしな。。。( ´ー`)y-~~」と思って手を付けていませんでした。
ふと、生成AIの力を借りれば何とかなるかも。と思い、入門してみました。

以下は今のところの成績です↓

・11/10週は利益は考えずに売り買いのAPIの本番動作確認(買って即売るなどの動作確認をしていた結果、マイナス610円の損失)
・11/17週は自動売買プログラムをClaudeとかGeminiとプログラミングして動作確認&デバッグ(損切でもないのにマイナスで売るとか、0円以上になったら売って手数料だけ取られるみたいな微妙なバグとか結構あり、この週はマイナス725円)
・11/25週は微調整しながらの運用(たまにガッツリ下落し続ける株をつかむなどの事故もありつつ、3700円の収益)

元本はへそくりから出した余剰資金の7万円で、現在7万2365円です🦔

このまま1日1000円くらいの利益が出続ければ、お小遣いが2万円くらい増えるのになー( ´ー`)y-~~
※今のアルゴリズムは下落相場とか来たら吹っ飛ぶ系なので、そんな甘くない

 

ちなみにソースコードは今のところ公開予定ないです👀
割と何でも公開している僕ですが、このプログラム使って僕以外の人が損失出すのは申し訳ないなー。という気持ちで(OSSは基本的に保証なしの世界とはいえ)

 

なので、使っているライブラリとか仕組みの雰囲気のみ記載します🦔

大まかな流れで言うと
1.【月1実行】JPXの東証上場銘柄一覧エクセルを元に、yfinanceパッケージで取引対象にしたい銘柄を抽出(株価とか出来高とか売買代金でフィルタして)
2.【週1実行】過去の流動性などを確認してデイトレード向きの銘柄を抽出
3.【5分毎実行】三菱UFJ eスマート証券の kabuステーションAPIを用いて、リアルタイム価格・板情報・余力・ポジションを取得
4.【5分毎実行】対象銘柄の 当日VWAPと乖離率を計算して、エントリー条件(乖離率-X%など)、エグジット条件(株価+X%上昇など)、リスク管理条件(当日損切銘柄は再エントリーしないなど)をチェックし、 指値・成行注文を発注

以上。

Sarashina2.2-Vision を Colaboratory でお試し🦔

Sarashina2.2-Visionを味見しています👀
SB Intuitionsが開発した日本語VLMで、Sarashina2-Visionの後継ですね。

Sarashina2と比べて日本語の理解力が上がっています🦔
3Bのわりに推論は思い気がしますが(L4 GPUで1分とか)

 

ちなみに2のときに同じ画像、プロンプトで質問したもの↓

 

今回試したノートブックは以下に公開しています。

github.com