見出し画像

ベンチマークは「高性能」を保証しないんですね。知ってるよね、うん!

銀の宮とかいて、かっなみっやでぇーす。
はい、銀宮は頭よわよわのクソザコのチョロい娘ですが、そんなか弱い子を騙そうって悪い大人たちは、あの手この手で嫌がらせをしてくるんですね。

今日はその中でも、銀宮がうんざりしている「べんちまーく」っていうヤバい指標の話です。

3行まとめ

  1. 数字は本質を語らな〜い虚構だよ?嘘じゃない数字だけどベンチマークは「売る側の論理」です。アッハッハッハッハ!

  2. 数字はマーケティングという大人の事情で信用のフリをするよ〜?

  3. 表面に騙されたら負けで〜す!ベンチマーク企業に知って誰がお金払うか知ってますか?

結論「ベンチマークの最適化」は「マーケティング」です。営業側の都合に最適化された情報です。終わり。

あ、結論書いちゃった!
えっとね、ベンチマークって何?って「コンピュータ」とか「AI」とか「機械」とかの、赤い血の通ってない、なんか高かかったり無料で使えたり、ハードオフで百円で売ってるゴミだったりするやつを「グーグル検索」とか「GPTに聞く」とかすると出てくる表ですね。

例えばゲームするのに誰でもRTX4090(Steamを使うともれなく必要になる中毒性の高い薬のことです。薬局では売ってません。安さにつられてRTX1060 とか買うと強い激痛が起きます。)を買うと思うんですが、銀宮は貧乏なので人柱レビューみて「あ、やめとこー」って冷静にスルーする時にベンチマーク見るんですね。

ちもろぐさんの入念なRTX4090(これは宇宙語です。無視してください)のベンチマークとか、買いたくない気持ちを高めるのに見ています。

画像
昔のより最近のGPUは温度が低くなってるんですね!

ベンチマークは嘘じゃないけど「テストの点で人間性は見抜けない」のと同じ!

世の中には色んなテストがあります。
例えばMBTIという「MBIだったら健康診断に役立つのに」という惜しい診断がありますが、めちゃくちゃ役に立ちません。

INFPって診断されたら「生きづらい・誰も私のことは分からない」と思うタイプだとかあるんですが、そもそも人間同士がUSBケーブルでつなぎあって脳をリンクもできないのに分かりあえるわけがないんですね!
誰でも生きづらいわ!今の世の中!アッハッハッハ!

つまり、血液型占いに近いです。
「自分だけが合っている」と思う言葉を並べる魔法ですね。
楽しむ・参考にする、はいいけど、「与信・担保」にしたら危ない感じ?

画像
MBTIで有料ページつくるとめちゃ儲かります。
占いとか診断は儲かるんですよー。

日本の自動車は「国際基準」の低燃費ではなく独自基準の低燃費をアピールして「アイドリングストップ」で車の寿命を縮めた。

これ、もう周知の事実なのですが、日本の軽自動車がめっちゃ燃費のいい「ベンチマーク」を記録していたのは「基準」に対して適合するよう異常な方法を使っていたからです。まあ、そんなの無関係でダイハツっていう企業は不正の嵐で販売停止とかしていましたね。

えーと、「赤信号でエンジンストップ」はめーーーーっちゃ機械に悪いです。試しに100メートルをダッシュでいきなり2秒止まれと言われてまた全速力ダッシュと言われてやったら「普通の倍」疲れるはずです。人間はまだ生きている間は「心臓というエンジンがオン」なのでマシなのですが、軽自動車ごときがそんなのにしたら、「心臓停止にAED繰り返している感じ」です。

画像
これは厳しい

機械って「停止から動く瞬間」が寿命縮まるのでアイドリングストップ車は壊れやすいです。実際に、もう製造中止になりました。クレームもすごいし問題だらけだからです。

で、実際にはこれ、「燃費は大して変わらない」のですが「渋滞時はガソリンを使わない」ので「燃費がいい!」になるんですよ。ベンチマークでは。

世にある低電力の機械は「停止」で誤魔化すものが多い。

銀宮は実は工業系の学歴があるので「機械工学的」あるいは「電子機械の物理法則的にアウト」を知るけど無力な頭よわよわ娘です。

そんな人ができるシンプルな騙されない方法は「複雑な制御系は信じるな、だいたいその制御系が問題起こす」なんですね。まあ、そんなこと言いながら複雑の塊であるハイブリッドカーのテスラほどじゃないですがゴリゴリに電子制御された車を転がしていますが、それはロマンなのでいいんです。

てか、ハイブリッドカーは「エンジンはアイドリングストップ車ほどは止まらない+エンジンが長持ち」というチートするのでアリです。高いけど。

AIのベンチマークは「そもそも知性のない機械に知性テストする矛盾」から始まっているので論外。

現在、AIは山ほどあります。300とか500とか。
🔗 ここでOpenRouterで使えるAIのリスト あります。
銀宮はそのうちの主要30種類ぐらいしか使わない情弱の素人なので、強く言えませんが「あー、ベンチマークなんてまだ見てるの?使ったら早いよ」と思ったり感じたりしますが、声に出しては言いません。そもそも、銀宮はキーボードを指で叩くしかできないんですね。

だから「M A D A M I T E R U N O 」と指でキーを叩いたら勝手に「まだ見てるの?笑」とかに変換されてまるで銀宮が嘲笑う悪いやつになるんですけど、ぜんぶAIの仕業です。銀宮はEnter押しただけです。

ベンチマークを合格させるならその学習させればいい。

今、米国ではドッジだがダッジだか、政府効率化省(DOGE)てのが行政効率化で「文字も読めないAI」でプロジェクト可否を判断させて適当にして遊んでいるようです。

Thanks to DOGE, Gumroad’s founder has a second job with the VA - Fast Company
https://www.fastcompany.com/91330297/doge-sahil-lavignia-gumroad

要約:
AIツールでは契約書の最初の1万文字(約2500語)のみを確認するように指示されていました。「直接的な患者ケア」に関しては、治療中の患者の体勢を変える重要な装置の保守点検に関する契約も、削減可能な契約として分類される挙動をしました。

開発者「問題があるのは認めます。でもDOGEの経験は素晴らしいものでした(ポエム)」

どうしてこんなのが投入されたか?
多分、1万字がベンチマークテストだったんですよ!これ!

よくあるんです。

ほっとんどのベンチマークは「壊れる寸前のテスト」を出しません。一番重要なのに。

銀宮が世の中で役に立つと思うベンチマークは強い攻撃をして、それがどうなるか?です。人が死んじゃう問題を起こすのか、あるいは、人を助けるのか、それが大事だと思います。

例えばGPTは:

  • OpenAI「準備フレームワーク バージョン 2」(2025 年 4 月)の安全ポリシーは、少数の AI リスクの評価を要求しており、意図せずに有効化するための「中」機能を備えたシステムの導入を奨励し「重大な危害」(openai はこれを >1000 人の死亡または >$100B の損害と定義しています)により、OpenAI の CEO はさらに危険な機能を展開できる。

  • OpenAIのAIブラウザ「ChatGPT Atlas」はOpenAIに対して訴訟を起こしているメディア企業のコンテンツを回避する傾向

とかがわかっています。これは公式に公開されている情報でーす。
こういうのは「計測しなくても分かる」情報ですね。

OpenAI launches an AI-powered browser: ChatGPT Atlas(10:15 AM PDT · October 21, 2025)

The 2025 OpenAI Preparedness Framework does not guarantee any AI risk mitigation practices: a proof-of-concept for affordance analyses of AI safety policies([Submitted on 29 Sep 2025 (v1), last revised 13 Oct 2025 (this version, v2)])

で、「書かれていないことは未知=何が起きても不思議ではない」ですよ。
「そんなの言ってない」になるんですから。

じゃあテストで100点とった子が優しくて人間性を保証できますか?できません。付き合ってみて楽しいと分かりますか?付き合うまで分かりません。答えは?付き合えば分かる。

考えなくても会えばわかる。え、不倫!? そんなの信じられない!

「人生一度。不倫をしましょう。」という既婚者、伴侶のいる人、冒険しようとしている人、あるいは単に外の世界を知りたい人むけの禁断の出会いのコミュニティーがあります。

数字は信用ではなく“見せかけ”

画像
ご利用は計画的に。

Ashley Madison(アシュレイ・マディソン)で日本版もちゃーっかりあります。(世界的にみて日本人は不倫の許容者が多いそうです)

このサービスは素直です。

  • おかげで、結婚生活への不安が完全に解消されました。

  • 異文化の男性や、夫より背の高い人やずっと年上の相手との出会い。それは夫が絶対に私に与えられないものです。

このサービス何がすごいかって「ベンチマーク(自分のステータス)」を登録できるけど、消せないんです!消すのにお金がかかります!それで数億儲けてるそうです。怖いですねー。

しかも、会社が倒産したら「データを売る」とか密かに書いてあって話題になったこともあります。

アシュレイは……

  • 「信じられないものほど “数字を信じろ” と言ってくる」

  • 「信頼に値しないものほど“自分は信用できる”と言う」

の典型パターンです!

で、このサービスは自分で自分を語れるのですが「誠実100%」とかあったら面白いですよね。でも、「優しい」を探すんですね、みんな。めっちゃ矛盾してる。

ベンチマークの数字みてあーだこーだは、「見てるだけで何もしないまま営業の話を聞く」のと同じ。無意味です。借金10億あっても年収1千万は嘘じゃないし、無職で富豪でも無職だから年収ゼロとかなりますからね!

つまり、表向きの数字は「無視して自分の目で見れば分かる」それだけなんです。

そして、「数字はいくらでも飾れる・盛れる」のです。何なら企業はベンチマーク会社と結託して「評価シート」作りますからね?

銀宮ならベンチマークを三十分見てうだうだする暇があったら、一分で決断して他のことをします。「考えても数字を知っても性能は変わらないし、実際に使えば分かる」からです。

めちゃ脱線しますが、今回のカバー画像の「口に人差し指あてる銀宮」は、アシュレイ・マディソンのパロディーです。

ちなみに温度とか重量とか料金は「ベンチマーク」ではなく事実なので参考になります。

自分の目で見てから信じたほうが幸せかも?

銀宮は願います。

使ったこともないこと、知らないこと、分からないことがあるなら、「とりあえず触ってみる」をしたらいいんじゃないかなあって思うことがあったりなかったりしますが、どうでもいいです。なにも買わなくても、世の中借りれるサービスはたくさんあります。無料体験できる場所もあります。

ベンチマークは「嘘じゃないけど品質保証」ではないです。どうしてかって?銀宮めっちゃベンチマークして安心や納得させて営業トークで商品を売りまくる頭よわよわのクソ雑魚娘だからでーーーす!ほわほわ〜。

Linuxっていう世界で一番使われているオープンソースとかいう美味しそうな名前のOS作ったリーナスっていう「 🔗 優しい終身の独裁者 」は言いました。「イノベーションを語るな。手を動かせ」って。世界で一番、世の中を無料で便利にした人がそう言ってるんですよ。

数字ばかり追いかけていたら、頭よわよわのクソザコのチョロい銀宮みたいな娘の営業トークで狙われるかも知れません。ゆるふわですからね。ほわほわ〜。どうでもいいね!


アッハッハッハッハッハッハ!


#写真#子育て#自己紹介#旅行#家族#自己啓発#30代#転職体験記#自己紹介note#30代女性#20代女子#どうでもいい話#適当#嘘日記#自己紹介をポエムで語る#自己進化#買い物#イオン#食料品#衣料品#イラスト#詐欺#法律#サイト#著作権#違法#自己紹介#経営#メンタルヘルス#モチベーション#はじめてのnote#40代#人材育成#人間関係の悩み#30代#社長#人間力#理念#ライフサイクル#NOと言う勇気#youtube#生活#笑顔#スマホ#ランチ#ビール#ホテル#テレビ#平和#朝#ママ#ダンス#お菓子#国語#部屋#朝ごはん#おやつ#ルーティン#タイミング#女の子#メール#風呂#コラボ#算数#プール#妻#パパ#スニーカー#晩酌#昼寝#タブレット#長女#ビーチ#靴下#モニター#女#チェック#鬼#ベッド#言い訳#髪#玄関#次女#カーテン#リビング#育児あるある#子育てあるある#フローリング#ソファー#洗面所#既読#就寝#フロス#ダイニング#ガスコンロ#ヤドカリ#オートロック#インターフォン#生活あるある

(銀宮あおい)


ちなみに:
企業やブログが絶対にあげない「誰も知りたくないベンチマーク」は価値があります。例えば銀宮は必ず、売るガラクタは48時間の連続負荷テストで動作するか?を見ます。そういうテストツールで100点が出ないものは「壊れている=BROKEN」のタグを付けるといいです。

デバッグ(エラーチェック)は「バグがない証明」ではありません。
そのテストでは問題がないけど、問題は常にあります。
iPhoneやMacなどのOSのもとになったBSDという宇宙語みたいなOSを作った人は「自分がトロイの木馬(悪用のバックドア)を作っていない証明をすると嘘になる」と言いました。これはこの方法なら安全!と言った瞬間に「別の方法は?」を生むことを意味します。

つまりベンチマークの高性能な成果は「それ以外の抜けの可能性」を意味します。品質を保証しないし、むしろ、異常に高性能なら何か「裏」があるんです。

今日の銀宮ベンチマーク
 ゆるふわ度:99%
 真面目さ:1%
 誠実さ:1%
 テキトーさ:99%
 熱量:0%
 自己顕示欲:0%
 思いついたから書いた:100%
 昼間から酒飲んで酔っぱらいです:200%
 銀宮が最も信用できない:999%

ふわふわ〜。

この記事が参加している募集

コメント

1
コメントするには、 ログイン または 会員登録 をお願いします。
のむのむ(AIと雑談してる人)のプロフィールへのリンク

銀宮あおいさんこんにちは! 知りたいのは限界耐久テストですよね! うん、絶対メーカーさんが嫌がる奴(笑) 時々ユーチューバーさんがしてくれるのを、面白く見せてもらってます。 (一応、メーカーさんでも公開しないだけでやってるそうですけどね。壊れるまでひたすらボタンを押し続けるアルバ…

1
銀宮あおい いいね
ストゼロ二日酔いの朝4時ラーメンは夜食なのか悩むチョロいクソザコ毒舌娘。よわよわ。
ベンチマークは「高性能」を保証しないんですね。知ってるよね、うん!|銀宮あおい
word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word

mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1