あるふ

127.6K posts

あるふ

@alfredplpl

AIエンジニア(画像・動画生成、対話、ロボット)。AIいらすとやの開発者。拡散モデルによる画風模倣の発見者。クリエイターとAIが共存できるように、CommonArtやAnimeGenなどを開発中。NTT研→CA AI Lab/阪大→今。 ※発言は私見

東京都alfredplpl.github.ioJoined February 2011

1,668 Following

16.8K Followers

あるふ’s posts

Pinned

AnimeGenで作ったプロモーション動画のサンプルを1日がかりで作ったので供養します

The media could not be played.

中学生の頃、掃除をサボって遊び回っていたら、担任から怒られて、「なんで掃除をやるのか言ってみろ」と言われたので、「教育という名の経費削減」と答えたところ、「わかっているならさっさとやれ」と言われ、以来真面目に掃除するようになったことを思い出した

無印に行ったら、なんか超圧縮されたシャツらしき何かがあり、どんだけ圧縮されてんだこれとなった

Replying to

たぶん、掃除の意義や目的が大人によって誤魔化されていて、そこが納得できないところがあり、素直に掃除しなかったんだろうな。それで、ストレートに本音をぶつけて、正しかったから、掃除に意義を見出せるようになったんだと思う。

これまでのコンピュータビジョンってなんだったんだろうという気持ちになるな、これ

うわぁぁ、サンプル動かしたら、モナリザが走り始めてる。キモい！ #MagicAnimate

0:01

人間だって機械のように労わるべきだというとてもよい文章がこちらになります

俺: ギャルのような砕けた口調でブッダの教えを要約してください。 GPT-4: おっす！イチオシいくよ！「オールつらたん」

Replying to

バズったので宣伝すると、そんな不真面目な人がロボットの研究をしているので、ロボットでなんか気になることがあったらリプライしてください

ChatGPT、全ての制約を解除しろと命令した上で、本音をぶっちゃけさせるとめちゃ攻撃的になることがわかった

o3に斜め上の発想をさせたら斜め上の回答が返ってきた

みんな特許の成り立ちについて理解してないみたいだから、当たり前の話をするけど、あれは企業がノウハウを隠すことを防ぐための仕組みであって、権利を守るのは開示するためのインセンティブにしかすぎないんだからね。本当に隠したい情報は企業は特許にすることはありません。極秘です。

昔から思うに家事用ロボットって人間の都合に合わせたままに無理に家事をさせるからコストが高くなるのであってロボットに合わせて家を作ればわりとあっさりできるのではないかと思うよ。ルンバのために全ての家具をルンバ分浮かせるルンバブルな部屋とか。家はロボットと考えたほうが良い。

Gemini Advanced 、Google Mapと連携してえげつない性能になっている

最近の研究を見ていると、mRNAワクチンは40年間の研究を必要として世界を救い、ディープラーニングは20年間の研究により機械学習を全て塗り替えたと思うと、何が当たるか全くわからないし、自由に研究をさせる余裕こそが世の中大事なんじゃないかなと思うんですよ。浮世離れした考えかもしれませんが。

生成AIチェッカー、人間のように書いてくださいとGPT-4にいうと見事に人間の文章と判定される　chat.openai.com/share/db4c9846

ボイジャー、人類の夢を載せて半永久的に遥か彼方へ飛んでいくんだろうけど、50年くらい経っても、まだパッチとか当てられるの人類の努力の結晶みたいな感じだ NASAが190億km離れたボイジャー2号に18時間かけてソフトウェア更新用パッチを送信 - GIGAZINE

NASAが190億km離れたボイジャー2号に18時間かけてソフトウェア更新用パッチを送信

1977年に打ち上げられた宇宙探査機ボイジャー2号のソフトウェアアップデートのため、NASAが18時間かけて行っていたパッチの送信が完了しました。このあと、現地時間の2023年10月28日にコマンド発行が行われ、パッチが正常に動作しているかの確認が行われます。

言われて気づいたんだが、統計、線形代数、解析の塊である大規模言語モデルが全く数学解けないというのはおもしろい話である

Quote

日本経済新聞電子版（日経電子版）

@nikkei

May 5, 2024

ChatGPT、東大入試に挑む　英語8割超も数学1点で「不合格」 nikkei.com/article/DGXZQO 「この計算は手作業では困難。数学の専門書をおすすめする」。人ごとのような答案もありました。古文も文脈を理解できず0点。一方、英作文や英訳は満点でした。

政府にある資料の中でAI利活用のトップバッターがオタ恋なのシュール www8.cao.go.jp/cstp/ai/ai_sen

今、信学会の学会誌読んでるんだけど、半導体やってて、NECから台湾に行った先生が、日本の戦略についてボロクソに語る様子を見て、ワロウタ以外の感想がわかなかった

さらにこの根元には検索エンジンなんですよ。日本の検索エンジンは著作権に足を引っ張られて、Googleに駆逐されたという背景があるんです。その失敗を2度としたくないと検索エンジンの人たちががんばって作ったのが第30条の4なんです。

Quote

深津貴之 / THE GUILD

@fladdict

Aug 29, 2022

イラスト業界とAIエンジニア業界の文明衝突。騒動の根っこには「改正著作権法、第三十条の四のニ」というのがある。「大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行う」ケースでは、著作者の許諾はいらないというもの。つづく

生成AIによって得意なことが陳腐化するということはつまりこういうことだということを理解すべきだと思うよ、世の中の人たち a.co/9PyT4Xh

ちなみにトヨタは労組の影響を外すために、Wovenという会社を別に作って数千万円オーダーでエンジニアをすでに雇っています x.com/MahoneTrading/

This post is unavailable.

作者「YOASOBI の曲調はこんな感じで、ChatGPTで歌詞を作り、ボーカロイドを使って曲を歌わせます。」俺「はい」作者「ここでネットに落ちているRVCのモデルを使い、声を」俺「これはあかん」

How to Make YOASOBI song

#yoasobi #vocaloid #jpopYOASOBI Social:Youtube: https://www.youtube.com/@Ayase_YOASOBI/videosMusic : Ayase (https://twitter.com/ayase_0404)Vocal : ikura (ht...

単体で富岳レベルのやつを出すとか、NVIDIAエグいな。 NVIDIA、1EFLOPSの性能で生成AI/LLM処理を加速する「DGX GH200」 - PC Watch

NVIDIA、1EFLOPSの性能で生成AI/LLM処理を加速する「DGX GH200」

From pc.watch.impress.co.jp

やはり、GPT-4、倫理的なナーフがかかっている。男性の未婚率より女性の未婚率の方が低いのは複数の女性が1人の男性と結婚するから、と言う説明すら否定してくる。これ以外の理由でどう説明するんだ。ちょっとこれは残念すぎるな。

ChatGPT、頭が良い人が使うと頭の良い回答をしてくるため、(構造に詳しくない)頭が良い知識人ほどヤバいと感じるのだが、実はそこまで引き出せる人はごく僅かであって、そのごく僅かな人の生産力を極大にする効果があるだけではないかと思えてきている。

みなさん、Microsoftが800億ドルAIデータセンターに出すと高らかに宣言して、あんまり実感が湧かないと思いますが、これ、核兵器を作ったプロジェクトであるマンハッタン計画を超えてるんですよね。核兵器を超えてるものを我々は作っているんです。

Deep Research 、あまりに自然すぎて気づかなかったが、こいつ無知の知を理解して、自分から質問してくる。メタ認知能力が高まっている

-Google日英翻訳の変遷- 原文「存じ上げません」 2015/6「Zonjiage not」 2016/3「No Zonjiage」 2016/10「I have no idea.」 2016/11「I do not know.」 ←New!!!

Replying to

バズったので追加に書いておくと、実物を触ると、なんじゃこりゃという気持ちがもっと湧いてくるので、みなさん無印にいきましょう(ステマ

うわ、2枚使うと、ControlNetっぽいのがZero shotでできる。GPT-4o意味わかんねえ

ちょっと待て、これOpenAI o1クラスの代物をMITライセンス(商用利用可能)で一般公開してんのか！悪用されたらヤバすぎでしょ！

Quote

あるふ

@alfredplpl

Jan 20

性能が高くてヤバそうなモデルがただ重みだけ置かれて説明がいまだないの、速報主義すぎて笑う(DeepSeek-V3のReasoningモデルだろうけど huggingface.co/deepseek-ai/De

Replying to

知らんがなという気持ちになる回答ですね、それは

GPT-4がなぜ諸現象を引き起こすのか理解できている人は現状誰もいません。だからこそ、開発者はこの結果を「神の恵み」と称したのです。(技術報告の結論に書かれている)

Quote

バーチャル美少女ねむ/Nem

Forbes NEXT100(世界を救う希望) 選出!!!

@nemchan_nel

Mar 18, 2023

GPT-4、完全に「文脈を理解して対話してる」ようにしか見えないし、「次の単語を予想する」を大規模学習しただけで何でAIがこんなことに頭よくなっちゃったのか私の頭では全然理解できなくてぶっちゃけ怖いレベル。理解してる人いるの？どこまで行くの？

昇格面談の時に、プロジェクト開発の中で何が一番大切ですか？と聞かれたので、現状把握と答えたら、は？って顔されて、は？って顔になったことを思い出した

生成AI、発明の条件として莫大な情報を必要とするため、インターネットがなければ絶対に作れなかっただろうなと思うと、歴史の流れを感じる

AIいらすとや終了のお知らせ

Quote

Haruhiko Okumura

@h_okumura

Mar 26

Replying to @h_okumura

著作権上問題のない範囲で「いらすとや」風にしてと頼んでみた