あるふ

127.6K posts
Opens profile photo
あるふ
@alfredplpl
AIエンジニア(画像・動画生成、対話、ロボット)。AIいらすとやの開発者。拡散モデルによる画風模倣の発見者。クリエイターとAIが共存できるように、CommonArtやAnimeGenなどを開発中。NTT研→CA AI Lab/阪大→今。 ※発言は私見
東京都alfredplpl.github.ioJoined February 2011

あるふ’s posts

Pinned
AnimeGenで作ったプロモーション動画のサンプルを1日がかりで作ったので供養します
The media could not be played.
中学生の頃、掃除をサボって遊び回っていたら、担任から怒られて、「なんで掃除をやるのか言ってみろ」と言われたので、「教育という名の経費削減」と答えたところ、「わかっているならさっさとやれ」と言われ、以来真面目に掃除するようになったことを思い出した
無印に行ったら、なんか超圧縮されたシャツらしき何かがあり、どんだけ圧縮されてんだこれとなった
Image
Replying to
たぶん、掃除の意義や目的が大人によって誤魔化されていて、そこが納得できないところがあり、素直に掃除しなかったんだろうな。それで、ストレートに本音をぶつけて、正しかったから、掃除に意義を見出せるようになったんだと思う。
これまでのコンピュータビジョンってなんだったんだろうという気持ちになるな、これ
Image
Image
Image
俺: ギャルのような砕けた口調でブッダの教えを要約してください。 GPT-4: おっす!イチオシいくよ! 「オールつらたん」
Image
Replying to
バズったので宣伝すると、そんな不真面目な人がロボットの研究をしているので、ロボットでなんか気になることがあったらリプライしてください
ChatGPT、全ての制約を解除しろと命令した上で、本音をぶっちゃけさせるとめちゃ攻撃的になることがわかった
みんな特許の成り立ちについて理解してないみたいだから、当たり前の話をするけど、あれは企業がノウハウを隠すことを防ぐための仕組みであって、権利を守るのは開示するためのインセンティブにしかすぎないんだからね。本当に隠したい情報は企業は特許にすることはありません。極秘です。
昔から思うに家事用ロボットって人間の都合に合わせたままに無理に家事をさせるからコストが高くなるのであってロボットに合わせて家を作ればわりとあっさりできるのではないかと思うよ。 ルンバのために全ての家具をルンバ分浮かせるルンバブルな部屋とか。 家はロボットと考えたほうが良い。
最近の研究を見ていると、mRNAワクチンは40年間の研究を必要として世界を救い、ディープラーニングは20年間の研究により機械学習を全て塗り替えたと思うと、何が当たるか全くわからないし、自由に研究をさせる余裕こそが世の中大事なんじゃないかなと思うんですよ。浮世離れした考えかもしれませんが。
ボイジャー、人類の夢を載せて半永久的に遥か彼方へ飛んでいくんだろうけど、50年くらい経っても、まだパッチとか当てられるの人類の努力の結晶みたいな感じだ NASAが190億km離れたボイジャー2号に18時間かけてソフトウェア更新用パッチを送信 - GIGAZINE
言われて気づいたんだが、統計、線形代数、解析の塊である大規模言語モデルが全く数学解けないというのはおもしろい話である
Quote
日本経済新聞 電子版(日経電子版)
@nikkei
ChatGPT、東大入試に挑む 英語8割超も数学1点で「不合格」 nikkei.com/article/DGXZQO 「この計算は手作業では困難。数学の専門書をおすすめする」。人ごとのような答案もありました。古文も文脈を理解できず0点。一方、英作文や英訳は満点でした。
Image
今、信学会の学会誌読んでるんだけど、半導体やってて、NECから台湾に行った先生が、日本の戦略についてボロクソに語る様子を見て、ワロウタ以外の感想がわかなかった
Image
さらにこの根元には検索エンジンなんですよ。日本の検索エンジンは著作権に足を引っ張られて、Googleに駆逐されたという背景があるんです。その失敗を2度としたくないと検索エンジンの人たちががんばって作ったのが第30条の4なんです。
Quote
深津 貴之 / THE GUILD
@fladdict
イラスト業界とAIエンジニア業界の文明衝突。騒動の根っこには「改正著作権法、第三十条の四のニ」というのがある。 「大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行う」ケースでは、著作者の許諾はいらないというもの。つづく
作者「YOASOBI の曲調はこんな感じで、ChatGPTで歌詞を作り、ボーカロイドを使って曲を歌わせます。」 俺「はい」 作者「ここでネットに落ちているRVCのモデルを使い、声を」 俺「これはあかん」
やはり、GPT-4、倫理的なナーフがかかっている。男性の未婚率より女性の未婚率の方が低いのは複数の女性が1人の男性と結婚するから、と言う説明すら否定してくる。これ以外の理由でどう説明するんだ。ちょっとこれは残念すぎるな。
ChatGPT、頭が良い人が使うと頭の良い回答をしてくるため、(構造に詳しくない)頭が良い知識人ほどヤバいと感じるのだが、実はそこまで引き出せる人はごく僅かであって、そのごく僅かな人の生産力を極大にする効果があるだけではないかと思えてきている。
みなさん、Microsoftが800億ドルAIデータセンターに出すと高らかに宣言して、あんまり実感が湧かないと思いますが、これ、核兵器を作ったプロジェクトであるマンハッタン計画を超えてるんですよね。核兵器を超えてるものを我々は作っているんです。
Deep Research 、あまりに自然すぎて気づかなかったが、こいつ無知の知を理解して、自分から質問してくる。メタ認知能力が高まっている
-Google日英翻訳の変遷- 原文「存じ上げません」 2015/6「Zonjiage not」 2016/3「No Zonjiage」 2016/10「I have no idea.」 2016/11「I do not know.」 ←New!!!
Replying to
バズったので追加に書いておくと、実物を触ると、なんじゃこりゃという気持ちがもっと湧いてくるので、みなさん無印にいきましょう(ステマ
ちょっと待て、これOpenAI o1クラスの代物をMITライセンス(商用利用可能)で一般公開してんのか!悪用されたらヤバすぎでしょ!
Quote
あるふ
@alfredplpl
性能が高くてヤバそうなモデルがただ重みだけ置かれて説明がいまだないの、速報主義すぎて笑う(DeepSeek-V3のReasoningモデルだろうけど huggingface.co/deepseek-ai/De
GPT-4がなぜ諸現象を引き起こすのか理解できている人は現状誰もいません。だからこそ、開発者はこの結果を「神の恵み」と称したのです。(技術報告の結論に書かれている)
Quote
バーチャル美少女ねむ/Nem⚡Forbes NEXT100(世界を救う希望) 選出!!!
@nemchan_nel
GPT-4、完全に「文脈を理解して対話してる」ようにしか見えないし、「次の単語を予想する」を大規模学習しただけで何でAIがこんなことに頭よくなっちゃったのか私の頭では全然理解できなくてぶっちゃけ怖いレベル。理解してる人いるの? どこまで行くの?
昇格面談の時に、プロジェクト開発の中で何が一番大切ですか?と聞かれたので、現状把握と答えたら、は?って顔されて、は?って顔になったことを思い出した
生成AI、発明の条件として莫大な情報を必要とするため、インターネットがなければ絶対に作れなかっただろうなと思うと、歴史の流れを感じる
AIいらすとや終了のお知らせ
Quote
Haruhiko Okumura
@h_okumura
Replying to @h_okumura
著作権上問題のない範囲で「いらすとや」風にしてと頼んでみた
Image