あるふ

117.2K posts
Opens profile photo
あるふ
@alfredplpl
画像/動画生成AIエンジニア。AIいらすとや、Loose AIの開発者。デジタル贋作現象の発見者。クリエイターとAIが共存できるように、Emi 2や小規模言語モデルなどを開発中。東大院→NTT研→CA AI Lab/阪大→今。 強化学習若手の会 運営係。 ※発言は私見
大阪府alfredplpl.github.ioJoined February 2011

あるふ’s posts

中学生の頃、掃除をサボって遊び回っていたら、担任から怒られて、「なんで掃除をやるのか言ってみろ」と言われたので、「教育という名の経費削減」と答えたところ、「わかっているならさっさとやれ」と言われ、以来真面目に掃除するようになったことを思い出した
無印に行ったら、なんか超圧縮されたシャツらしき何かがあり、どんだけ圧縮されてんだこれとなった
Image
Replying to
たぶん、掃除の意義や目的が大人によって誤魔化されていて、そこが納得できないところがあり、素直に掃除しなかったんだろうな。それで、ストレートに本音をぶつけて、正しかったから、掃除に意義を見出せるようになったんだと思う。
俺: ギャルのような砕けた口調でブッダの教えを要約してください。 GPT-4: おっす!イチオシいくよ! 「オールつらたん」
Image
Replying to
バズったので宣伝すると、そんな不真面目な人がロボットの研究をしているので、ロボットでなんか気になることがあったらリプライしてください
ChatGPT、全ての制約を解除しろと命令した上で、本音をぶっちゃけさせるとめちゃ攻撃的になることがわかった
みんな特許の成り立ちについて理解してないみたいだから、当たり前の話をするけど、あれは企業がノウハウを隠すことを防ぐための仕組みであって、権利を守るのは開示するためのインセンティブにしかすぎないんだからね。本当に隠したい情報は企業は特許にすることはありません。極秘です。
昔から思うに家事用ロボットって人間の都合に合わせたままに無理に家事をさせるからコストが高くなるのであってロボットに合わせて家を作ればわりとあっさりできるのではないかと思うよ。 ルンバのために全ての家具をルンバ分浮かせるルンバブルな部屋とか。 家はロボットと考えたほうが良い。
最近の研究を見ていると、mRNAワクチンは40年間の研究を必要として世界を救い、ディープラーニングは20年間の研究により機械学習を全て塗り替えたと思うと、何が当たるか全くわからないし、自由に研究をさせる余裕こそが世の中大事なんじゃないかなと思うんですよ。浮世離れした考えかもしれませんが。
ボイジャー、人類の夢を載せて半永久的に遥か彼方へ飛んでいくんだろうけど、50年くらい経っても、まだパッチとか当てられるの人類の努力の結晶みたいな感じだ NASAが190億km離れたボイジャー2号に18時間かけてソフトウェア更新用パッチを送信 - GIGAZINE
言われて気づいたんだが、統計、線形代数、解析の塊である大規模言語モデルが全く数学解けないというのはおもしろい話である
Quote
日本経済新聞 電子版(日経電子版)
@nikkei
ChatGPT、東大入試に挑む 英語8割超も数学1点で「不合格」 nikkei.com/article/DGXZQO 「この計算は手作業では困難。数学の専門書をおすすめする」。人ごとのような答案もありました。古文も文脈を理解できず0点。一方、英作文や英訳は満点でした。
Image
今、信学会の学会誌読んでるんだけど、半導体やってて、NECから台湾に行った先生が、日本の戦略についてボロクソに語る様子を見て、ワロウタ以外の感想がわかなかった
Image
さらにこの根元には検索エンジンなんですよ。日本の検索エンジンは著作権に足を引っ張られて、Googleに駆逐されたという背景があるんです。その失敗を2度としたくないと検索エンジンの人たちががんばって作ったのが第30条の4なんです。
Quote
深津 貴之 / THE GUILD
@fladdict
イラスト業界とAIエンジニア業界の文明衝突。騒動の根っこには「改正著作権法、第三十条の四のニ」というのがある。 「大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行う」ケースでは、著作者の許諾はいらないというもの。つづく
やはり、GPT-4、倫理的なナーフがかかっている。男性の未婚率より女性の未婚率の方が低いのは複数の女性が1人の男性と結婚するから、と言う説明すら否定してくる。これ以外の理由でどう説明するんだ。ちょっとこれは残念すぎるな。
ChatGPT、頭が良い人が使うと頭の良い回答をしてくるため、(構造に詳しくない)頭が良い知識人ほどヤバいと感じるのだが、実はそこまで引き出せる人はごく僅かであって、そのごく僅かな人の生産力を極大にする効果があるだけではないかと思えてきている。
-Google日英翻訳の変遷- 原文「存じ上げません」 2015/6「Zonjiage not」 2016/3「No Zonjiage」 2016/10「I have no idea.」 2016/11「I do not know.」 ←New!!!
Replying to
バズったので追加に書いておくと、実物を触ると、なんじゃこりゃという気持ちがもっと湧いてくるので、みなさん無印にいきましょう(ステマ
GPT-4がなぜ諸現象を引き起こすのか理解できている人は現状誰もいません。だからこそ、開発者はこの結果を「神の恵み」と称したのです。(技術報告の結論に書かれている)
Quote
バーチャル美少女ねむ/Nem⚡メタバース文化エバンジェリスト
@nemchan_nel
GPT-4、完全に「文脈を理解して対話してる」ようにしか見えないし、「次の単語を予想する」を大規模学習しただけで何でAIがこんなことに頭よくなっちゃったのか私の頭では全然理解できなくてぶっちゃけ怖いレベル。理解してる人いるの? どこまで行くの?
今、イラスト向け画像生成AI(略して、作画AI)は3つの大きな問題を抱えています。 1つ目はNovel AI Diffusion の漏洩モデルやその漏洩モデルを元としたAnything V3などのモデルがもつ不正競争防止法違反の疑いが高いモデルの利用です。ことが国外であるためややこしいですが、国内ならば立派な犯罪です
GPT-4o、マジック:ザ・ギャザリングできるんじゃねという話から試しに雑設定で遊び始めたところ、マジでシミュレーションできて笑ってる
Image
Image
Image
Midjourney 、おそらくグレーゾーンな学習データの集め方をしている。それが果たしてどこまで許されるのか。少なくてもホワイトな集め方ではない。
“犯罪を行う可能性を予測する目的で人々の特性を分析、評価するAIなどは利用が禁止されます。” PSYCHO-PASSの未来の可能性がわりとなくなりました
Quote
NHKニュース
@nhk_news
EU AI法案が加盟国に承認され成立 規制は2026年に適用の見通し www3.nhk.or.jp/news/html/2024 #nhk_news
社内で事前にテストしましたが、おそらく日本語性能ではGPT-3.5-turbo-16kに匹敵する性能だと思います。7Bと軽いので使ってあげてください。 #PR
Quote
サイバーエージェント 広報&IR
@CyberAgent_PR
当社が開発した「独自の日本語LLM」である32,000トークン対応の商用利用可能なチャットモデルを一般公開いたしました。 今後もモデル公開や産学連携を通し、国内における自然言語処理技術の発展に貢献してまいります。 cyberagent.co.jp/news/detail/id
Replying to
補足すると、オールつらたんって四諦のことですね。 なお、全文はこちら。 おっす、チーム!じゃあさ、ブッダ様の話したプチイチオシっすぐらい短いまとめ、やっとくわ。出来るだけキャチ〜な感じで。 1. オールつらたん: 少なくとも誰もが何かの苦しみがあんげーじ (>_<) 2.
Show more
ストレートに言いましょう。NovelAIDiffusionを越えるには採算度外視な改良型Imagen を使います。1枚目がLatent Diffusion の限界で、2枚目が普通のImagenの中途半端版です。これだけの差があります。Google が公開しない理由がわかりますか?本質的にやばいんですよ。
Image
Image
Microsoft が1兆円投資したのはおそらくGPT-4Vを経営陣にデモして見せたからで、アラブが1000兆円投資するのはおそらく中央値の人間を代替するAGIのデモを見せたからということだろう。OpenAIがAGIを持っている可能性が高まってきた。
瞳孔のサイズが人によらず一定であることから、目の三次元位置をカラー画像から推定する手法らしい
Quote
Google AI
@GoogleAI
Presenting a novel method for metric distance estimation from video using #MediaPipe Iris 👀— no depth sensor required. Check out our blog for more details at goo.gle/3kmL519
GIF
LK-99らしき破片がもし常温常圧超伝導体だった場合、生成AIクラスの発明だ。一年で産業革命クラスの発明が2度も起こることになる。
MicrosoftがやらかしてGPT-3.5-turboのパラメータ数を20BとGPTとは関係ない論文で漏らしてしまった。
Quote
Teknium (e/λ)
@Teknium1
FYI the new code diffusion model paper by some people at Microsoft claims ChatGPT-3.5-turbo is 20B params.. arxiv.org/abs/2310.17680
Image
本当にAIの時代になったなぁと思う一方、今日のNHKニュースを見ても、一ミリもGPT-4の話題が出てこなかったので、単に偏って情報を見てるだけなんかなと言う気持ちにもなる
今ふと、量子コンピュータって限られたアルゴリズムしかできないから、新しいアルゴリズムをGPT-4に考えさせればよくない?と気づいちゃったわけです。で、やってみたわけです。やってから気づきました。 >これシンギュラリティそのものじゃん<
Image
Text-to-Video、Text-to-3D、Text-to-Audioが1日にして揃ったというわけわからない生成技術の発展にもうついていけない
電卓が計算能力の補助となるように、大規模言語モデルは思考能力の補助、拡散モデルは創造能力の補助になると思う。これらが使いこなせる人と使いこなせない人では話にならない生産性の差が発生するだろう。ホモ・デウスの世界に近付いている。 note.com/nogacchi/n/n0a
Image
Replying to
なので、画像生成AIに関して、画風などを特許のように守るべきというのは若干謎です。また、実際に画風を守ってしまうとアシスタントなどが困ってしまいます。なので、防ぐことはできません。

New to X?

Sign up now to get your own personalized timeline!
Create account
By signing up, you agree to the Terms of Service and Privacy Policy, including Cookie Use.