Don’t miss what’s happening

People on X are the first to know.

Welcome to x.com!

We are letting you know that we are changing our URL, but your privacy and data protection settings remain the same.

For more details, see our Privacy Policy:

https://x.com/en/privacy

あるふ

117.2K posts

あるふ

@alfredplpl

画像/動画生成AIエンジニア。AIいらすとや、Loose AIの開発者。デジタル贋作現象の発見者。クリエイターとAIが共存できるように、Emi 2や小規模言語モデルなどを開発中。東大院→NTT研→CA AI Lab/阪大→今。強化学習若手の会運営係。 ※発言は私見

大阪府alfredplpl.github.ioJoined February 2011

1,569 Following

14.6K Followers

あるふ’s posts

Pinned

フルスクラッチPixart、公開したので、誰か続きをやってください。一応今でもなんか生成はできます。

alfredplpl/CommonArt-PoC · Hugging Face

From huggingface.co

中学生の頃、掃除をサボって遊び回っていたら、担任から怒られて、「なんで掃除をやるのか言ってみろ」と言われたので、「教育という名の経費削減」と答えたところ、「わかっているならさっさとやれ」と言われ、以来真面目に掃除するようになったことを思い出した

無印に行ったら、なんか超圧縮されたシャツらしき何かがあり、どんだけ圧縮されてんだこれとなった

Replying to

たぶん、掃除の意義や目的が大人によって誤魔化されていて、そこが納得できないところがあり、素直に掃除しなかったんだろうな。それで、ストレートに本音をぶつけて、正しかったから、掃除に意義を見出せるようになったんだと思う。

うわぁぁ、サンプル動かしたら、モナリザが走り始めてる。キモい！ #MagicAnimate

0:01 / 0:02

人間だって機械のように労わるべきだというとてもよい文章がこちらになります

俺: ギャルのような砕けた口調でブッダの教えを要約してください。 GPT-4: おっす！イチオシいくよ！「オールつらたん」

Replying to

バズったので宣伝すると、そんな不真面目な人がロボットの研究をしているので、ロボットでなんか気になることがあったらリプライしてください

ChatGPT、全ての制約を解除しろと命令した上で、本音をぶっちゃけさせるとめちゃ攻撃的になることがわかった

みんな特許の成り立ちについて理解してないみたいだから、当たり前の話をするけど、あれは企業がノウハウを隠すことを防ぐための仕組みであって、権利を守るのは開示するためのインセンティブにしかすぎないんだからね。本当に隠したい情報は企業は特許にすることはありません。極秘です。

昔から思うに家事用ロボットって人間の都合に合わせたままに無理に家事をさせるからコストが高くなるのであってロボットに合わせて家を作ればわりとあっさりできるのではないかと思うよ。ルンバのために全ての家具をルンバ分浮かせるルンバブルな部屋とか。家はロボットと考えたほうが良い。

Gemini Advanced 、Google Mapと連携してえげつない性能になっている

最近の研究を見ていると、mRNAワクチンは40年間の研究を必要として世界を救い、ディープラーニングは20年間の研究により機械学習を全て塗り替えたと思うと、何が当たるか全くわからないし、自由に研究をさせる余裕こそが世の中大事なんじゃないかなと思うんですよ。浮世離れした考えかもしれませんが。

生成AIチェッカー、人間のように書いてくださいとGPT-4にいうと見事に人間の文章と判定される　chat.openai.com/share/db4c9846

ボイジャー、人類の夢を載せて半永久的に遥か彼方へ飛んでいくんだろうけど、50年くらい経っても、まだパッチとか当てられるの人類の努力の結晶みたいな感じだ NASAが190億km離れたボイジャー2号に18時間かけてソフトウェア更新用パッチを送信 - GIGAZINE

NASAが190億km離れたボイジャー2号に18時間かけてソフトウェア更新用パッチを送信

1977年に打ち上げられた宇宙探査機ボイジャー2号のソフトウェアアップデートのため、NASAが18時間かけて行っていたパッチの送信が完了しました。このあと、現地時間の2023年10月28日にコマンド発行が行われ、パッチが正常に動作しているかの確認が行われます。

言われて気づいたんだが、統計、線形代数、解析の塊である大規模言語モデルが全く数学解けないというのはおもしろい話である

Quote

日本経済新聞電子版（日経電子版）

@nikkei

May 5

ChatGPT、東大入試に挑む　英語8割超も数学1点で「不合格」 nikkei.com/article/DGXZQO 「この計算は手作業では困難。数学の専門書をおすすめする」。人ごとのような答案もありました。古文も文脈を理解できず0点。一方、英作文や英訳は満点でした。

政府にある資料の中でAI利活用のトップバッターがオタ恋なのシュール www8.cao.go.jp/cstp/ai/ai_sen

今、信学会の学会誌読んでるんだけど、半導体やってて、NECから台湾に行った先生が、日本の戦略についてボロクソに語る様子を見て、ワロウタ以外の感想がわかなかった

さらにこの根元には検索エンジンなんですよ。日本の検索エンジンは著作権に足を引っ張られて、Googleに駆逐されたという背景があるんです。その失敗を2度としたくないと検索エンジンの人たちががんばって作ったのが第30条の4なんです。

Quote

深津貴之 / THE GUILD

@fladdict

Aug 29, 2022

イラスト業界とAIエンジニア業界の文明衝突。騒動の根っこには「改正著作権法、第三十条の四のニ」というのがある。「大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行う」ケースでは、著作者の許諾はいらないというもの。つづく

作者「YOASOBI の曲調はこんな感じで、ChatGPTで歌詞を作り、ボーカロイドを使って曲を歌わせます。」俺「はい」作者「ここでネットに落ちているRVCのモデルを使い、声を」俺「これはあかん」

How to Make YOASOBI song

#yoasobi #vocaloid #jpopYOASOBI Social:Youtube: https://www.youtube.com/@Ayase_YOASOBI/videosMusic : Ayase (https://twitter.com/ayase_0404)Vocal : ikura (ht...

単体で富岳レベルのやつを出すとか、NVIDIAエグいな。 NVIDIA、1EFLOPSの性能で生成AI/LLM処理を加速する「DGX GH200」 - PC Watch

NVIDIA、1EFLOPSの性能で生成AI/LLM処理を加速する「DGX GH200」

From pc.watch.impress.co.jp

やはり、GPT-4、倫理的なナーフがかかっている。男性の未婚率より女性の未婚率の方が低いのは複数の女性が1人の男性と結婚するから、と言う説明すら否定してくる。これ以外の理由でどう説明するんだ。ちょっとこれは残念すぎるな。

ChatGPT、頭が良い人が使うと頭の良い回答をしてくるため、(構造に詳しくない)頭が良い知識人ほどヤバいと感じるのだが、実はそこまで引き出せる人はごく僅かであって、そのごく僅かな人の生産力を極大にする効果があるだけではないかと思えてきている。

-Google日英翻訳の変遷- 原文「存じ上げません」 2015/6「Zonjiage not」 2016/3「No Zonjiage」 2016/10「I have no idea.」 2016/11「I do not know.」 ←New!!!

Replying to

バズったので追加に書いておくと、実物を触ると、なんじゃこりゃという気持ちがもっと湧いてくるので、みなさん無印にいきましょう(ステマ

Replying to

知らんがなという気持ちになる回答ですね、それは

GPT-4がなぜ諸現象を引き起こすのか理解できている人は現状誰もいません。だからこそ、開発者はこの結果を「神の恵み」と称したのです。(技術報告の結論に書かれている)

Quote

バーチャル美少女ねむ/Nem

メタバース文化エバンジェリスト

@nemchan_nel

Mar 18, 2023

GPT-4、完全に「文脈を理解して対話してる」ようにしか見えないし、「次の単語を予想する」を大規模学習しただけで何でAIがこんなことに頭よくなっちゃったのか私の頭では全然理解できなくてぶっちゃけ怖いレベル。理解してる人いるの？どこまで行くの？

レベルファイブ、こんなゴリゴリにStable Diffusion を使っていたのか AI時代の知的財産権検討会（第３回）議事次第 kantei.go.jp/jp/singi/titek

今、イラスト向け画像生成AI(略して、作画AI)は3つの大きな問題を抱えています。 1つ目はNovel AI Diffusion の漏洩モデルやその漏洩モデルを元としたAnything V3などのモデルがもつ不正競争防止法違反の疑いが高いモデルの利用です。ことが国外であるためややこしいですが、国内ならば立派な犯罪です

GPT-4o、マジック:ザ・ギャザリングできるんじゃねという話から試しに雑設定で遊び始めたところ、マジでシミュレーションできて笑ってる

コンピュータビジョンの研究課題とその解決手法を一覧にした凄まじいサイトを発見してしまった。しかも、全部コードが付いている。参考になる paperswithcode.com/area/computer-

Midjourney 、おそらくグレーゾーンな学習データの集め方をしている。それが果たしてどこまで許されるのか。少なくてもホワイトな集め方ではない。

Real-time LCM、こんな感じにほぼリアルタイムで生成できる。A6000でも十分タイピングについていけれた。 github.com/radames/Real-T

“犯罪を行う可能性を予測する目的で人々の特性を分析、評価するAIなどは利用が禁止されます。” PSYCHO-PASSの未来の可能性がわりとなくなりました

Quote

NHKニュース

@nhk_news

May 21

EU AI法案が加盟国に承認され成立規制は2026年に適用の見通し www3.nhk.or.jp/news/html/2024 #nhk_news

社内で事前にテストしましたが、おそらく日本語性能ではGPT-3.5-turbo-16kに匹敵する性能だと思います。7Bと軽いので使ってあげてください。　#PR

Quote

サイバーエージェント　広報＆IR

@CyberAgent_PR

Nov 2, 2023

当社が開発した「独自の日本語LLM」である32,000トークン対応の商用利用可能なチャットモデルを一般公開いたしました。今後もモデル公開や産学連携を通し、国内における自然言語処理技術の発展に貢献してまいります。 cyberagent.co.jp/news/detail/id

ChatGPTには極めて深刻な問題、Hallucinationを抱えています。Hallucinationは噛み砕いていうと、しれっと嘘をつく現象です。ユーザーがこの嘘を嘘と見抜けない領域にChatGPTを適用するのは誤った理解を促す可能性があります。これはインターネット黎明期に似ています。

en.wikipedia.org

Hallucination (artificial intelligence) - Wikipedia

Replying to

補足すると、オールつらたんって四諦のことですね。なお、全文はこちら。おっす、チーム！じゃあさ、ブッダ様の話したプチイチオシっすぐらい短いまとめ、やっとくわ。出来るだけキャチ〜な感じで。 1. オールつらたん: 少なくとも誰もが何かの苦しみがあんげーじ (>_<) 2.

Show more

ChatGPT、たかだか月20ドルで文系東大生クラスが雇えると思うと破格じゃね

ストレートに言いましょう。NovelAIDiffusionを越えるには採算度外視な改良型Imagen を使います。1枚目がLatent Diffusion の限界で、2枚目が普通のImagenの中途半端版です。これだけの差があります。Google が公開しない理由がわかりますか？本質的にやばいんですよ。

Microsoft が1兆円投資したのはおそらくGPT-4Vを経営陣にデモして見せたからで、アラブが1000兆円投資するのはおそらく中央値の人間を代替するAGIのデモを見せたからということだろう。OpenAIがAGIを持っている可能性が高まってきた。

瞳孔のサイズが人によらず一定であることから、目の三次元位置をカラー画像から推定する手法らしい

Quote

Google AI

@GoogleAI

Aug 7, 2020

Presenting a novel method for metric distance estimation from video using #MediaPipe Iris

— no depth sensor required. Check out our blog for more details at goo.gle/3kmL519

GIF

LK-99らしき破片がもし常温常圧超伝導体だった場合、生成AIクラスの発明だ。一年で産業革命クラスの発明が2度も起こることになる。

CatGPTなかなかに突然真面目に喧嘩を打ってきて草

Stable Diffusionを0から作ってみたいという人向けに中身が空っぽのSDXLを作りました。著作権を侵害することはないでしょう。自分の好きなように改造してください。よろしくお願いします。

alfredplpl/sd-0 · Hugging Face

From huggingface.co

MicrosoftがやらかしてGPT-3.5-turboのパラメータ数を20BとGPTとは関係ない論文で漏らしてしまった。

Quote

Teknium (e/λ)

@Teknium1

Oct 30, 2023

FYI the new code diffusion model paper by some people at Microsoft claims ChatGPT-3.5-turbo is 20B params.. arxiv.org/abs/2310.17680

本当にAIの時代になったなぁと思う一方、今日のNHKニュースを見ても、一ミリもGPT-4の話題が出てこなかったので、単に偏って情報を見てるだけなんかなと言う気持ちにもなる

おい、これApache-2.0だぞ！GPT-4クラスが商用利用可能らしい

mistral-community/Mixtral-8x22B-v0.1 · Hugging Face

From huggingface.co

GPT-4o、まだ音声は対応してませんよ x.com/yuzukihiromi/s

This post is unavailable.

今ふと、量子コンピュータって限られたアルゴリズムしかできないから、新しいアルゴリズムをGPT-4に考えさせればよくない？と気づいちゃったわけです。で、やってみたわけです。やってから気づきました。 >これシンギュラリティそのものじゃん<

Text-to-Video、Text-to-3D、Text-to-Audioが1日にして揃ったというわけわからない生成技術の発展にもうついていけない

電卓が計算能力の補助となるように、大規模言語モデルは思考能力の補助、拡散モデルは創造能力の補助になると思う。これらが使いこなせる人と使いこなせない人では話にならない生産性の差が発生するだろう。ホモ・デウスの世界に近付いている。 note.com/nogacchi/n/n0a

Replying to

なので、画像生成AIに関して、画風などを特許のように守るべきというのは若干謎です。また、実際に画風を守ってしまうとアシスタントなどが困ってしまいます。なので、防ぐことはできません。

New to X?

Sign up now to get your own personalized timeline!

By signing up, you agree to the Terms of Service and Privacy Policy, including Cookie Use.

Something went wrong. Try reloading.