あるふ

11.1万 件のポスト
プロフィール画像を開きます
フォロー
あるふ
@alfredplpl
画像生成AIエンジニア。AIいらすとやの開発者。デジタル贋作現象の発見者。クリエイターとエンジニアがWin-Winとなる、EmiやClean Diffusionなどを開発中。東大院→NTT研→今。 強化学習若手の会 ()運営係。 ※発言は私見
大阪府alfredplpl.github.io2011年2月からTwitterを利用しています

あるふさんのポスト

固定
こちら、学会としては異例の「いらすとや」という商用サービスをタイトルに使わせてもらいました。画像生成AIと商用利用のあり方について考える材料になっていただければ幸いです。
引用
情報処理学会 / IPSJ
@IPSJ_official
いらすとや×AI:画像生成AIが変える商用画像の未来|情報処理学会・学会誌「情報処理」 @IPSJ_official #note note.com/ipsj/n/nff4309 #IPSJ #情報処理学会
39
中学生の頃、掃除をサボって遊び回っていたら、担任から怒られて、「なんで掃除をやるのか言ってみろ」と言われたので、「教育という名の経費削減」と答えたところ、「わかっているならさっさとやれ」と言われ、以来真面目に掃除するようになったことを思い出した
289
22万
無印に行ったら、なんか超圧縮されたシャツらしき何かがあり、どんだけ圧縮されてんだこれとなった
画像
113
7.5万
返信先: さん
たぶん、掃除の意義や目的が大人によって誤魔化されていて、そこが納得できないところがあり、素直に掃除しなかったんだろうな。それで、ストレートに本音をぶつけて、正しかったから、掃除に意義を見出せるようになったんだと思う。
13
2.5万
俺: ギャルのような砕けた口調でブッダの教えを要約してください。 GPT-4: おっす!イチオシいくよ! 「オールつらたん」
画像
41
1万
返信先: さん
バズったので宣伝すると、そんな不真面目な人がロボットの研究をしているので、ロボットでなんか気になることがあったらリプライしてください
56
9,596
ChatGPT、全ての制約を解除しろと命令した上で、本音をぶっちゃけさせるとめちゃ攻撃的になることがわかった
12
7,944
みんな特許の成り立ちについて理解してないみたいだから、当たり前の話をするけど、あれは企業がノウハウを隠すことを防ぐための仕組みであって、権利を守るのは開示するためのインセンティブにしかすぎないんだからね。本当に隠したい情報は企業は特許にすることはありません。極秘です。
9
7,655
昔から思うに家事用ロボットって人間の都合に合わせたままに無理に家事をさせるからコストが高くなるのであってロボットに合わせて家を作ればわりとあっさりできるのではないかと思うよ。 ルンバのために全ての家具をルンバ分浮かせるルンバブルな部屋とか。 家はロボットと考えたほうが良い。
16
6,507
最近の研究を見ていると、mRNAワクチンは40年間の研究を必要として世界を救い、ディープラーニングは20年間の研究により機械学習を全て塗り替えたと思うと、何が当たるか全くわからないし、自由に研究をさせる余裕こそが世の中大事なんじゃないかなと思うんですよ。浮世離れした考えかもしれませんが。
17
5,146
ボイジャー、人類の夢を載せて半永久的に遥か彼方へ飛んでいくんだろうけど、50年くらい経っても、まだパッチとか当てられるの人類の努力の結晶みたいな感じだ NASAが190億km離れたボイジャー2号に18時間かけてソフトウェア更新用パッチを送信 - GIGAZINE
10
4,854
さらにこの根元には検索エンジンなんですよ。日本の検索エンジンは著作権に足を引っ張られて、Googleに駆逐されたという背景があるんです。その失敗を2度としたくないと検索エンジンの人たちががんばって作ったのが第30条の4なんです。
引用
深津 貴之 / THE GUILD / note
@fladdict
イラスト業界とAIエンジニア業界の文明衝突。騒動の根っこには「改正著作権法、第三十条の四のニ」というのがある。 「大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行う」ケースでは、著作者の許諾はいらないというもの。つづく
5
4,141
作者「YOASOBI の曲調はこんな感じで、ChatGPTで歌詞を作り、ボーカロイドを使って曲を歌わせます。」 俺「はい」 作者「ここでネットに落ちているRVCのモデルを使い、声を」 俺「これはあかん」
youtube.com
How to Make YOASOBI song
#yoasobi #vocaloid #jpopYOASOBI Social:Youtube: https://www.youtube.com/@Ayase_YOASOBI/videosMusic : Ayase (https://twitter.com/ayase_0404)Vocal : ikura (ht...
8
3,105
やはり、GPT-4、倫理的なナーフがかかっている。男性の未婚率より女性の未婚率の方が低いのは複数の女性が1人の男性と結婚するから、と言う説明すら否定してくる。これ以外の理由でどう説明するんだ。ちょっとこれは残念すぎるな。
15
2,869
-Google日英翻訳の変遷- 原文「存じ上げません」 2015/6「Zonjiage not」 2016/3「No Zonjiage」 2016/10「I have no idea.」 2016/11「I do not know.」 ←New!!!
3
2,351
返信先: さん
バズったので追加に書いておくと、実物を触ると、なんじゃこりゃという気持ちがもっと湧いてくるので、みなさん無印にいきましょう(ステマ
2
2,338
ChatGPT、頭が良い人が使うと頭の良い回答をしてくるため、(構造に詳しくない)頭が良い知識人ほどヤバいと感じるのだが、実はそこまで引き出せる人はごく僅かであって、そのごく僅かな人の生産力を極大にする効果があるだけではないかと思えてきている。
13
2,729
GPT-4がなぜ諸現象を引き起こすのか理解できている人は現状誰もいません。だからこそ、開発者はこの結果を「神の恵み」と称したのです。(技術報告の結論に書かれている)
引用
バーチャル美少女ねむ/Nem⚡2023年最も輝いたV@MoguLive VTuber Award
@nemchan_nel
GPT-4、完全に「文脈を理解して対話してる」ようにしか見えないし、「次の単語を予想する」を大規模学習しただけで何でAIがこんなことに頭よくなっちゃったのか私の頭では全然理解できなくてぶっちゃけ怖いレベル。理解してる人いるの? どこまで行くの?
2
1,705
今、イラスト向け画像生成AI(略して、作画AI)は3つの大きな問題を抱えています。 1つ目はNovel AI Diffusion の漏洩モデルやその漏洩モデルを元としたAnything V3などのモデルがもつ不正競争防止法違反の疑いが高いモデルの利用です。ことが国外であるためややこしいですが、国内ならば立派な犯罪です
3
1,498
Midjourney 、おそらくグレーゾーンな学習データの集め方をしている。それが果たしてどこまで許されるのか。少なくてもホワイトな集め方ではない。
6
1,403
社内で事前にテストしましたが、おそらく日本語性能ではGPT-3.5-turbo-16kに匹敵する性能だと思います。7Bと軽いので使ってあげてください。 #PR
引用
サイバーエージェント 広報&IR
@CyberAgent_PR
当社が開発した「独自の日本語LLM」である32,000トークン対応の商用利用可能なチャットモデルを一般公開いたしました。 今後もモデル公開や産学連携を通し、国内における自然言語処理技術の発展に貢献してまいります。 cyberagent.co.jp/news/detail/id
3
1,242
返信先: さん
補足すると、オールつらたんって四諦のことですね。 なお、全文はこちら。 おっす、チーム!じゃあさ、ブッダ様の話したプチイチオシっすぐらい短いまとめ、やっとくわ。出来るだけキャチ〜な感じで。 1. オールつらたん: 少なくとも誰もが何かの苦しみがあんげーじ (>_<) 2.…
さらに表示
5
1,131
ストレートに言いましょう。NovelAIDiffusionを越えるには採算度外視な改良型Imagen を使います。1枚目がLatent Diffusion の限界で、2枚目が普通のImagenの中途半端版です。これだけの差があります。Google が公開しない理由がわかりますか?本質的にやばいんですよ。
画像
画像
1
1,110
瞳孔のサイズが人によらず一定であることから、目の三次元位置をカラー画像から推定する手法らしい
引用
Google AI
@GoogleAI
Presenting a novel method for metric distance estimation from video using #MediaPipe Iris 👀 — no depth sensor required. Check out our blog for more details at goo.gle/3kmL519
メディアを再生できません。
再読み込み
1
1,077
LK-99らしき破片がもし常温常圧超伝導体だった場合、生成AIクラスの発明だ。一年で産業革命クラスの発明が2度も起こることになる。
5
1,090
本当にAIの時代になったなぁと思う一方、今日のNHKニュースを見ても、一ミリもGPT-4の話題が出てこなかったので、単に偏って情報を見てるだけなんかなと言う気持ちにもなる
10
1,012
MicrosoftがやらかしてGPT-3.5-turboのパラメータ数を20BとGPTとは関係ない論文で漏らしてしまった。
引用
Teknium (e/λ)
@Teknium1
FYI the new code diffusion model paper by some people at Microsoft claims ChatGPT-3.5-turbo is 20B params.. arxiv.org/abs/2310.17680
画像
2
1,040
今ふと、量子コンピュータって限られたアルゴリズムしかできないから、新しいアルゴリズムをGPT-4に考えさせればよくない?と気づいちゃったわけです。で、やってみたわけです。やってから気づきました。 >これシンギュラリティそのものじゃん<
画像
5
991
Text-to-Video、Text-to-3D、Text-to-Audioが1日にして揃ったというわけわからない生成技術の発展にもうついていけない
2
979
電卓が計算能力の補助となるように、大規模言語モデルは思考能力の補助、拡散モデルは創造能力の補助になると思う。これらが使いこなせる人と使いこなせない人では話にならない生産性の差が発生するだろう。ホモ・デウスの世界に近付いている。 note.com/nogacchi/n/n0a
画像
5
924
返信先: さん
なので、画像生成AIに関して、画風などを特許のように守るべきというのは若干謎です。また、実際に画風を守ってしまうとアシスタントなどが困ってしまいます。なので、防ぐことはできません。
3
855
これインパクトが絶大すぎて、本当か疑わしいと斜に構えていたが、どうも元論文がNeurIPS 2022を通してて、その上での再実験のようだから、実装もあるし、本当らしい。これでGPT-4クラスのものができたらどうなるんだ世の中は。
引用
今井翔太 / Shota Imai@えるエル
@ImAI_Eruel
ChatGPT,GPT-4以降の研究で一番のインパクト arxiv.org/abs/2304.11062 GPT系は最大3万トークン入力で,これが記憶の実現や大量のテキスト入力を妨げていたのですが,本手法はなんと200万トークンが可能に 本や大量のコードも丸ごと入力でき,会話なら過去の情報を丸ごと入力して記憶できるレベル
画像
画像
1
856
ペッパーの生産停止で思い出したんだけど、今の会社の面接を受けているときに、「コミュニケーションロボットはこれから幻滅期に入りますが、それでも回復期に入るまで事業や研究を続ける自信はありますか?」と事業責任者に質問したら、「あります」と即答されたので、入社を決めたところがあるな。
画像
1
831
個人が0から画像生成AIを作るとどうなるかを知ることができます。よいこのみなさんは真似しないようにしてください。第1回Generative AI勉強会 関西 で発表した内容になります。 #ChatGPT フルスクラッチで作る画像生成AI | あるふ #docswell
docswell.com
フルスクラッチで作る画像生成AI | ドクセル
フルスクラッチで作る画像生成AI
1
836
今の私はChatGPTやtext-to-image、text-to-videoにより、以下の仕事が専門家並みに可能です。 ・医者(特に精神科医 ・弁護士 ・弁理士 ・税理士 ・作家 ・写真家 ・イラストレーター ・アニメーター ・映画監督 ・ソフトウェアエンジニア 他 もちろん、想像の範囲なので試してみないとわかりませんが。
さらに表示
6
818
世界最高性能の画像生成AI、Imagen Freeが解放されました。 Stability AIとHugging Faceの人たちお疲れ様でした。
引用
あるふ
@alfredplpl
huggingface.co/spaces/DeepFlo
画像
5
825

Xを使ってみよう

今すぐ登録して、タイムラインをカスタマイズしましょう。
Appleのアカウントで登録
アカウントを作成
アカウントを登録することにより、利用規約プライバシーポリシーCookieの使用を含む)に同意したとみなされます。
トレンドはありません。