RT @__ramu0e__: Diffusion Modelに強化学習を適用するために以下のモデル(DDPO_IS)が提唱されているの興味深い 一つの逆拡散過程でポリシーグラディエントをとって、全過程を経た生成物の評価値(報酬)で更新幅を決めている(REINFORCEの様に) twitter.com/_akhaliq/statu… pic.twitter.com/2fuw0PNOU8
posted at 23:14:49
RT @mumeikun_AI: 「ChatGPTが話題だけど全然良い記事出来ないじゃん!」という方へ。ブログやYouTube台本など長文記事作成に特化したツールを作りました。5000文字以上の記事が一撃で生成できます。操作は感覚的で超カンタン。無料で使えるので一度体験してみてください。他との違いに驚愕していただけるはずです。
posted at 23:01:29
RT @johnjnay: Purely Synthetic LLM Feedback Improves LLMs -Reward model trained on contrasting responses from vanilla LLM of varied size -Almost no human input -No dependency on pre-aligned LLMs -Outperforms Alpaca, Dolly, etc, which are trained on InstructGPT/humans arxiv.org/abs/2305.13735 pic.twitter.com/pmciUE8H3T
posted at 22:56:13
RT @1sVQQbZxzACx7dB: #水星の魔女 されたんか それで個性バラバラだし体格もそんな似てないんだ、元々そこ基準ではないから あと「データストームの耐性を植え付けられた」ここ重要 公式サイトの説明では「GUNDフォーマットのデータストームに対する耐性の高い人間から選別され」とあるが、この言い方だと更に後天的に↓ pic.twitter.com/XUHwhvYQOu
posted at 22:54:40
RT @1sVQQbZxzACx7dB: #水星の魔女 あー、本当によく聞かないと聞き流すように作ってあるわ 強化人士はエランの影武者として選出されたわけではなく、現在エランが次期CEO候補としてAIに選出されたけど、決闘で次期総裁が決まるシステムが始まったから急遽パイロット適性のない本物のために整形されるオプションが追加↓ pic.twitter.com/4N8VEoqsug
posted at 22:54:27
RT @bilzrd: QLoRA 4bitに量子化されたLLMをLoRAを使って48GBメモリのsingle GPUで24hでファインチューニングに成功した。 arxiv.org/abs/2305.14314
posted at 22:51:16
RT @iwiwi: Preferred Networksを退職しました。本当に楽しく、信じられないほど多くの学びがあった7年間でした。お世話になった全ての方々に、心から感謝申し上げます。 一応ブログも書きました。 iwiwi.hatenablog.com/entry/2023/05/…
posted at 22:23:17
RT @mi141: Any-to-Anyの生成を行う拡散モデルCoDiが出てますね。画像、動画、音、テキストから選んだ任意の組み合わせでX-to-Yという条件付き生成が可能です。 codi-gen.github.io 大変面白く読んだのですが、関連研究の記述がしょぼ(げふんげふん)控えめなので、私の知る限りで多少補足してみました。 pic.twitter.com/kPGnmgoRh7
posted at 22:17:57
RT @hillbig: 注意機構(Attention)が(QK^T)Vで計算するのに対し、KVQ空間における新しい計算としてIntentionは正則化付最小二乗法の解と同様に Q(KK^T+αI)^{-1} K^TV で計算する。Attentionが推論時に勾配降下法で逐次的に解くとみなせるのに対しIntentionは解析解を直接求める。 arxiv.org/abs/2305.10203
posted at 08:37:10
RT @itnavi2022: 今日から、#ChatGPT に #Bing の検索エンジンがデフォルトで導入されます。 これで、検索失敗ばかりで使えなかったChatGPTのブラウジングが大幅に改善されるはず。 blogs.bing.com/search/may_202… pic.twitter.com/xUqfmlxa25
posted at 08:34:20
RT @umiyuki_ai: やべ~、しゅげ~、鳥肌~!Windows Copilotだって!どうやらEdgeのAI機能みたいなのがWindowsのOSにネイティブに統合されちゃうらしい!つまり?AIは僕のPCの全部のデータを自由にアクセスしたり、自由にPCを操作したりできちゃうって事だよね!… twitter.com/i/web/status/1…
posted at 08:33:23
RT @gyakuse: Novel AIの新しい言語モデル: Clio がリリースされてる! なお、Opusユーザー限定です。なお、今まで通りGenji (GPT-J 6Bの日本語特化のfine-tuning) はOpusユーザー以外も使えます。 下のほうに日本語でのリリース文もあります。 blog.novelai.net/a-new-model-cl…
posted at 08:27:26
#DevelopersIO Cloudflare Workers上でLangChainを動かし指定したWebサイトについて質問できるか試してみた dev.classmethod.jp/articles/cloud…
posted at 08:18:30
RT @if_004: とりあえず動作検証 おかしなところあればコメント頂けると OpenCALM-7Bをloraで学習して、quantizeするまで|if001 @if_004 #note note.com/if001/n/ne9401…
posted at 06:51:53
RT @hayashiyus: ・量子力学には物理量の値は測定の文脈に依存して決まるという文脈依存性があることが知られている ・この事実が,量子ニューラルネットが古典的なニューラルネットと比べてより少ないパラメータ数で文脈を表現する能力を有する,という量子優位性を導く… twitter.com/i/web/status/1… pic.twitter.com/KSsiVcCM79
posted at 06:39:27
RT @yoshi_and_aki: 同僚に教えてもらった東大文系数学の問題を英訳してGPT-4+Wolfram pluginに与えてみました。GPT-4がcombinatoricsに関する論理を構築し、最後に「さあ計算してみましょう」と言ってWolfram使った。理想形のひとつかと。 pic.twitter.com/ZOW60Yxmte
posted at 00:16:42
RT @Delete_All: 定年が迫っている会社上層部の「ChatGPTは凄い。人工知能によって私の仕事はなくなってしまうところだった。だが、残念ながら登場が遅すぎた。去ってゆく私からは何も奪えない」という人工知能に対する謎の勝利宣言が無駄にかっこよくて感動しました。
posted at 00:03:37
RT @madiator: Vint Cerf’s Career Advice for Engineers spectrum.ieee.org/vint-cerf-advice • “If you really want to do something big, get help, and preferably from people who are smarter than you are.” • “Be humble, because unless you approach things with the understanding that you really don’t know… twitter.com/i/web/status/1…
posted at 00:03:28