RT @ai_database: 既存のキャラクターの性格をLLMに模倣させることに特化したフレームワーク「チャットハルヒ」が登場しました。香港企業SenseTimeなどの研究者による開発です。 ○ Cheng Li et al. ChatHaruhi: Reviving Anime Character in Reality via Large Language Model 方法論は以下のとおりです。… twitter.com/i/web/status/1… pic.twitter.com/VhgeZG8IkX
posted at 15:59:19
昨今の、ガイド付きの推論+アクションとか、プロダクションシステムやん、という感がぬぐえない。非常に強力で柔らかい判断ができてるのは確かだけど。
posted at 15:59:12
RT @YahooNewsTopics: 【注目されています】 慶応、103年ぶり甲子園決勝へ #Yahooニュース news.yahoo.co.jp/pickup/6472879
posted at 15:18:23
RT @alfredplpl: 米国で「生成AI地ビール」続々 レシピなど開発期間を短縮 - 日本経済新聞 www.nikkei.com/article/DGXZQO…
posted at 11:32:09
RT @_stakaya: ベクトルDBのトレードオフを分析した記事。挿入vs読取速度、取りこぼし(Recall)vsレイテンシー、インメモリvsオンディスク、全文検索vsベクトルハイブリッド検索等の観点から比較・分析を実質。 Vector databases (Part 4): Analyzing the trade-offs thedataquarry.com/posts/vector-d…
posted at 11:30:55
RT @izutorishima: LINE の japanese-large-lm-3.6b-instruction-sft を CTranslate2 化して動かすのが GitHub にあったので試してるんだけど確かにだいぶ現実的な速度で動いててすごかった github.com/sotokisehiro/c… pic.twitter.com/YPRIO0aSUZ
posted at 11:30:43
RT @ratuta: おかげさまで想像以上に早く単行本とグッズ第2弾の通販告知がでておりました!単行本は9/1より開始予定です!その他詳細はRM モデルズ337号をご確認ください! #オオカミが電車を運転するだけのマンガ #オオカミが鉄道模型をはじめるマンガ #オオカミグッズ pic.twitter.com/mUCm327dwU
posted at 11:03:27
RT @uchujin17: 出たなトランスピュータ。1980年代中ごろにこれが「妙に」流行ったことには幾つかの理由があったと思う。 人知れず消えていったマイナーCPUを語ろう(第8回):並列CGレンダリングの夢を抱かせたINMOS Transputer @TechnoEdgeJP www.techno-edge.net/article/2023/0…
posted at 10:29:06
RT @emmyeil: Transformer を駆逐するか?と言われてる Microsoft の RetNet (REcurrent + self-attention = RETENTION) の説明がわかりやすい medium.com/ai-fusion-labs…
posted at 09:23:23
「現実とは?」での今井先生との対談記事にて、「a」と「the」の違いが取り上げられていたけど、もしもLLM(のデコーダ)が "the" とすべきところ "a" と出力してしまうと、それ以降の出力に影響して(意図(?)とは)別な文章を生成してしまうことがあるだろうか、あるいは途中で立て直すのか。
posted at 08:47:41
RT @hillbig: Bayesian Flow Networksは新しい生成モデル。各次元を独立に生成するパラメータを固定の単純な事前分布からベイズ更新式で改善し、NNが生成するノイズ有サンプルを介し次元間をつなぐ。拡散モデルと似ているがパラメータを改善するため入力が離散でも連続でも統一的に扱える arxiv.org/abs/2308.07037
posted at 08:44:26
RT @kgmkm_mkgm: 【comfyUI・A1111対応】 Stability Matrixが凄い! 画像AI環境構築これで出来ないなら諦めろ【モデルLoRA管理付】 #note note.com/kgmkm_mkgm/n/n… ・ #画像生成AI を試したい人にgitやpythonの話するのしんどい ・複数の生成UIのモデルやLoRAの管理がしんどい こう思ってる方、絶対使って!
posted at 07:42:40
RT @npaka123: 【勉強メモ】言語モデルにおける複雑なスキルの創発に関する理論 A Theory for Emergence of Complex Skills in Language Models|だいち #note note.com/daichi_mu/n/n7…
posted at 07:39:51
RT @ysu_nlp: Excited to give a keynote on "Language agents: a critical evolutionary step of artificial intelligence" tomorrow at the LLM workshop (bigmodel.ai/llm-ijcai23) @IJCAIconf. This is the problem I cannot stop thinking about these days. Join us if you are attending IJCAI! pic.twitter.com/TsLYldm2hY
posted at 07:33:50
RT @npaka123: GGMLからGGUFへ:llama.cppのファイルフォーマット変更|Baku #note note.com/bakushu/n/nbe8…
posted at 07:20:10
RT @jerryjliu0: A core retrieval idea that will lead to better results for your LLM QA system is decoupling embedding representations from raw text chunks (s/o @md_rumpf for inspiration). ✂️ There’s actually different ways to take advantage of this idea - and we’ll show how all of these are… twitter.com/i/web/status/1… pic.twitter.com/a4BWOqbLA8
posted at 07:18:36
RT @ImAI_Eruel: AI研究界隈のみなさまは,Synthesizer Vをぜひ聞いて触ってみることをお勧めします(いわゆるボカロ文化などに興味がない人も含め) 内部的には拡散モデルやRLHFも使われているようで,音声合成の質も凄いことになっているので,技術の応用として非常に良い例です twitter.com/ImAI_Eruel/sta…
posted at 06:44:43