RT @omarsar0: Introducing Giraffe - New Long Context LLMs Giraffe is a new family of models that are fine-tuned on Llama and Llama 2. Giraffe extends context length, including include 4K, 16K, and 32K (finetuned on Llama 2). Release includes: - paper - training code - evaluation datasets,… twitter.com/i/web/status/1… pic.twitter.com/EJkhksAmHx
posted at 16:32:52
RT @gigazine: Metaが日本語音声を入力するだけで「文字起こし」「翻訳」「吹き替え」を実行できるAI「SeamlessM4T」を公開、英語や中国に翻訳可能で無料で使えるデモも公開されたので使ってみた gigazine.net/news/20230823-…
posted at 14:05:30
RT @umiyuki_ai: 岡野原さんのCEDEC基調講演観てて思ったけど、純粋な言語モデルってたしかに言葉の繋がり、関連、確率を知ってるだけで、言葉の意味を理解してるわけじゃない気がするわ。だったらマルチモーダルで視覚、触覚、味覚、嗅覚も合わせて学習すれば”リンゴ”を言葉だけじゃなくて色、形、手触り、味まで込み… twitter.com/i/web/status/1…
posted at 14:05:07
RT @Wbzbu13WytaulAC: ミッドジャーニー(Midjourney)の弱点のひとつに、文字が指示通りに描けないという点があります。 ロゴやポスターに表記される文字が謎の文字列になって残念に思った経験があると思います。 しかし、インペインティング(region)機能を使うと、それを解消することが可能です。… twitter.com/i/web/status/1… pic.twitter.com/4pFI0AknlX
posted at 14:04:45
RT @tatsushi_do_ob: 1080Ti は本当に優秀なGPUだったと思うんですよね。8万円程でメモリ11GBでハイエンドな演算能力。 めちゃくちゃかき集めて80本買って、80GPU環境作ったのが良い思い出。Infinibandで繋いでノード間並列計算とかやったけど、結局研究用途としては大規模なパラメータサーベイに利用だったな。 twitter.com/dospara_nanba/…
posted at 12:00:53
RT @sei_shinagawa: プログラミング可能な相棒を自動化しながら攻略するオープンワールドサバイバルクラフトゲーム『Omega Crafter』をSteam向けに開発 - 株式会社Preferred Networks www.preferred.jp/ja/news/pr2023…
posted at 12:00:37
RT @cwolferesearch: Training on English-only data is becoming a standard for language models. I’ve recently started to wonder: What are we missing by not considering other languages? A few quick thoughts on why exploring multilingual language models would be beneficial… TL;DR. Most language… twitter.com/i/web/status/1… pic.twitter.com/2VqBn93Cza
posted at 12:00:29
RT @kohya_tech: ControlNet-LLLiteのpose、現状ここまでできてるので意外に悪くないのかもしれない(若干チェリーピッキング風味)。 もう一晩、追加で学習してみる。 pic.twitter.com/q9hEvOjtdZ
posted at 08:45:48
RT @MLBear2: 【ChatGPT Fine-tuning 解禁】 gpt-3.5-turboのFine-tuningが可能になりました。 penAIによるとFine-tuningされたGPT-3.5は特定のタスクでGPT-4のパフォーマンスを超えることもあるとのこと。 以下、OpenAIのプレスリリースを簡単にまとめます。 《概要》 ・ユーザーが準備したデータを利用して… twitter.com/i/web/status/1… pic.twitter.com/KTf2mnr80x
posted at 08:16:24
RT @ichiipsy: うつ病を発症した患者は回復後もネガティブな情報に敏感になる可能性を示唆する論文。… twitter.com/i/web/status/1… pic.twitter.com/RPt0iAGS4F
posted at 08:03:11
RT @Nameless_SN: 【おもしろ記事】1000万ユーザに耐えるサーバを作ってみた スケーラビリティの高いサーバの作り方を図表で解説しています。 サーバやAPIへの理解を深めたいなら一読しましょう。 #駆け出しエンジニアと繋がりたい #今日の積み上げ #プログラミング buff.ly/44e4wiF
posted at 07:53:28
RT @AiXsatoshi: Hugging Face初のopenマルチモーダルIDEFICSを発表❗️ ・📷画像 + テキスト入力 ・📚 80Bおよび9Bパラメーター ・🗣️ ChatGPTスタイル ・🚀 OBELICS: 1億4,100万のWeb、3億5,300万の画像、および1,150億のテキストトークンで構成されるオープンな大規模データセット。 Hugging Face科学チーム最新作品 twitter.com/sanhestpasmoi/…
posted at 07:38:50
RT @gclue_akira: LLMで一発でコード生成するのではなく、最初にMotion記述のPromptでロボットモーションを記述させ、さらに報酬関数の情報を含んだPromptで、コードを生成させて強化学習させるのか。 twitter.com/GoogleAI/statu… pic.twitter.com/W5SNavgrG5
posted at 07:38:36
RT @i_ot0ya: 星新一賞第9回優秀賞『あなたはそこにいますか?』(葦沢かもめ)。 小説家を目指す主人公が、クラウドソーシングを通じ、小説生成AI「mendel」を用いた小説執筆を行う話。 クラウドソーシングというのが現在的だし、物語作り(特には生成AIを用いた物語作り)を「剪定」に喩えるのは秀逸。これは
posted at 07:38:06
RT @alfredplpl: メタがまたやばいものを繰り出しきた。文章と音声をマルチモーダル生成を最大100言語ぐらい行えるAIを非商用だが無料で提供している。例えば、「本日は晴天なり」と入力すると、「It’s a clear day.」と言う文章と音声を同時に生成する。 huggingface.co/facebook/seaml… pic.twitter.com/c4dMDtAMcX
posted at 07:37:31
RT @omarsar0: The first, all-in-one, multimodal translation model! We are getting closer to a universal translator! Meta AI just released SeamlessM4T, a unified multilingual and multimodal machine translation system that supports ASR, text-to-text translation, speech-to-text translation,… twitter.com/i/web/status/1… pic.twitter.com/VXyWhYJua5
posted at 07:27:11
RT @MLBear2: 画像生成全然詳しくないんだけど、Midjourneyでピンポイントで画像修正できるようになったらしい。 修正した箇所と方法をわかりやすく解説してくださっていて面白いツイートでした🤗 twitter.com/Wbzbu13WytaulA…
posted at 07:25:42
RT @hillbig: Instruction BacktranslationはLLMの指示データを自動で作成する。1) 少数の指示/回答の教師データを使って回答から指示を予測するモデルを作る 2) それを教師無しデータに適用し、指示/回答ペア候補を作る 3) 候補の品質をLLM自身で評価し、良いものを指示データに追加 arxiv.org/abs/2308.06259
posted at 07:22:26
RT @jerryjliu0: A big issue with semantic retrieval is that top-k doesn’t do well if your corpus consists of a bunch of different documents (e.g. 100 diff PDFs 🗃️). There’s two ways of performing more structured tagging/retrieval for production-quality RAG systems: 1️⃣ Metadata Filters + Auto… twitter.com/i/web/status/1… pic.twitter.com/VXKKUPKjP2
posted at 07:21:20
www.techno-edge.net/article/2023/0…
posted at 06:36:12
RT @tksakaki: Python in Excel、、、これは強い。 ExcelでPythonが実行できるのも強いし、 Python実行環境を用意しなくても、各自のPCでPython実行できるのも強い。 いずれ、Code Interpreterも乗っかってきそう techcommunity.microsoft.com/t5/excel-blog/…
posted at 06:30:48
RT @ImAI_Eruel: みんなが待ち望んでいたであろう,ChatGPTのGPT-3.5のファインチューニング機能が公開! openai.com/blog/gpt-3-5-t…… ついにChatGPTを,各ユーザーや企業が独自のデータで学習し,カスタマイズできる時がやってきました. GPT-4についても正式なリリース予定が言及されており,秋には公開予定の模様. pic.twitter.com/QKzFHJqGWq
posted at 06:29:48
Google、大規模言語モデル「PaLM 2」が日本語対応したと発表。ダジャレを理解する能力も - Publickey www.publickey1.jp/blog/23/google…
posted at 06:16:17
RT @jaguring1: Stable diffusion の公開から1年が経ち、現在ではStable Diffusionレベルのモデルをゼロから学習するコストは数千万円から数百万円になり、1桁下がった。計算のコストパフォーマンスの改善は120年間は継続してることを考えると、今後はさらに一桁下がり、数十万円台になる。その後は数万円か pic.twitter.com/CkDHFy4GVl
posted at 06:13:05
RT @alfredplpl: PDFになっている英語の論文をローカルLLM (rinna) に理解させて、日本語で返答(RAG)してくれるソースコード gist.github.com/alfredplpl/57a… twitter.com/i/web/status/1…
posted at 06:09:59
RT @kazunori_279: 昨日公開したマルチモーダル検索記事についてGIGAZINEさんが詳しく解説してくれてた。日本語版はこれでいい気がしてきたw #gcpja gigazine.net/news/20230822-…
posted at 06:09:53
RT @ceekz: v1.1の検索APIは9月20日で終了、ツイートIDを指定したスイート詳細の取得APIも11t月20日に終了するので、ツイートIDのみを公開したデータセットを用いての研究は、その辺で終わりを迎えそう。 twitter.com/API/status/169…
posted at 06:09:13