評判の「大規模言語処理モデル入門」(gihyo.jp/book/2023/978-…)を購入。つい最近の話題・技術を含めて紹介し、データセット含めてサンプルを丁寧に用意された印象。 allennlp で、、とかなってなかったか? と思ったが、「ディープラーニングによる自然言語処理」( www.kyoritsu-pub.co.jp/book/b10031165…)だったよう
posted at 18:26:13
RT @imalab_org: 岡野さん(D2)の研究を公開しました。確率分布から確率分布を予測する回帰モデルを構築したものです。確率分布の空間の接空間に確率分布データを移して線形回帰に帰着させるのが技術的要点です。 arxiv.org/abs/2307.06137 pic.twitter.com/tmDgjCrN5S
posted at 15:24:04
RT @eugeneyan: Wrote abt patterns for LLM systems/products • Evals: Track performance • RAG: Add external knowledge • Finetuning: Improve specific tasks • Caching: Reduce latency & cost • Guardrails: Ensure output quality • Defensive UX: Anticipate & manage errors eugeneyan.com/writing/llm-pa…
posted at 15:23:16
RT @ZhitingHu: 🚨LLM Reasoners 🧠 A library for LLMs to do advanced reasoning, including latest algorithms: - Reasoning-via-Planning (RAP) 🎶 - Tree-of-Thought (ToT) 🌴 - beam search, and more All in unified perspective of world models🌎 and reward🥇 More alg & results coming soon! twitter.com/ber18791531/st… pic.twitter.com/OtxL3oUF9a
posted at 15:22:14
RT @fabcrossjp: デンマークの数学者、ピエット・ハインは言った。「二者択一で迷ったらコインを投げよ。 決断を代わりにしてくれるからではなく、 コインを投げる短い間にどちらが良かったかを知る効果があるからだ」。… twitter.com/i/web/status/1… pic.twitter.com/pye1b5zO1N
posted at 15:21:30
RT @_akhaliq: SelfCheck: Using LLMs to Zero-Shot Check Their Own Step-by-Step Reasoning paper page: huggingface.co/papers/2308.00… The recent progress in large language models (LLMs), especially the invention of chain-of-thoughts (CoT) prompting, makes it possible to solve reasoning problems.… twitter.com/i/web/status/1… pic.twitter.com/0lwwt3p9vj
posted at 12:51:56
RT @hwchase17: A 🧵on examples of using our new LangChain Expression Language to rewrite some of our most popular chains Benefits: it's very clear what's going on under the hood, and (most importantly) how to modify them 👇 pic.twitter.com/pCwDHRC1Nm
posted at 12:50:36
RT @_akhaliq: Tool Documentation Enables Zero-Shot Tool-Usage with Large Language Models paper page: huggingface.co/papers/2308.00… Today, large language models (LLMs) are taught to use new tools by providing a few demonstrations of the tool's usage. Unfortunately, demonstrations are hard to… twitter.com/i/web/status/1… pic.twitter.com/TkCRUfMyyu
posted at 12:42:30
RT @uozjun1: 「大規模言語モデル入門」のGirHubが最高。各章のコードが実際にColabで試せるようになっています。 CourseraのLLMコースはAWSのSageMakerを使っていたので、慣れているColabを使えるのがとてもいい。 github.com/ghmagazine/llm…
posted at 12:40:20
RT @dev_inada: ゲーム実況AITuberのモックイメージをymm4liteで作ってみました。イメージだけなのでAI使ってないです。裏側でrinnaのマルチモーダルチャットモデル使う形で、簡単なものだったら実装できそうな気はするんですよね。(しゃちくさんのずんだもんlive2dモデル、クオリティ高くてすごいです) pic.twitter.com/8RK9fOgwi1
posted at 10:20:44
RT @bindureddy: 🌟Announcing Long Context OSS LLM - Giraffe 🌟 We are thrilled to announce 2 new open-source LLMs! Today's SOTA open-source LLMs have one big shortcoming! These LLMs have a very small context length of only 2K This translates to them not being very useful when it comes to… twitter.com/i/web/status/1… pic.twitter.com/rxeZZTetci
posted at 07:19:25
RT @MLBear2: codeinpterpreter api が全然思った感じの動作じゃなかったので、納得いくものを自分で作ってみる。 まずは Function Call を利用して所望の Python Code を回答させて、それを裏側で実行することができるようにしてみた。ファイルアップロードして分析するのは次のステップでやる🤗 pic.twitter.com/yD0b69ugfk
posted at 07:01:15