Quantcast
Channel: Yasuhiro Morioka(@morioka) - Twilog
Viewing all articles
Browse latest Browse all 2923

8月20日のツイート

$
0
0

RT @francoisfleuret: Reminder that my deep learning course @unige_en is entirely available on-line. 1000+ slides, ~20h of screen-casts. Full of examples in @PyTorch fleuret.org/dlc/ pic.twitter.com/faJ5GZ1FmG

posted at 16:34:20

RT @tomgoldsteincs: The success of diffusion models is a great example of the impact that a new mathematical paradigm can have. All the hyper-parameter tuning in the world can't beat a few lines of thoughtful math.

posted at 15:55:46

RT @tomgoldsteincs: Today, the vision community is turning towards diffusion models. Diffusions are built on simple image denoising nets that minimize a convex regression loss (usually least-squares or L1). No minimax. Easy breezy. It was probably an easy choice to build DALLE2 on this approach.

posted at 15:55:36

RT @tomgoldsteincs: In fact, GANs were proposed by Goodfellow in 2014, but it took three years and countless gallons of grad student tears before stable routines for ImageNet appeared in 2017. Training on the very large and diverse DALLE dataset would have been extremely challenging.

posted at 15:55:19

RT @tomgoldsteincs: So why didn't DALLE just use a GAN? GAN training requires solving a saddle-point/minimax problem, which is quite unstable. Simple tricks can help stabilize this (shameless self-promotion alert: openreview.net/forum?id=Skj8K…), but the problem remains.

posted at 15:55:00

RT @tomgoldsteincs: A transformer-based "language" model was trained on these sequences, ignoring the fact that some tokens represent text and some represent patches. The model reads in a partial sequence of tokens, and predicts the next token in the sequence.

posted at 15:54:20

RT @tomgoldsteincs: DALLE is an image model, but it was built like a language model. The model trained on image-caption pairs. Captions were encoded as 256 tokens. Images were broken into a 32x32 grid of patches, which were each encoded as a token. All tokens were merged into a single sequence. pic.twitter.com/ZORTAhVK2S

posted at 15:54:15

RT @tomgoldsteincs: Why have diffusion models displaced GANs so quickly? Consider the tale of the (very strange) first DALLE model. In 2021, diffusions were almost unheard of, yet the creators of DALLE had already rejected the GAN approach. Here’s why. 🧵

posted at 15:53:46

RT @nyorozo: いま半額セールしてるんでよろしくです。なんでか知らんけど。(大概のセールは作者が知らないうちに始まり、知らないうちに終わる) amzn.to/3PAPLir

posted at 15:09:19

RT @nyorozo: 「を」の発音は「お」(O)なのか「うぉ」(Wo)なのかという話。『日本人の知らない日本語』1巻より ※Woの発音が残っている地域も多いようです。私はWo派です🥺 pic.twitter.com/xq5OOiPY8U

posted at 15:09:13

RT @tkaytkuy: 表紙と目次を公開しました/書籍案内:Vision Transformer入門 #gihyojp gihyo.jp/book/2022/978-…

posted at 14:58:49

RT @MaywaDenki: 「明和電機オモチャができるまで展in柏マルイ」。今日と明日、社長も出勤してます。サインなどほしい方、お声をおかけください。 pic.twitter.com/YGwEnbkVty

posted at 14:24:04

RT @hirohasusan: Photoshopのニューラルフィルターに追加機能の候補があって、そこの「潜在ビジョン」がどうやらMidjourney的な機能っぽい Photoshop上からダイレクトにAI画像生成できたら確かにめちゃ便利なのでAdobe頑張って欲しい 他の候補も良さげ、特にシャドウ再生成はいろいろ使えそう pic.twitter.com/NoDTOiYDCO

posted at 14:23:15

RT @UnrealEngineJP: Unreal Engine 5 と AI を活用したミュージック ビデオの作成 台本の生成から肖像画の作成まで、人工知能は私たちのクリエイティブの可能性を引き出しています。Sagans のチームが AKIRA から発想を得た MV 作成に AI と #UE5 をどのように使ったのかを紹介します。 www.unrealengine.com/ja/spotlights/…

posted at 14:22:35

RT @Hironobu_Asano: 記事の中に「SSD最適化」という言葉がありましたので、コメントします。 こういったバーチャルゲームで、ソフトと人間間のインタラクティブ操作(相互作用)によって発生する「ランダムアクセス」は、SSDにとっては、元々、負荷の高いランダム処理ではありません。(続く) www.watch.impress.co.jp/docs/series/ni…

posted at 14:19:54

RT @hito_horobe: ラインアップの中だとアントニオ・ダマシオ『意識と自己』を少し読んだが結構面白かった。意識がどういう構造なのか明らかにするにあたって脳の疾患や動物実験などの事実だけでなく生物学や哲学などの視点も動員されていて別分野の物事が繋がるときの快感がある amzn.to/3Cepeod

posted at 12:11:25

RT @hito_horobe: 文庫なのにバカ高いことでおなじみの講談社学術文庫が一挙セールになってる! 講談社学術文庫レーベルフェア amzn.to/3c7HxRk

posted at 12:11:14

RT @RYonetani: 研究がうまくいかないときの話を寄稿しました。こちらから無料で読めるようです。 hondana-storage.s3.amazonaws.com/1040/files/125… twitter.com/omron_sinicx/s…

posted at 11:37:29

RT @simizu706: 『RとStanではじめる心理学のための時系列分析入門』を講談社さまよりご恵投いただきました!ありがとうございます。 心理学者向けの時系列分析の本は、なかなかない上に、説明がとても丁寧にされているので、すぐに時系列分析ができるのでおすすめです! 発展的な分析法の説明もあるので魅力的です。 pic.twitter.com/ga3xECLPzT

posted at 11:27:20

RT @LunarModule7: 英語のリスニング力を鍛える個人的オススメはNHK WORLD RADIO JAPAN News 1) 題材が身近で推測しやすく毎日更新されて無料 2) アナウンサーの発音は聞き取りやすい 3) アナウンサーごとに難易度が分かれ攻略しがいがある www.nhk.or.jp/podcasts/lang_…

posted at 11:27:07

How to Build a GPT-3 for Science future.com/how-to-build-g…

posted at 11:19:23

You've heard of text-to-image AI, now text-to-video is here www.diyphotography.net/youve-heard-of…

posted at 11:19:06

RT @hirotsujino: 技術的バックグラウンドがなかった自分が Google 本社のエンジニアになった経緯を書きました。自分自身、道半ばですが、似た境遇の方に少しでも参考になると嬉しいです! Google Japan にビジネス職として新卒入社して、本社でソフトウェアエンジニアになるまで #note note.com/hirotsujino/n/…

posted at 10:42:35

RT @arxiv_cscl: PiC: A Phrase-in-Context Dataset for Phrase Understanding and Semantic Search arxiv.org/abs/2207.09068

posted at 10:41:59

最後の事件

posted at 10:39:53

RT @neural_fields: NeIF: Representing General Reflectance as Neural Intrinsics Fields for Uncalibrated Photometric Stereo Authors: Zongrui Li, Qian Zheng, Feishi Wang, Boxin Shi, Gang Pan, Xudong Jiang arxiv.org/abs/2208.08897 #neuralfieldsoftheday pic.twitter.com/i8Zxnc512k

posted at 09:52:13

RT @bibryam: A #fantastic deep technical dive into all things Redis. architecturenotes.co/redis/ pic.twitter.com/mv2xpWQdXv

posted at 08:12:41

RT @hirax: retweet先のPythonコードを有効に働かせるための仕掛けなど、2ページほどの分量で補足原稿も書きました(使用ノートブックなどと一緒にダウンロードできるはずです)。 twitter.com/hirax/status/1…

posted at 08:11:03

RT @hirax: Pythonコード数行書くと、iOS/iPhoneデバイスでネイティブに動くアプリを書ける。処理の合わせ込みとか全くしていないけれど、このくらいは何も考えずに可視化される感じ。 twitter.com/hirax/status/1… pic.twitter.com/K2qu7bLM5d

posted at 08:10:40

RT @hirax: Carnets for Jupyterのセルを実行すると、カメラ・処理後画像プレビュー含めてネイティブ実行される…という手順。…詳しくはコード含めて全3ページの来月発売のソフトウェアデザイン10月号で。 twitter.com/hirax/status/1… pic.twitter.com/qmygk8IdBe

posted at 08:10:28

RT @hideman2009: コミュニケーションロボットの話とかすると「癒し」とかいうワードが良く出てくるけど、「癒し」だけならアロマキャンドルでもいいわけなので、もう少し行動分析学レベルの記述で、ご家庭にロボットを置くメリットをゴリゴリに記述できないといけないのかも

posted at 08:07:23

RT @MaywaDenki: いよいよ本日から「明和電機オモチャができるまで展 in 柏マルイ」がスタート。明和電機のオモチャの発想から作る、見せる、売るのプロセスがぜんぶ見れます。入場料 : おとな無料、こどもは300円。 pic.twitter.com/xiR41Ps1ba

posted at 08:05:03

RTX 3060 Ti+第10世代Core i7で15万3780円! HP ENVY Desktopがアウトレット販売中 little-beans.net/bargain/hp-env…

posted at 08:03:29

RT @momotro018: 元信者が告白 『萩生田さんはただ祝電を送ってるような関係じゃなくて統一原理を知っていて「真の父母様」や「神様の計画を達成しよう」と言っていた。八王子教会は萩生田さんを政界に戻すことが神様の使命だった。「関係ない」ってなんでそんなこと言うんだろう‥』 #統一教会と自民党 #ニュース23 pic.twitter.com/rLXTU8E5ur

posted at 07:45:37

RT @nisssssaka: ご報告:8月21日まで開催中の国際鉄道模型コンベンション(JAMコンベンション)RM MODELSブースにて、らつたさん(@ratuta)作品展に拙作表紙イラストが紛れ込んでいます(全然紛れてはいない)。お出かけの際にはよかったら見てね。 pic.twitter.com/JBf3AqiJU1

posted at 07:45:27

RT @rockfish31: 小泉悠さんインタビュー#3 #文春オンライン bunshun.jp/articles/-/563… 「この戦争は「ハイブリッド戦争」ではない」「単に多様な手段や主体が関与しているだけでは、ハイブリッド戦争と言わない」「その基準だと歴史上のあらゆる戦争がハイブリッド戦争になる」 ロシアーウクライナ戦争ではここが重要

posted at 07:45:07

RT @goshuinchou: 今治名物焼豚玉子飯 今治で食うたびに、これだよこういうの食えりゃそれでいいんだよ人生、という庶民的多幸感に溢れる食い物である。今回は今治城近くの錦海楼というお店です。中華料理の繁盛店なようで美味しかったっす。 pic.twitter.com/fWo7J7pgww

posted at 07:44:43

RT @netatank: 24時間以内に3.5万RT以上で買います pic.twitter.com/aCXCvqmZXZ

posted at 07:44:10

RT @spacy_io: 🖍️ spellCheck: a contextual word checker that uses the bidirectional representations of BERT to correct spelling mistakes. pip install contextualSpellCheck github.com/R1j1t/contextu… pic.twitter.com/2njtbYXGYE

posted at 07:41:07

RT @LTIatCMU: LTI student Sang Keun Choe released Betty, a PyTorch library for generalized meta-learning (GML) and multilevel optimization (MLO). It provides an API for neural architecture search, few-shot learning, reinforcement learning, adversarial learning, & more! github.com/leopard-ai/betty

posted at 06:18:38

RT @Gemararara: サツキと節子が同じ年(昭和16年)生まれという設定を考えると背筋が凍りそうになる。同じ国で同じ時期に起きた物語なのに、彼らの表情はあまりにも対照的。 公開当時『トトロ』と『火垂るの墓』は2本立て上映だった。もし何かが違ければ、彼らの人生は真逆だったかもしれない pic.twitter.com/ZSQMkEi6mA

posted at 06:18:24

五十嵐先生のところでやってそうな話だなあ twitter.com/shiropen2/stat…

posted at 06:01:29

RT @shiropen2: 手書きスケッチで描いたキャラやロボットの関節を自在に動かせるデザインツール 韓国チームが開発 levtech.jp/media/article/… コンセプトを伝える際に初期に描くデザインで関節動作が同時に行える3Dツール。様々な動作を指でグリグリ動かせ任意カメラ位置で動きの録画も可。パーツ分解,再組み立ても自在 pic.twitter.com/Ch1JaM60RT

posted at 05:57:56

RT @arxiv_cscl: Transformers and the representation of biomedical background knowledge arxiv.org/abs/2202.02432

posted at 05:54:35

RT @shark_ishi: 浦賀コミュニティセンター分館に展示されていた浦賀ドックの空撮写真。よく見たら情報量が多すぎる pic.twitter.com/DalzYGhUHp

posted at 05:47:56

RT @Jeande_d: First Principles of Computer Vision, Columbia University Really nice lectures on the physical and mathematical foundations of computer vision. 140 videos that you can watch at your pace. Slides are also provided to follow along. pic.twitter.com/zJ7e0VRox6

posted at 05:44:44

RT @pliang279: Check out slides & video recordings of our recent tutorials on multimodal machine learning at CVPR 2022 and NAACL 2022: video: www.youtube.com/playlist?list=… slides and readings: cmu-multicomp-lab.github.io/mmml-tutorial/… pic.twitter.com/CM29PJ4V27

posted at 05:43:03

RT @ceekz: 修士の学位を持っていない人には「研究の育て方: ゴールとプロセスの「見える化」」を読んでね、という話をして、博士後期課程進学を考えてる人には「博士号のとり方[第6版]―学生と指導教員のための実践ハンドブック」を読んでね、とか言ってる。 www.amazon.co.jp/dp/4260036742?… www.amazon.co.jp/dp/4815809232?…

posted at 05:34:33

RT @MaywaDenki: 「明和電機オモチャができるまで展in柏マルイ」にお越しの”おとな”のみなさまに裏ワザ情報。ただいまEPOSカードに入会すると 2000円分のデジタルクーポン 1000円分のクーポン(8/31まで) 社員証(500円) がついてきます。つまりオタマトーンと社員証がタダで手に入る!こどもにはできないワザ! pic.twitter.com/bKoXGwN8w9

posted at 05:27:33


Viewing all articles
Browse latest Browse all 2923

Trending Articles