オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

2023-02-16から1日間の記事一覧

【深層学習】Reinforcement Learning from Human Feedback / RLHF

Index Index Reinforcement Learning from Human Feedback / RLHF テクニック・工夫 ZO-RankSGD / 2023 画像への応用 研究 参考 Reinforcement Learning from Human Feedback / RLHF 人間によるフィードバックに基づいて、LLM を強化学習させる手法. LLM yha…

【機械学習】Spiking Neural Network / SNN

機械学習 #まとめ編 yhayato1320.hatenablog.com Index Index Spiking Neural Network / SNN 応用 CMOS / 2023 参考 Spiking Neural Network / SNN 応用 CMOS / 2023 CMOS-based area-and-power-efficient neuron and synapse circuits for time-domain anal…