未分类 RHO-1: Not All Tokens Are What You Need可随意转载。 2024.04.22 摘要 以往的语言模型预训练方法对所有训练令牌统一应用了下一个令牌 阅读更多… 由ouyangshixiong,4周4周 前
大语言模型 Imagen-用LLM引导T2I照片级图像生成可随意转载 Update2024.02.02 发展历史 本文专业内容较多,没有论文&代码阅读 阅读更多… 由ouyangshixiong,4月2月 前
大语言模型 L-DAE解构扩散模型实现自监督学习可随意转载 Update 2024.02.08 前言 来自KaiMing大神2024年1月的论文《D 阅读更多… 由ouyangshixiong,4月3月 前
大语言模型 unCLIP-使用CLIP隐码的文字引导图片生成可随意转载!Update 2024.01.21 《 Hierarchical Text-Condit 阅读更多… 由ouyangshixiong,4月4月 前
培训课程 Flan:为高效指令微调设计数据和方法可随意转载。Update2023.11.14 摘要 我们研究了公开可用的指令调优方法的设计决策,并对 阅读更多… 由ouyangshixiong,6月6月 前
培训课程 Orca:从GPT4的复杂解释中渐进学习可随意转载。Update2023.11.1 摘要 近期的研究聚焦于通过模仿学习来增强小型模型的能力, 阅读更多… 由ouyangshixiong,7月6月 前