ouyangshixiong – 奥比迪教育

RHO-1: Not All Tokens Are What You Need

可随意转载。 2024.04.22 摘要以往的语言模型预训练方法对所有训练令牌统一应用了下一个令牌阅读更多…

可随意转载 Update2024.02.02 发展历史本文专业内容较多，没有论文&代码阅读阅读更多…

可随意转载 Update 2024.02.08 前言来自KaiMing大神2024年1月的论文《D 阅读更多…

禁止转载，违者必究！ Update2024.01.24 导读 Transformer算法从NLP领域阅读更多…

可随意转载！Update 2024.01.21 《 Hierarchical Text-Condit 阅读更多…

可随意转载。Update2023.11.25 这个算法来自微软和高校的联合团队，发布于2023年7月阅读更多…

可随意转载。Update2023.11.14 摘要我们研究了公开可用的指令调优方法的设计决策，并对阅读更多…

请勿转载，违者必究 Update2023.11.12 一、研发团队《ZEPHYR: DIRECT 阅读更多…

可随意转载。Update2023.11.1 摘要近期的研究聚焦于通过模仿学习来增强小型模型的能力，阅读更多…

可随意转载 Update 2024.03.03 前言 2020年，大神Jonathan Ho发表论文阅读更多…