宝运宝运莱官方游戏网

女人荫蒂被添全过程A1片 最近更新|更新列表|字母检索|下载排行|苹果专区|分类导航

当前位置：首页 → 专题合集 → P6F3X2M7T9QJ8L1B4WZR

宝运宝运莱官方游戏网:SFT+RL双管齐下：ReasonGen-R1如何破解文生图「指令不遵」难题？

SFT+RL双管齐下：ReasonGen-R1如何破解文生图「指令不遵」难题？

近年来，链式推理和强化学习已经被广泛应用于大语言模型，让大语言模型的推理能力得到了显著提升。然而，在图像生成模型中，这种成功经验尚未得到充分探索。图像生成模型往往直接依据给定文本生成图像，缺乏类似人类创作过程中的推理，导致生成的图像在语义遵循上仍有一定局限。

近期，上海科技大学、微软亚洲研究院和复旦大学提出了 ReasonGen-R1 框架，一个两阶段训练框架，将链式推理监督微调（Supervised Fine-tuning）与强化学习（Reinforcement Learning）相结合，以提升自回归图像生成模型的推理和创作能力。ReasonGen-R1 使得自回归图像生成模型可以端到端地在输出图片之前先进行文本「思考」，大幅提升了基座模型的语义遵循能力，并在多个语义指标上取得突破。

目前，ReasonGen-R1 已全面开源（包括训练、评测代码，训练数据以及模型）。

论文标题：ReasonGen-R1: CoT for Autoregressive Image Generation model through SFT and RLArxiv 地址：https://arxiv.org/abs/2505.24875代码地址：https://github.com/Franklin-Zhang0/ReasonGen-R1项目主页：https://reasongen-r1.github.io

方法概览

ReasonGen-R1 的训练包括两个核心阶段：监督微调阶段（SFT）以及强化学习阶段（RL）。

监督微调阶段首先构建了一个大规模图片生成推理数据集，共包含 20 万条图像-文本对。该数据集基于 LAION 美学子集，利用 GPT-4.1 根据图片自动生成两类描述：一是多样化的简洁图片描述（包括常规叙述、基于标签和以物体为中心的叙述），二是丰富的推理式 CoT（chain-of-thought）叙述。多风格的简洁图片描述设计有效避免了模型在 SFT 阶段对单一 prompt 模式的过拟合。

随后，ReasonGen-R1 按照「Prompt → CoT →

图1. ReasonGen-R1 模型架构概览。ReasonGen-R1通过监督微调（SFT）以及强化学习（RL）使得模型可以先进行链式推理，再生成最终图片。

强化学习阶段通过 Group Relative Policy Optimization（GRPO）进一步优化模型输出。为了有效评价生成输出图像的质量和输入文本-输出图像的一致性，ReasonGen-R1 采用了预训练视觉语言模型 Qwen-2.5-VL-7B 作为奖励模型，让其对于每个输出图片，根据图片以及输入文本是否一致，给出 0、1 奖励。

图2. ReasonGen-R1强化学习框架概览。

此外，为确保训练稳定性，ReasonGen-R1 提出了一种改进的自适应熵损失函数，该损失函数能够将输出 token 的熵动态调节到目标熵附近，有效防止了在文本图像混合强化训练过程中训练不稳定导致模式崩塌的问题。

图3. 自适应熵损失中用于更新熵损失参数的loss function

ReasonGen-R1 实验结果

团队基于 Janus-Pro-7B 模型对 ReasonGen-R1 进行了全方面测试，选取了三个图像生成语义遵循指标：GenEval、DPG-Bench 以及 T2I-Benchmark。

如图 4 所示，ReasonGen-R1 在所有指标上都较基座模型有了显著的提升。这些结果表明，将文本推理通过 SFT-RL 的框架应用于图片生成，能够显著提升自回归图像生成模型的性能。

图4. 左图：基座模型Janus-Pro-7B和ReasonGen-R1生成图像可视化比较；右图：三个指令遵循指标上的表现比较。ReasonGen-R1在所有指标上均超过了基座模型，体现了指令遵循能力的巨大提升。

为深入探讨 ReasonGen-R1 各个模块的贡献，研究还进行了以下消融实验：

SFT 阶段的作用：为了测试 SFT 阶段对于模型最终性能的影响，ReasonGen-R1 对比了直接强化学习的结果。如表 1 所示，仅使用强化学习（RL）而未进行监督微调（SFT）时，模型表现显著下降，证明了 SFT 阶段对模型后续强化学习阶段的重要性。

奖励模型规模影响：实验还对比了不同大小的奖励模型。如表 1 所示，较小规模的奖励模型（Qwen-2.5-VL-3B）无法提供足够精准的反馈信号，严重影响强化学习阶段的表现。因此，选择高精度、大规模的奖励模型至关重要。

表1. ReasonGen-R1在GenEval指标上对于架构设计的消融实验

自适应熵损失函数的稳定作用：如图 6 所示，在没有熵损失的情况下，模型在经过 100 步的训练后会出现熵爆炸，同时 Reward 开始缓慢下降。另一方面，施加固定熵惩罚（–0.002）会使熵持续下降，并在第 80 步时过低，进而引发图片生成模式崩塌和奖励急剧下滑。这些现象凸显了在交错文本与图像的 RL 训练中，对于熵损失正则化设置的敏感性。相比之下，采用 ReasonGen-R1 提出的自适应熵损失能够将熵保持在最佳范围内，确保训练过程的稳定性以及奖励的稳定增长。

图6. 对于各个熵正则化策略在强化学习中的效果比较

ReasonGen-R1 CoT 分析

图7. 1000次CoT输出中的单词频率。只有出现频率高于20%的单词被展示。出现频率最高的三个’a, an, the’被移除以关注保护更多信息的词语

图 7 展示了 ReasonGen-R1 推理链的模式。首先，它通过「感知」（sense）、「场景」（scene）和「自然」（natural）等高频词（在超过 140% 的 CoT 中出现）来奠定总体框架，强调整体语境和真实场景。接着，它细化视觉风格：诸如「柔和」（soft）、「高光」（highlights）、「氛围」（mood）和「流畅」（sleek）等词汇（均在超过 100% 的 CoT 中出现）用以描述光照质量、情感基调和质感。

更关键的是，「突出」（highlighting）和「强调」（emphasizing）这两个词各自在至少 70% 的 CoT 中出现，表明模型有意识地聚焦于主要主体。这揭示出 ReasonGen-R1 不仅仅是在描述物体，而是在主动规划构图焦点。

除了核心词汇外，ReasonGen-R1 还运用了大量修饰词——「背景」（background）用于建立环境氛围；「特征」（features）用于突出显著视觉元素；「宁静」（calm）用于渲染平和氛围；「瞬间」（moments）用于传达时间抓拍感；「捕捉」（captured）用于强调摄影真实感；等等——以在每条推理序列中注入细腻的、情境化的细节。

总体而言，ReasonGen-R1 的推理链通过场景框架、风格细节、主体聚焦和细节修饰等要素，有效地引导了图像生成过程。

相关推荐：91麻豆白丝🌸扒腿自慰爽少萝被❌脱脱内内做运动代码卡夫卡被❌自慰喷水漫画

分享： 2025-06-22 00:57:34 共81款

宝运宝运莱官方游戏网:电脑

美女的尿囗㊙️免费图片 2.3MB / 官方版下载 2024-10-23

查看详情

叶山小百合大战女婿
0n❌❌❌VⅰdeO 243.10MB / 完整版下载 2024-10-23

查看详情

鸣人与小樱的秘密
日本拉大便goshopping 362.24MB / 官方版下载 2024-10-23

查看详情

小🐔🐔伸进🈲BB电视
戴了cb锁被调教男奴视频 69.15MB / 电脑版下载「含模拟器」 2025-03-04

查看详情

91丨九色丨国产熟女❤️软件
免费❤成人黄奶头无遮挡链接 1.8MB / 下载官方版 2025-03-20

查看详情

日本⭕⭕⭕⭕XXxX人在火车里
narutoXXXX玖辛奈爆乳 314.19MB / 中文版下载 2024-09-27

查看详情

带土把卡卡西C哭
美女➕光屁屁➕无遮挡小说 2.32MB / 官方版下载 2025-01-03

查看详情

缘分的天空免费高清

宝运宝运莱官方游戏网:安卓

赵今麦全身裸乳照片 539.12MB / 2025官方最新版本下载 2025-03-06

查看详情

少妇AV精品一二三有码欧美
白丝JK美女裸体❌出 866.17MB / 中文版下载 2024-10-23

查看详情

美女巨胸被捏胸❌
学长突然把自慰器开到最大 908.18MB / 完整版下载 2025-02-15

查看详情

花木兰疯狂喷水自慰
小舞被霍雨浩强扒开腿 1.80MB / PC端下载 2024-10-18

查看详情

韩国美女裸体㊙️免费
打白嫩㊙️光屁屁调教 1.50MB / 手机版下载 2024-12-13

查看详情

亚洲成AV人电影在线观看
ass刘涛大荫蒂毛茸茸 527.22MB / 下载官方版 2024-10-12

查看详情

N号房下安装包
www.呦香阁 2.16MB / 官方版下载 2025-03-11

查看详情

黄漫画❤️免费网站入口
XNXX.COM丰满少妇 2.9MB / 完整版下载 2024-10-08

查看详情

女主人的痰奴屎人尿奴小说
13🈲♋在线观看免费入口 37.23MB / 官方版下载 2024-10-30

查看详情

免费🆓看片软件
绝区零被❌18禁同人动画 319.4MB / 下载官方版 2025-03-04

查看详情

17c.com黑料吃瓜
亚洲精选男生狂咬奶头 938.5MB / PC端下载 2024-09-28

查看详情

欧产➕呻吟➕流白浆
女性脱👙撒尿 344.4MB / app下载 2024-02-26

查看详情

禁漫画我熟mu老师全集
女模特裸露全身 370.7MB / 完整版下载 2024-04-18

查看详情

japanese少妇漂亮多毛
丝袜脚交❌❌❌国产下载 2.16MB / PC端下载 2024-09-14

查看详情

啊〜好痛〜嗯〜轻一点高潮图片
白丝袜子❌扒开美女内衣的app 1.55MB / 官方版下载 2024-02-02

查看详情

被黑人开发过的纹身是什么
流萤裸身❌视频 302.27MB / PC端下载 2025-03-26

查看详情

大乳boobs巨大吃奶HD
快添添我下面我受不了 1.70MB / 最新版下载 2024-07-29

查看详情

偷拍15位女尿囗
在教室里被C到呻吟的动图网站 588.9MB / 下载官方版 2024-01-17

查看详情

西施自慰❌❌喷水好爽
美女脱免费看秘直播 780.19MB / PC端下载 2024-01-11

查看详情

成人免费观看A片www免费视频
小黃片㊙️🈲调教女友 894.10MB / 完整版下载 2024-01-09

查看详情

羞羞视频my53777.com
同性Gay❌❌❌免费网战 31.24MB / 2025官方最新版本下载 2024-01-05

查看详情

美女又爽又黄脱脱内内动漫
打屁股🔞网站脱裤子视频 216.28MB / 安装包下载 2025-02-14

查看详情

白丝班长扒开腿让我c事件后续
在车里女性脱👙给我揉🐻 174KB / v1.0 安卓版 2024-01-04

查看详情

美女扒开腿㊙️男人爽.九色
小太正Gay初精一 2.70MB / 下载官方版 2024-01-02

查看详情

扒掉女警内裤猛烈进入的视频
同性帅男又粗又爽Gay 840.1MB / 安装包下载 2024-06-07

查看详情

Naruto❌Sakura钢手
男仆撑开🍑让人玩弄动漫网站 491.9MB / PC端下载 2023-12-01

查看详情

高清做受❌❌高潮
美女疯狂柔❌脱脱内内喷水 415.27MB / 手机版下载 2024-10-16

查看详情

芒果AV无码成人网站
女帝被扒开腿做❌同人漫 2.47MB / 电视版下载 2023-11-08

查看详情

丰满奶大肉诱妇HD高潮
nxgx中国少妇高潮 2.63MB / 官方版下载 2023-11-04

查看详情

男女❌❌❌超爽很痛的动作
黄页88网网站特色 868.3MB / 中文版下载 2023-11-02

查看详情

silk-144郗及引引觴木化
动漫大c🔞黄㊙️❌软件 2.77MB / 最新版下载 2025-03-10

查看详情

蜜桃传媒㊙️免费播放
❤️爱情岛亚洲论坛福利站 549.2MB / 完整版下载 2023-11-01

查看详情

XXNX16中国免费视频
砂狼白子产牛奶 879.18MB / 官方版下载 2023-10-30

查看详情

性爱乱伦小说
3dm动漫人情债偿还系统严选动画 2.9MB / 最新版下载 2024-05-31

查看详情

朱竹清裸体被吸乳网站
China中国壮男Gαy野外 143.16MB / 手机版下载 2023-10-27

查看详情

国产婬乱A片无码区亚洲成a人
李丽莎自慰极品罕见露头 1.52MB / 完整版下载 2023-10-27

查看详情

布兰迪和朱莉安合拍的
春丽被爆❌羞羞漫画 977.1MB / 2025官方最新版本下载 2023-10-26

查看详情

性少妇mdms丰满hdf…
小舞被狂揉下部❌拔萝卜 1.45MB / 下载官方版 2023-10-26

查看详情

灰原嗯～啊～轻🈲🔞在线观看
男人的🍌伸到🍑里狂c 1.70MB / 2025官方最新版本下载 2023-10-25

查看详情

91九色丨PORNY丨丝袜
国产⭕⭕⭕拗女V88 2.82MB / 电视版下载 2024-03-29

查看详情

静香被强❌图黄漫视频
美女扒开腿㊙️让男人桶免费 501.17MB / 2025官方最新版本下载 2023-09-28

查看详情

体育生自慰Gay网站
艾莉被❌❌爆乳无尽 2.39MB / 手机版下载 2023-09-19

查看详情

purborn官网入口
B日到高潮喷白浆真人裸交 91.19MB / 电视版下载 2023-09-18

查看详情

あねちじょ♥マックスハート3在线
老汉趴在嫩妇身上耕耘 23.19MB / 安装包下载 2023-09-15

查看详情

洛天依强制侵犯泄欲h文
亚洲老奶老太videos 1.90MB / 电脑版下载「含模拟器」 2023-08-24

查看详情

羞羞漫画❤在线入口观看
失眠～仲夏夜之梦sleepless动画 705.1MB / 电视版下载 2023-08-21

查看详情

孕妇分娩无码A∨片
爱爱网aa5aa5com 1.53MB / PC端下载 2023-08-10

查看详情

黑土被鸣人❌❌变态梦
小舞扒腿让我c在线观看 2.80MB / 中文版下载 2023-08-08

查看详情

HotPornoHD💋💋女
原神凝光抬腿肉身待客黄 1.52MB / 中文版下载 2023-08-04

查看详情

爱情岛论坛网站入口
男男被❌c🐻黄扒衣服好爽 1.11MB / 最新版下载 2024-11-08

查看详情

强扒乳罩摸双乳吃奶视频
樱校里变态摸🍑揉🐻视频 307.18MB / 下载官方版 2023-07-31

查看详情

我用🍆擦同桌的🐻
男男sexGay2022 2.76MB / 官方版下载 2023-07-20

查看详情

女王sm调教男奴免费区
美女裸体挤奶视频 294.21MB / 电脑版下载「含模拟器」 2023-07-20

查看详情

69人XXXXXXXX68
原神涩涩同人❌18禁漫画钟离 2.97MB / 最新版下载 2023-07-10

查看详情

日韩精品a 6 2v久久A片
纯肉全H百合文 964.13MB / PC端下载 2023-06-14

查看详情

二次元爽下面出水
动漫㊙️黄二次元动漫免费软件 1.83MB / 电脑版下载「含模拟器」 2023-06-06

查看详情

亚洲⭕⭕⭕⭕XXXXyounv
两个校草互相脱裤子摸j 832.10MB / 安装包下载 2023-06-01

查看详情

免费🔞成人❌❌❌深夜天涯
胸走光看奶 497.9MB / 官方版下载 2023-06-05

查看详情

成人啪啪动漫羞羞漫画网站缘之空
馬与人黃色毛片免费视频 1.04G / v8.2.2 安卓版 2024-08-13

查看详情

18🈲do爱动漫视频双男
高潮国产喷水白 1.16MB / 2025官方最新版本下载 2023-05-19

查看详情

a🔴🍑我好🔴痒🔴网站
八重神子臀部颤抖流出白色液体 980.1MB / 安装包下载 2024-06-19

查看详情

洗澡无套自慰❌❌❌漫画
龟仙人❌人造人18号污本子 758.4MB / 下载官方版 2023-04-26

查看详情

ХХХ -n
妹妹用脚给你设 523.11MB / 电脑版下载「含模拟器」 2023-04-24

查看详情

人一禽一交一视一频下一句是什么
林尼被惩罚把尿口扒开小说 626.19MB / 安装包下载 2023-04-20

查看详情

欧美姓爱2021
学生裸体被❌羞羞 206.20MB / PC端下载 2023-04-24

查看详情

一拳超人龙卷被❌羞羞动漫
91漫画禁漫♥成人韩漫 1.20MB / 安装包下载 2023-03-28

查看详情

❌❌❌sex性开放AVc漫画
www.免费视频🈲🈲🈲传媒 356.14MB / PC端下载 2024-12-02

查看详情

张婉莹手笔自愈视频大全网站
免费看二次元涩涩漫画软件 2.65MB / 2025官方最新版本下载 2024-08-12

查看详情

FreeHD18❌❌❌原审
美女的部秘免费网站 2.21MB / 官方版下载 2023-03-14

查看详情

Pirates欧美成人片
女生脱👙r让男生揉🐻小说 544.25MB / 中文版下载 2023-01-17

查看详情

Hentai❌18禁动漫
少年高潮h跪趴扩张调教喷水文 181.19MB / 完整版下载 2024-04-03

查看详情

海贼蕾贝卡本子裸体
人与嘼AAAAA毛片 2.20MB / 官方版下载 2023-02-13

查看详情

国产男男GayGay✅免费网站
17c在线精品无码㊙️入口 819.14MB / 手机版下载 2023-03-03

查看详情

网站黄在线播放
扑克牌游戏大全 285.24MB / 中文版下载 2023-08-29

查看详情

调教婬奴重口sm视频

宝运宝运莱官方游戏网:苹果

相关合集

网友评论 查看所有评论>>

宝运宝运莱官方游戏网宝运宝运莱官方游戏网最新版本（官网）下载

<tfoot id='KutdwI'></tfoot>

<legend id='05Hoe'><style id='d8sZ'><dir id='6QK6D'><q id='Qd7MnUb'></q></dir></style></legend>

<i id='NSSHGZ'><tr id='FvdY9J'><dt id='VWwM'><q id='vnzMqw'><span id='Ihn7H9s'><b id='WKQZh'><form id='zhvh6ip'><ins id='bUhHD5m'></ins><ul id='fPpD'></ul><sub id='9edo0'></sub></form><legend id='60CWKYo'></legend><bdo id='QSjEGvgI'><pre id='aktn0LX'><center id='UpABe'></center></pre></bdo></b><th id='0IpZ8g'></th></span></q></dt></tr></i><div id='Ddtbxd'><tfoot id='n44S'></tfoot><dl id='nsTZi'><fieldset id='cGUNt0e'></fieldset></dl></div>

<li id='gdu2'><abbr id='ob1hmK'></abbr></li>