相关文章
PPO和GRPO算法
verl 是现在非常火的 rl 框架,而且已经支持了多个 rl 算法(ppo、grpo 等等)。 过去对 rl 的理解很粗浅(只知道有好多个角色,有的更新权重,有的不更新),也曾硬着头皮看了一些论文和知…
建站知识
2025/9/6 14:41:23
将word文件转为kindle可识别的azw3文件的方法
亚马逊在中国停服后,要将word文件传送到kindle设备上进行阅读就不能通过电子邮件的方式了,只能通过将word文件进行转换后通过数据线传到kindle的方式来实现,通过线上或线下的转换工具可将word文件转化为azw文件,但通过数据线将转换…
建站知识
2025/8/31 12:58:34
Redis Sorted Set 深度解析:从原理到实战应用
Redis Sorted Set 深度解析:从原理到实战应用 在 Redis 丰富的数据结构家族中,Sorted Set(有序集合)凭借独特的设计和强大的功能,成为处理有序数据场景的得力工具。无论是构建实时排行榜,还是实现基于时间的…
建站知识
2025/9/6 4:12:53
今日主题二分查找(寻找峰值 力扣162)
峰值元素是指其值严格大于左右相邻值的元素。
给你一个整数数组 nums,找到峰值元素并返回其索引。数组可能包含多个峰值,在这种情况下,返回 任何一个峰值 所在位置即可。
你可以假设 nums[-1] nums[n] -∞ 。
你必须实现时间复杂度为 O(…
建站知识
2025/8/29 11:53:46
【Oracle】数据备份与恢复
个人主页:Guiat 归属专栏:Oracle 文章目录 1. Oracle备份恢复概述1.1 为什么备份这么重要?1.2 Oracle备份策略全景图 2. 物理备份详解2.1 冷备份 - 最简单粗暴的方式2.1.1 冷备份的步骤2.1.2 冷备份恢复过程 2.2 热备份 - 不停机的备份艺术2.…
建站知识
2025/8/27 8:19:47
通过模型文件估算模型参数量大小
1. 关键文件解析
文件名作用参数信息提取线索adapter_model.safetensors存储微调后的适配器权重直接反映可训练参数量adapter_config.json记录LoRA/Adapter的配置参数包含rank、target_modules等 2. 参数规模计算(以您的文件为例)
步骤1:检…
建站知识
2025/8/29 13:27:53
Qt Quick快速入门笔记
Qt Quick快速入门笔记 基本的程序结构int main(int argc, char *argv[])
{
#if QT_VERSION < QT_VERSION_CHECK(6, 0, 0)QCoreApplication::setAttribute(Qt::AA_EnableHighDpiScaling);
#endifQGuiApplication app(argc, argv);QQmlApplicationEngine engine;const QUrl ur…
建站知识
2025/8/24 17:23:30