相关文章
【复现DeepSeek-R1之Open R1实战】系列4:跑通GRPO!
目录 1 配置环境2 训练2.1 命令和配置参数2.2 num_generations2.2.1 参数定义2.2.2 参数含义2.2.3 示例2.2.4 使用场景2.2.5 示例代码 2.3 显存占用和耗时 3 结果 1 配置环境
关于环境配置,可以参考这篇博文:【复现DeepSeek-R1之Open R1实战】系列1&…
建站知识
2025/5/2 3:07:55
【拒绝算法PUA】LeetCode 1287. 有序数组中出现次数超过25%的元素
系列文章目录
【拒绝算法PUA】0x00-位运算 【拒绝算法PUA】0x01- 区间比较技巧 【拒绝算法PUA】0x02- 区间合并技巧 【拒绝算法PUA】0x03 - LeetCode 排序类型刷题 【拒绝算法PUA】LeetCode每日一题系列刷题汇总-2025年持续刷新中
C刷题技巧总结: [温习C/C]0x04 刷…
建站知识
2025/5/2 3:19:53
【Elasticsearch】监控与管理:集群健康检查
🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,精通Java编…
建站知识
2025/4/27 15:00:25
机试刷题_滑动窗口的最大值【python】
题目:滑动窗口的最大值
描述 给定一个长度为 n 的数组 num 和滑动窗口的大小 size ,找出所有滑动窗口里数值的最大值。
例如,如果输入数组{2,3,4,2,6,2,5,1}及滑动窗口的大小3,那么一共存在6个滑动窗口,他们的最大值…
建站知识
2025/4/25 22:44:53
【Git】reflog实战:找回丢失的提交
📘 问题背景:
当你在本地提交了代码(commitA 和 commitB),执行 git pull --rebase 与远程仓库同步时,可能会发现本地的两个提交“消失”了。这是因为 rebase 操作重写了提交历史,导致本地提交被…
建站知识
2025/5/1 21:43:46
DeepSeek开启AI办公新模式,WPS/Office集成DeepSeek-R1本地大模型!
从央视到地方媒体,已有多家媒体机构推出AI主播,最近杭州文化广播电视集团的《杭州新闻联播》节目,使用AI主持人进行新闻播报,且做到了0失误率,可见AI正在逐渐取代部分行业和一些重复性的工作,这一现象引发很…
建站知识
2025/4/30 18:33:51
总结 Java 线程的几种状态
1) 观察线程的所有状态
其实这里所提到的状态, 就是pcb里的状态字段, 系统设定将线程分为了就绪状态和堵塞状态, 但是在Java中, 把上述状态又做了划分. 就是以下六种. 2) 状态之间的切换条件 一个线程在没执行star方法之前是NEW状态, 执行start方法后就会是RUNNABLE状态, 此时…
建站知识
2025/4/25 15:09:23