相关文章
DPO 推导及其问题讨论
DPO 推导及其问题讨论 
本文主要参考两篇博文(1、2),结合自身对推导和 RL 理解记录,学习从 RLHF(RMPPO)到 DPO 的推导过程,以及 DPO 问题。 
原始 RLHF: RM  PPO 
原始 RLHF 的训练分为两步&…            
建站知识
2025/10/31 23:05:37
Linux学习笔记(应用篇二)
基于I.MX6ULL.MINI开发板 开发板与电脑相互通信电脑与开发板互传文件 开发板与电脑相互通信 
用网线将电脑与开发板连接 本人使用的是Ubuntu系统,不是虚拟机 
一般来说刚开始电脑和开发板是ping不通的 
首先查看电脑的 IP 
WinR,cmd调出终端 
我使用的是…            
建站知识
2025/10/29 13:15:40
订票系统|基于Java+vue的火车票订票系统(源码+数据库+文档)
订票系统目录 
基于Springbootvue的火车票订票系统 
一、前言 
二、系统设计 
三、系统功能设计  
1会员信息管理 
2 车次信息管理 
3订票订单管理 
4留言板管理 
四、数据库设计 五、核心代码  
六、论文参考 
七、最新计算机毕设选题推荐 
八、源码获取: 博主介绍…            
建站知识
2025/10/30 23:25:57
LeetCode-347. 前 K 个高频元素
1、题目描述:  
给你一个整数数组 nums 和一个整数 k ,请你返回其中出现频率前 k 高的元素。你可以按 任意顺序 返回答案。 示例 1: 
输入: nums  [1,1,1,2,2,3], k  2
输出: [1,2]示例 2: 
输入: nums  [1], k  1
输出: [1]提示: 
1 < nums.length &…            
建站知识
2025/10/31 8:36:45
104.二叉树的最大深度
题目: 
给定一个二叉树 root ,返回其最大深度。 
二叉树的 最大深度 是指从根节点到最远叶子节点的最长路径上的节点数。 示例 1: 输入:root  [3,9,20,null,null,15,7]
输出:3示例 2: 
输入:roo…            
建站知识
2025/10/30 21:44:26
msyql--基本操作之运维篇
检查 root 用户的权限 
查看该用户针对这个数据库的权限 
-- 如果在终端连接mysql时需要
mysql -u root -p  
-- 查看用户权限
SELECT user, host FROM mysql.user WHERE user  root;可以看的出来root有他的访问权限,如过没有localhost或者% 说明没有访问权限 
添加…            
建站知识
2025/10/30 20:39:25
 

