相关文章
DeepSpeed 使用 LoRA 训练后文件结构详解
DeepSpeed 使用 LoRA 训练后文件结构详解 
在大语言模型(LLM)的训练过程中,DeepSpeed 提供了强大的分布式训练能力,而 LoRA(Low-Rank Adaptation)通过参数高效微调技术显著减少了资源占用。完成训练后&…            
建站知识
2025/10/29 6:39:58
MIT实验笔记冲刺3:页表操作(理论部分)
目录 分页硬件 
内核地址空间 
代码:创建地址空间 
物理内存分配 
代码:物理内存分配器 
进程地址空间 
代码:sbrk 
代码:exec 
实际的操作系统 这个实验将重点放到了我们的页表上,实际上,页表在我们上一个…            
建站知识
2025/10/28 17:15:11
米尔电子 瑞米派 烧写米尔官方ubuntu系统镜像
链接https://down.myir-tech.com/RemiPi/ 
硬件接口如下 确认拨码开关: 连接电源和串口 
按照绿色 白色 黑色连接串口线,打开串口后上电 烧写: 
1.烧写bootloader至emmc 
将拨码开关拨动至下载模式(0010): 连接串口至J…            
建站知识
2025/10/28 16:26:48
穷举vs暴搜vs深搜vs回溯vs剪枝系列一>组合
题目:  解析:  代码:  private List<List<Integer>> ret;private List<Integer> path;private int n,k;public List<List<Integer>> combine(int _n, int _k) {n  _n;k  _k;path  new ArrayList<>();ret…            
建站知识
2025/10/28 20:41:10
Bash Shell知识合集
1. chmod命令 
创建一个bash shell脚本 hello.sh 
~script $ touch hello.sh脚本创建完成后并不能直接执行,我们要用chmod命令授予它可执行的权限: 
~script $ chmod 755 hello.sh授权后的脚本可以直接执行: 
~script $ ./hello.sh2.指定运行…            
建站知识
2025/10/28 15:09:42
numpy的repeat和pytorch的repeat区别
在项目中发现这两个同名的函数的效果不一样,下面简单介绍: 
numpy的repeat 
a  np.array([1,2,3])  
print(a, a)  ## 结果为123
b  a.repeat(3)
print(b)  ## 结果为111222333pytorch的repeat和repeat_interleave 
labels  np.array([1,2,3])
labels  t…            
建站知识
2025/10/29 0:22:35
 

