相关文章
RAG架构中用到的模型学习思考
前言
RAG(Retrieval-Augmented Generation,检索增强生成)架构结合了检索和生成能力,通过引入外部知识库来提升大语言模型(LLM)的回答准确性和可靠性。以下是RAG架构中常用的模型及其总结: 一、…
建站知识
2025/6/5 5:12:51
Pytorch的梯度控制
在之前的实验中遇到一些问题,因为之前计算资源有限,我就想着微调其中一部分参数做,于是我误打误撞使用了with torch.no_grad,可是发现梯度传递不了,于是写下此文来记录梯度控制的两个方法与区别。
在PyTorch中&#x…
建站知识
2025/6/7 11:13:04
PyTorch--池化层(4)
池化层(Pooling Layer) 用于降低特征图的空间维度,减少计算量和参数数量,同时保留最重要的特征信息。
池化作用:比如1080p视频——720p 池化层的步长默认是卷积核的大小
ceil 允许有出界部分;floor 不允许…
建站知识
2025/6/5 5:10:40
123网盘SDK-npm包已发布
前言
大家好!今天想和大家分享一个我最近开源的项目:123 网盘 SDK。这个项目已经在 GitHub 开源,最近已经发布到 NPM,可以通过 npm i ked3/pan123-sdk 直接安装使用。
项目背景:为什么要开发这个 SDK?
在…
建站知识
2025/6/7 17:47:44
PyTorch——卷积操作(2)
二维矩阵 [[ ]] 这里面conv2d(N,C,H,W)里面的四个是 N就是batch size也就是输入图片的数量,C就是通道数这只是一个二维张量所以通道为1,H就是高,W就是宽,所以是1 1 5 5
卷积核 reshape 第一个参数是batch size样本数量 第二个参数…
建站知识
2025/6/5 5:08:34
无他相机:专业摄影,触手可及
在数字摄影时代,手机摄影已成为许多人记录生活、表达创意的重要方式。无他相机正是这样一款专为摄影爱好者设计的相机应用程序,它不仅提供了专业级摄影设备的大部分功能,还通过简洁直观的操作界面,让每一位用户都能轻松上手&#…
建站知识
2025/6/7 12:44:24
使用Redis的四个常见问题及其解决方案
Redis
缓存穿透 定义:redis查询一个不存在的数据,导致每次都查询数据库 解决方案: 如果查询的数据为空,在redis对应的key缓存空数据,并设置短TTL。 因为缓存穿透通常是因为被恶意用不存在的查询参数进行压测攻击&…
建站知识
2025/6/5 5:06:20
Linux运维笔记:1010实验室电脑资源规范使用指南
文章目录 一. 检查资源使用情况,避免冲突1. 检查在线用户2. 检查 CPU 使用情况3. 检查 GPU 使用情况4. 协作建议 二. 备份重要文件和数据三. 定期清理硬盘空间四. 退出 ThinLinc 时注销,释放内存五. 校外使用时配置 VPN注意事项 总结 实验室的电脑配备了…
建站知识
2025/6/7 21:09:06