相关文章
【深度学习之四】知识蒸馏综述提炼
知识蒸馏综述提炼 目录
知识蒸馏综述提炼
前言
参考文献
一、什么是知识蒸馏?
二、为什么要知识蒸馏?
三、一点点理论
四、知识蒸馏代码 总结 前言
知识蒸馏作为一种新兴的、通用的模型压缩和迁移学习架构,在最近几年展现出蓬勃的活力…
建站知识
2025/7/4 19:49:19
GEE计算 RSEI(遥感生态指数)
🛰️ 什么是 RSEI?为什么要用它评估生态环境?
RSEI(遥感生态指数,Remote Sensing Ecological Index) 是一种通过遥感数据计算得到的、综合反映区域生态环境质量的指标体系。
它的设计初衷是用最少的变量&…
建站知识
2025/7/6 2:47:51
LLM笔记(六)线性代数
公式速查表
1. 向量与矩阵:表示、转换与知识存储的基础
向量表示 (Vectors): 语义的载体
在LLM中,向量 x ∈ R d \mathbf{x}\in\mathbb{R}^d x∈Rd 是信息的基本单元,承载着丰富的语义信息:
词嵌入向量 (Word Embeddings)&am…
建站知识
2025/7/7 13:33:26
python Excel操作,将一个工作表中的sheet页复制到另一个工作表中(包括单元格的内容、样式、格式等)
使用内存中的文件对象 将数据写入内存中的 Excel 文件 将内存中的文件保存到指定路径 原理:
pd.ExcelWriter() 本身创建的是一个 ExcelWriter 对象,它可以将多个 DataFrame 写入同一个 Excel 文件。你可以通过指定文件对象(如 BytesIO&…
建站知识
2025/7/6 9:43:06
从代码学习深度学习 - 全卷积神经网络 PyTorch版
文章目录 前言全卷积网络 (FCN) 简介构造模型加载预训练的 ResNet-18修改网络结构添加1x1卷积层和转置卷积层初始化转置卷积层:双线性插值读取数据集训练预测与可视化总结附录:工具函数代码utils_for_data.pyutils_for_huitu.pyutils_for_train.py前言
欢迎来到我们的深度学…
建站知识
2025/7/4 19:00:52
【LLM】大模型算力基础设施——核心硬件GPU/TPU,架构技术NVLink/RDMA,性能指标FP64/FLOPS(NVIDIA Tesla型号表)
【LLM】大模型算力基础设施——核心硬件GPU/TPU,架构技术NVLink/RDMA,性能指标FP64/FLOPS(NVIDIA Tesla型号表) 文章目录 1、核心硬件GPU/TPU,NVIDIA Tesla2、集群架构设计 NVLink / RDMA / Alluxio3、性能关键指标&am…
建站知识
2025/7/8 11:25:58
Mac的web服务器
最近用了个人觉得比较好用的集成环境。Flyenv - FlyEnv | 一体化全栈环境管理工具. 支持macOS / Windows / Linux 链接放在这了。
mac上安装:
brew install flyenv
等着安装成功就好了
给个图。ollama也有
建站知识
2025/7/8 20:14:08