相关文章
DeepSeek蒸馏模型:轻量化AI的演进与突破
目录 引言
一、知识蒸馏的技术逻辑与DeepSeek的实践
1.1 知识蒸馏的核心思想
1.2 DeepSeek的蒸馏架构设计
二、DeepSeek蒸馏模型的性能优势
2.1 效率与成本的革命性提升
2.2 性能保留的突破
2.3 场景适应性的扩展
三、应用场景与落地实践
3.1 智能客服系统的升级
3.2…
建站知识
2025/5/1 13:55:08
DeepSeek本地部署的一些使用体会
春节期间我也尝试了一下Deepseek的本地部署,方案选用了Ollama Chatbox或AnythingLLM。Chatbox里有很多有意思的“助手”,而AnythingLLM支持本地知识库。
网上教程很多,总的来说还是很方便的,不需要费太多脑子。甚至可以这么说&a…
建站知识
2025/4/30 0:30:29
MySQL锁类型(详解)
锁的分类图,如下: 锁操作类型划分 读锁 : 也称为共享锁 、英文用S表示。针对同一份数据,多个事务的读操作可以同时进行而不会互相影响,相互不阻塞的。 写锁 : 也称为排他锁 、英文用X表示。当前写操作没有完成前,它会…
建站知识
2025/4/29 20:54:40
深度优先搜索 DFS
深度优先搜索
如图所示,深度优先搜索DFS对新节点立即执行搜索,因此新节点都向下一层。 而广度优先搜索BFS先用队列存储新节点,等当前层的新节点都搜索完毕之后再搜索下一层节点。 图片链接
leetcode695
分析
使用2个函数。主函数统计比较…
建站知识
2025/4/29 21:00:10
51单片机入门_05_LED闪烁(常用的延时方法:软件延时、定时器延时;while循环;unsigned char 可以表示的数字是0~255)
本篇介绍编程实现LED灯闪烁,需要学到一些新的C语言知识。由于单片机执行的速度是非常快的,如果不进行延时的话,人眼是无法识别(停留时间要大于20ms)出LED灯是否在闪烁所以需要学习如何实现软件延时。另外IO口与一个字节位的数据对应关系。 文…
建站知识
2025/5/4 1:18:04
【MySQL — 数据库基础】深入解析MySQL的约束操作
1. 什么是数据库约束 2. 约束类型 3. NOT NULL 非空约束 定义非空约束 定义表时某列不允许为NULL时,可以为列添加非空约束。 创建学生表,id 和 name 约束为 not null,确保每一行插入的学生数据都是完整有效的 创建约束学生表
cre…
建站知识
2025/4/29 15:50:47
Spring 面试题【每日20道】【其三】
1、Spring 中的 Profile 注解的作用是什么? 中等
Profile 注解在Spring框架中用于根据不同的环境配置文件(profiles)来激活或忽略某些Bean的注册。它允许开发者定义逻辑以区分不同环境下的bean定义,例如开发、测试和生产环境。
…
建站知识
2025/5/1 20:22:44
100.4 AI量化面试题:如何设计一个基于强化学习的交易系统?
目录 0. 承前1. 环境设计1.1 交易环境定义1.2 状态空间设计 2. 动作系统设计2.1 动作空间定义2.2 交易执行模块 3. 奖励函数设计3.1 多因素奖励计算 4. 强化学习模型4.1 DQN模型实现 5. 回测与评估系统5.1 性能评估模块 6. 回答话术 0. 承前 本文将详细介绍如何设计和实现一个基…
建站知识
2025/4/30 5:32:32