相关文章
大模型领域的Scaling Law的含义及作用
Scaling Law就像是一个“长大公式”,用来预测当一个东西(比如模型)变大(比如增加参数、数据量)时,它的性能(比如准确率)会怎么变化。
它能帮助我们提前知道,增加多少资源…
建站知识
2025/5/6 13:59:17
【开发和生产环境配置】
开发和生产环境配置 开发环境.env.development axios中使用vite.config.ts配置代理 开发环境 .env.development
# 变量必须以 VITE_ 为前缀才能暴露给外部读取
NODE_ENV development
VITE_APP_TITLE 测试环境
VITE_SERVE http://127.0.0.1:8080
VITE_APP_BASE_API /apiaxi…
建站知识
2025/5/1 3:01:47
来自deepseek的自我介绍
DeepSeek-V3是杭州深度求索人工智能基础技术研究有限公司于2024年12月26日发布的混合专家(MoE)语言模型。以下是关于它的详细介绍:
### 技术架构
- **基本架构**:基于Transformer框架搭建,采用多头潜在注意力&#x…
建站知识
2025/5/1 3:27:20
Deepseek:网页版OR本地部署版本?
使用本地部署的 DeepSeek 还是网页版的 DeepSeek,取决于具体需求和使用场景。以下是两者的对比及推荐建议:
响应速度
网页版 DeepSeek:响应速度受网络状况和服务器负载影响较大。如果网络不稳定或服务器繁忙,可能会出现延迟甚至…
建站知识
2025/5/1 3:25:56
【数据结构与算法】力扣 5. 最长回文子串
题目描述
5. 最长回文子串
给你一个字符串 s,找到 s 中最长的 回文子串。
示例 1:
输入: s "babad"
输出: "bab"
解释: "aba" 同样是符合题意的答案。示例 2:
输入&am…
建站知识
2025/5/1 3:00:22