打赏

相关文章

调研大语言模型的知识编辑技术

一、大语言模型知识编辑原理 大语言模型(LLMs)的知识编辑旨在通过高效、精准的方式修改模型内部存储的特定知识,以纠正错误、更新信息或消除偏见,同时保持模型的通用能力。其核心原理可分为三类: 参数修改&#xff1…

单卡4090微调大模型 DeepSeek-R1-32B

之前文章同样的方法,也可以在 24G 显存的单卡 4090 上微调训练 deepseek-ai/DeepSeek-R1-Distill-Qwen-32B;即使该模型的权重文件大小已经达到 62G,这是因为 unsloth 和 lora 的量化微调和部分参数微调优化可以大幅节约显存占用。 上篇文章的…

HarmonyOS:使用geoLocationManager (位置服务)获取位置信息

一、简介 位置服务提供GNSS定位、网络定位(蜂窝基站、WLAN、蓝牙定位技术)、地理编码、逆地理编码、国家码和地理围栏等基本功能。 使用位置服务时请打开设备“位置”开关。如果“位置”开关关闭并且代码未设置捕获异常,可能导致应用异常。 …

计算机网络分层模型:架构与原理

前言 计算机网络通过不同的层次结构来实现通信和数据传输,这种分层设计不仅使得网络更加模块化和灵活,也使得不同类型的通信能够顺利进行。在网络协议和通信体系中,最广为人知的分层模型有 OSI模型 和 TCP/IP模型。这两种模型分别定义了计算…

Before After:SQL整容级优化

首先说明这个优化有一定提升,但不是我所期望的 我接到一个涉及优化的SQL,具体内容实在太长。而且可能也不利于阅读。于是我脱敏以及简化一下。SQL中间大量的充斥着 (select 列名1 from t1 where t1.id t2.id ) A, (select 列名2 from t1 where t1.id …

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部