hexo常见问题
hexo 命令1234567hexo clearhexo generatehexo deployhexo see # 预览hexo n 文件名 # 创建新的post
文章目录序号问题
根目录下找到”_config.butterfly.yml”
更改toc: 下面的number属性为false
关于latex公式渲染问题
参考链接:
butterfly主题插入数学公式LaTeX_hexo butterfly 公式-CSDN博客
Hexo-Butterfly主题的文章如何嵌入数学公式 | InsectMk的个人空间
Butterfly 文檔(三) 主題配置 | Butterfly
DeepSeek+LoRA+FastAPI
(该页面的 .md 和 .pdf 文件已放在视频简介,.md 文件可用该软件 (Obsidian) 或用 VS Code打开)
简介本期视频主要分为以下五部分:
需求和技术
企业对于大模型的不同类型个性化需求
SFT(有监督微调)、RLHF(强化学习)、RAG(检索增强生成)-关注:基本概念;分别解决什么问题;如何根据需求选择;
微调部分详细介绍:
微调算法的分类
**LoRA 微调算法
微调常见实现框架
整体步骤说明
在 Linux 系统上微调一个大模型、部署模型、暴露 API 给 web 后端调用,本机前端展示全过程
模型微调
框架: LLama-Factory (国产最热门的微调框架)
算法: **LoRA (最著名的部分参数微调算法)
基座模型:DeepSeek-R1-Distill-Qwen-1.5B-蒸馏技术通常用于通过将大模型(教师模型)的知识转移到小模型(学生模型)中,使得小模型能够在尽量保持性能的同时,显著减少模型的参数量和计算需求。
模型部署和暴露接口
框架:FastAPI(一个基于 python 的 web 框架)
web后端调用
通过 HTTP 请求 ...
AI基础概念
Prompt,Agent,MCP是什么prompt分为
system prompt
角色、性格、背景知识、语气
user prompt
例如:
在网页端的聊天中,System prompt往往是系统预设的,用户不能随便更改。但是通常来讲,网站会提供一些设置,比如ChatGPT里有一个叫做Customize ChatGPT的功能,用户可以在里面写下自己的偏好,这些偏好就会变成System prompt的一部分。
AI Agent这种负责在模型、工具和最终用户之间传话的程序,叫做AI Agent。而这些提供给AI调用的函数或者服务,就叫做Agent Tool。
不过这种结构可能有一个小问题。虽然在System Prompt里面写清楚了AI应该用什么格式返回,但是AI模型说到底是一个概率模型,还是有可能返回不对的内容。为了处理这些“不听话”的情况,很多AI Agent会在发现返回格式不对时,自动进行重试。
现在市面上很多知名的Agent,比如Cline依然采用这种方式,这种反复的重试,人们总会觉得不太靠谱。于是大模型厂商开始出手了,ChatGPT、Claude、Gemini等等纷 ...
多模态技术基础
多模态深度学习技术基础多模态任务图文跨模态检索图像描述视觉问答文本生成图像指称表达文本表示基于词嵌入的静态词表示词嵌入是指使用模型将语料中的每个词映射为一个低维、稠密、连续的向量的技术
Word2VecWord2Vec指一类神经网络语言模型,其中又分为两种CBOW和Skip-gram
导入——语言模型
语言模型分为统计语言模型和神经网络语言模型
统计语言模型:n-gram模型
神经网络语言模型:NNLM模型
CBOW和Skip-gram
CBOW:通过上下文来预测当前词
Skip-gram:用当前词来预测上下文
Word2Vec和NNLM的区别
NNLM的模型结构:
对于语言模型,目的是想预测的更准确,而词向量矩阵知识一个副产品。
NNLM:重点是预测下一词,双层感知机$softmax(w_2(tanh(w_1 (xQ) +b_1))+b_2)$
Word2Vec:CBOW和Skip-gram的两种架构的重点都是得到一个$Q$矩阵,$softmax(w_1(xQ)+b_1)$
Word2Vec的缺点
词向量不能表示多义—>ELMO
GloVe基于循环神经网络的动 ...
PyTorch函数
图像和视觉处理123torchvision.transforms.Resize() # 改变图像大小torchvision.transforms.Normalize() # 标准化图像数据torchvision.datasets # 提供常见的图像数据集加载接口
神经网络构建1234torch.nn.Linear() # 全连接层torch.nn.Conv2d() # 2D卷积层torch.nn.ReLU() # ReLU激活函数torch.nn.Sigmoid() # Sigmoid激活函数
训练和优化1234# 常见的优化器torch.optim.Adam(model.parameters(), lr=0.001)torch.optim.SGD(model.parameters(), lr=0.001, momentum=0.9)torch.autograd.backward(model.parameters()) # 自动计算梯度
模型保存和加载123# 用于保存和加载模型或张量torch.save(model.state_dict(), 'model.pt& ...
推荐系统学习笔记
小红书的推荐系统曝光→点击,停留几秒(说明不是误点)→阅读→点赞收藏转发评论
转化流程
(抖音没有下滑和点击)
(短期)消费指标
(不是衡量推荐系统好坏的根本指标)
北极星指标
(最关键的指标,衡量好坏的根本标准)
通常来讲,点击率、点赞率与使用时长和阅读数量的涨跌是一致的,万一有冲突,以北极星指标为准。
希望推荐系统能激励作者发布,让我们的内容池变大,优质内容池是核心竞争力;激励发布通常是由冷启动负责(后面再讲冷启动)
实验流程算法工程师的工作:对模型、特征、策略、系统做改进
离线实验的结果有参考价值,能大致反映出算法的好坏;但是离线实验并没有线上实验可靠,想最终判断算法的好坏还是需要做线上实验。
北极星指标都是线上指标,只能通过线上实验获得,做离线实验无法得到。
具体做法是开小流量AB测试,把用户随机分为实验组和对照组,实验组用新策略,对照组用就策略;对比两者的业务指标,判断新策略是否会显著由于旧策略;如果新策略显著优于旧策略,可以加大流量,最终推全
推荐系统链路
例如,小红书有上亿篇笔记,当刷新小红书的时候,系统会调用几十条召回通道,每条召回通道会取回几十到几百篇笔记,一共取回 ...
JS学习笔记
JavaScript 基础 - 第1天
了解变量、数据类型、运算符等基础概念,能够实现数据类型的转换,结合四则运算体会如何编程。
体会现实世界中的事物与计算机的关系
理解什么是数据并知道数据的分类
理解变量存储数据的“容器”
掌握常见运算符的使用,了解优先级关系
知道 JavaScript 数据类型隐式转换的特征
介绍
掌握 JavaScript 的引入方式,初步认识 JavaScript 的作用
引入方式JavaScript 程序不能独立运行,它需要被嵌入 HTML 中,然后浏览器才能执行 JavaScript 代码。通过 script 标签将 JavaScript 代码引入到 HTML 中,有两种方式:
内部方式通过 script 标签包裹 JavaScript 代码
12345678910111213<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <title>JavaScript 基础 - 引入 ...
HTML+CSS学习笔记
h5(html5)+css3+移动端第一部分 基础知识1. 网页1.1 什么是网页网页是构成网站的基本元素
元素:文字 声音 视频 链接
后缀名:.htm 或者 .html (俗称HTML文件)
1.2 什么是HTML(重点)HTML指的是超文本标记语言(Hyper Text Markup Language),用来描述网页的一种语言。
HTML不是一种编程语言,而是一种标记语言(markup language)
标记语言是一套标记标签(markup tag)
超文本有两层含义:
可以加入图片,声音,动画,多媒体等内容(超越了文本限制)
从一个文件跳转到另一个文件,与世界各地的文件连接(超级链接文本)
1.3 网页的形成网页由网页元素组成,这些元素是利用html标签描述出来,然后通过浏览器解析来显示给用户的。
前端人员开发代码——>浏览器显示代码(解析,渲染)——>生成最后的Web页面
1.4 网页总结网页是由图片,链接,文字,声音,视频等元素组成,其实就是一个html文件(.htm或者.html)
网页生成制作:有前端人员书写HTML文件,然后浏览器打开,就能看到网页。 ...
机器学习
机器学习初步机器学习经典定义:利用经验改善系统自身的性能[T.Mitchell 教科书,1997]
典型的机器学习过程
机器学习有坚实的理论基础计算学习理论(Computational learning theory)
最重要的理论模型:
PAC(Probably Approximately Correct,概率近似正确)learning model [Valiant, 1984]
P(|f(x)-y|\leq\epsilon)\geq1-\delta基本术语
instance是没有结果的;example是有结果的
假设(hypothesis):
f(x)
真相(ground-truth):
y
学习器(learner):学到的模型
关于输出部分的术语:
分类,回归
二分类,多分类
正类,反类
正类不一定就是好西瓜,坏西瓜也可能是正类。这只是对A和B的一种抽象的说法。
通常认为这两类是可交换的。
可交换意味着这两类满足的很多性质是差不多的,比如在数据集里,这两类的比例是差不多的。
关于学习任务:
监督学习(supervised learning):样例有结果 ...
Missing Semester学习笔记
The Missing Semester of Your CS Education第1讲 - 课程概览与 shell第2讲 - Shell 工具和脚本1234567foo=barecho $foofoo = bar(不能运行,空格!!!有空格要用引号)echo "Hello"echo 'World'echo "Value is $foo" (输出为 Value is bar)echo 'Value is $foo' (输出为 Value is $foo)
1234vim mcd.shsource mcd.shmcd testcd ..
12345# mcd.sh的内容mcd (){ mkdir -p "$1" cd "$1"}
1234567# $0 是文件的名字# $1到$9 是第1到9个参数# $_ 是上一条命令的最后一个参数rmdir testmkdir testcd $_ # 然后进入test目录cd ..
123# "!!&q ...
