AI – Co's fossula

基于Flow Matching的扩散模型Forward、Inverse原理及代码

Stable Diffusion 3及3.5开始，包括flux编辑模型，都不再采用传统DDPM的噪声扩散模式，而是采用流匹配的形式。Flow Matching总结是：简单有效。这篇文章里都采用sd3.5作为backbone进行研究。原理 Flow Matching 核心机制 —— 从“预测噪声”到“预测速度场” 在 SD 1.5 和 SDXL …

2026-3-12 11:53

|

计算机视觉

2334 字

|

23 分钟

DDPM Flow Matching stable diffusion

DPO微调

https://arxiv.org/pdf/2305.18290 DPO的核心 DPO核心创新在于将"语言模型暗藏着奖励模型"这一理论洞见转化为实用的训练方法，使得模型对齐过程变得更加简单、高效和稳定。 DPO如何解决RLHF的核心问题 DPO（直接偏好优化）通过以下方式简化和解决RLHF的问题：数学转换：DPO发现了一种巧妙的数学变换，将RLH…

2025-9-16 14:44

|

强化学习

1028 字

|

5 分钟

再战机器学习——手撕算法（找工作篇）

K-Means 模板题：K-Means Clustering def k_means_clustering(points: list[tuple[float, float]], k: int, initial_centroids: list[tuple[float, float]], max_iterations: …

2025-5-02 23:30

|

机器学习

639 字

|

8 分钟

再战机器学习——决策树（找工作篇）

决策树一般的三种算法：ID3，C4.5，CART。 ID3 sklearn手搓 # from sklearn.metric import accuracy_score import numpy as np import pandas as pd from sklearn.datasets import load_iris datas=load_ir…

2025-4-29 22:35

|

机器学习

108 字

|

4 分钟

ID3 决策树

深度学习——手撕Transformer（找工作篇）

参考链接 https://hwcoder.top/Manual-Coding-1 单头注意力机制 Q, K, V的理解。假设Q由如下矩阵组成（不考虑batchsize）：Q[0]：词1：[dim1, dim2, dim3...] Q[1]：词2：[dim1, dim2, dim3...] 同理K： K[0]：词1：[dim1, dim2, dim…

2025-4-17 12:02

|

深度学习

1071 字

|

23 分钟

attention transformer

Chapter-6,7

分类问题 Logistic Regression：其实是classfication问题，不是Regression问题。过度拟合避免过度拟合，可以在代价函数中给予惩罚项。参数值一定要选合适的，否则可能依然过度拟合或者基本没拟合bias较大。

2023-2-13 18:08

|

机器学习

81 字

|

1 分钟内

Chapter-5

编程章节，代码和作业在jupyter上

2023-2-12 17:03

|

机器学习

30 字

|

几秒读完

Chapter-4

解代价函数有两种方法：梯度下降法和正规方程解法。各有特点两者的特点正规方程在矩阵不可逆的情况：变量间线性相关

2023-2-10 14:05

|

机器学习

58 字

|

几秒读完

Chapter-3

jupyter notebook有求逆

2023-2-05 18:46

|

机器学习

135 字

|

1 分钟内

Chapter-2

2-1模型描述单变量线性回归 2-2代价函数最小化方差。代价函数=$min\sum_{i=1}^{n}(h_\theta (x^i)-y^i)$ 2-3,2-4代价函数由图可以看出$\theta_1$取1时代价函数取得最小值二元代价函数图 2-5梯度下降常规算法，不仅用在线性回归，还用在很多机器学习中一直梯度下降直到收敛梯度下降过程中…

2023-2-04 18:42

|

机器学习

217 字

|

1 分钟内

分类： AI