我的梦想
不是每个人都应该像我这样去建造一座水晶大教堂,但是每个人都应该拥有自己的梦想,设计自己的梦想,追求自己的梦想,实现自己的梦想。梦想是生命的灵魂,是心灵的灯塔,是引导人走向成功的信仰。有了崇高的梦想,只要矢志不渝地追求,梦想就会成为现实,奋斗就会变成壮举,生命就会创造奇迹。——罗伯·舒乐
为 Hexo 实现可折叠内容块:从功能开发到深挖 ERR_ASSERTION 崩溃 为 Hexo 实现可折叠内容块:从功能开发到深挖 ERR_ASSERTION 崩溃
本文记录了为博客新增 details 折叠标签的完整过程——从功能实现、样式定制,到排查一个深藏在 Hexo 渲染管道中的 ERR_ASSERTION 崩溃,以及最终定位到一个几乎不可能通过猜测发现的根本原因。 阅读说明:本文在描述 He
2026-04-04
博客工程全解析:项目结构与自定义样式指南 博客工程全解析:项目结构与自定义样式指南
本博客基于 Hexo 8 静态站点生成器与 hexo-theme-matery 主题构建,托管于 GitHub Pages。本文完整梳理项目的目录结构、核心配置文件、写作规范,以及如何通过自定义样式与脚本对博客进行二次开发。 1. 项目总
2026-04-04
Chapter1 数据预处理与特征工程 Chapter1 数据预处理与特征工程
1.用户行为日志字段在推荐系统中,数据决定了模型效果的上限。用户行为日志(User Behavior Logs)不仅是训练数据的来源,更是理解用户意图的唯一窗口。 1. 核心字段总览表 字段类别 关键字段 含义 面试深度视角 (De
2026年4月 日记 2026年4月 日记
4.03 FridayDone: 把Inference-Time Scaling实验跑完了,没想到自己改进的效果提升了不少。 4.04 Saturday心情 =.=一觉醒来11点半….. Done: 做完了演讲用的Slide:) 把Com
2026-04-01
Chapter4 强化学习 RLHF Chapter4 强化学习 RLHF
我们可以把 RLHF 看作是将人类的“价值观”和“偏好”量化为奖励信号,并指导模型进化的过程。 RLHF (Reinforcement Learning from Human Feedback)的三大阶段1. 监督微调 (SFT - Sup
Chapter3 对比学习BYOL, SimSiam Chapter3 对比学习BYOL, SimSiam
BYOL (Bootstrap Your Own Latent)1. 核心理念BYOL 证明了在完全没有负样本(Negative Pairs)的情况下,通过构建非对称结构(Asymmetric Architecture)和预测机制,也能实现
Chapter2 对比学习(Contrastive Learning)的核心机理 Chapter2 对比学习(Contrastive Learning)的核心机理
深度进阶:对比学习(Contrastive Learning)的核心机理对比学习的核心思想是 “Instance Discrimination” (个体判别):通过构造正负样本对,在无标注数据下学习“物以类聚,人以群分”的特征表示。 1.
Chapter1 相似度度量(Similarity Measures) Chapter1 相似度度量(Similarity Measures)
相似度度量(Similarity Measures)1. 欧氏距离 (Euclidean Distance) —— 绝对位置的度量欧氏距离是最基础的 $L_2$ 范数。它衡量的是 $n$ 维空间中两个点之间的直线距离。 数学表达d(\mat
Grab the Seat! Grab the Seat!
题目大意二维平面,屏幕是$(0, 1)–(0, m)$的线段,有$n$行$m$列座位在屏幕前面,是坐标范围$1 ≤ x ≤ n, 1 ≤ y ≤ m$的整点。有$k$个座位已经有人,求出到屏幕的视线不被任何人挡住的座位数量。题目链接一个人挡
2022-07-21
浅谈博弈论-ICG篇 浅谈博弈论-ICG篇
公平组合游戏(ICG)定义游戏由同样很聪明的两个人 参与,二者轮流做出决策,且都会做出最有利于自己的决策,当有一人无法做出决策时(即无法行动)游戏结束,无法做出决策的人输。无论二者如何做出决策,游戏可以在有限步内结束。游戏中的同一个状态不可
2021-05-10
1 / 3