个人碎碎念channel
欢迎加入聊天吹水群组https://t.me/adelesfriends
DMIT工具箱

curl -fsSL https://box.dmitstock.com | bash
从零构建一个微型vLLM:深入探究大语言模型推理优化 | github

这篇文章用“从零做一个迷你 vLLM”的方式,解释高性能大模型推理引擎在工程上到底优化了什么。作者实现了一个教学向的最小版本 nano-vllm,把 vLLM 常见的关键技术拆开讲清楚,并给出模块化代码结构,方便读者对照理解。
Aayush Garg 撰写的一篇发表在huggingface博客上的技术教程,《PPO From First Principle》(从第一性原理看 PPO)。

该项目的核心目的是摒弃高级封装库(如 Stable Baselines3),完全从零开始用 PyTorch 实现 PPO(Proximal Policy Optimization,近端策略优化)算法,以帮助读者深入理解其底层数学原理和代码逻辑。

很多开发者只会调用现成的 RL 库,但不理解算法内部发生了什么。这篇文章会打破这种黑盒,通过手写每一行核心代码来揭示 PPO 的工作机制 。PPO 是目前最流行的强化学习算法之一(也是 ChatGPT 等大模型 RLHF 阶段背后的核心算法),因为它在实现简单性、样本效率和性能之间取得了很好的平衡 。
OpenCode中文实战课

OpenCode 中文实战课源码与内容仓库:一课一页,覆盖入门到实战工作流。

内容主要面向初学者和非技术人员。
一个专门给科研工作者的Claude Code Skill项目

项目期望可将 Claude 转变为全能的 AI 科研助手。该项目收集了 140 多个 现成的科学类(Skills),使 Claude 能够执行跨生物学、化学、医学、物理学等多个领域的复杂多步骤科研工作流。

核心目标是加速科学研究,让研究人员无需查阅繁琐的 API 文档或从头编写集成代码。

支持通过简单的自然语言指令执行复杂的任务(例如:“查询 ChEMBL 数据库寻找 EGFR 抑制剂,用 RDKit 分析构效关系,并生成报告”)。
从零开始构建智能体》从基础理论到实际应用,全面掌握智能体系统的设计与实现

Hello-Agents 是 Datawhale 社区的系统性智能体学习教程。如今 Agent 构建主要分为两派,一派是 Dify,Coze,n8n 这类软件工程类 Agent,其本质是流程驱动的软件开发,LLM 作为数据处理的后端;另一派则是 AI 原生的 Agent,即真正以 AI 驱动的 Agent。

本教程旨在带领大家深入理解并构建后者——真正的 AI Native Agent。教程将带领你穿透框架表象,从智能体的核心原理出发,深入其核心架构,理解其经典范式,并最终亲手构建起属于自己的多智能体应用。我们相信,最好的学习方式就是动手实践。希望这本教程能成为你探索智能体世界的起点,能够从一名大语言模型的"使用者",蜕变为一名智能体系统的"构建者"。

你将收获什么?
📖 Datawhale 开源免费 完全免费学习本项目所有内容,与社区共同成长
🔍 理解核心原理 深入理解智能体的概念、历史与经典范式
🏗 亲手实现 掌握热门低代码平台和智能体代码框架的使用
🛠 自研框架HelloAgents 基于 Openai 原生 API 从零构建一个自己的智能体框架
⚙️ 掌握高级技能 一步步实现上下文工程、Memory、协议、评估等系统性技术
🤝 模型训练 掌握 Agentic RL,从 SFT 到 GRPO 的全流程实战训练 LLM
🚀 驱动真实案例 实战开发智能旅行助手、赛博小镇等综合项目
📖 求职面试 学习智能体求职相关面试问题
Back to Top