Deep Learning & LLM R&D Practice

深度学习和 AI大模型研发实战

从NLP基础到大模型微调、多模态与智能体研发的完整实战路径

8天64课时，系统覆盖 PyTorch、CNN、LSTM、Transformer、BERT、向量数据库、LangChain 1.0、LangGraph、RAG、QLORA、Hugging Face、Cursor、Claude Code 和多模态模型研发。

Transformer / BERT LangChain 1.0 / Agent RAG / 向量数据库 Hugging Face / Cursor 微调 / 多模态

查看8天学习路径查看项目实战

8天系统研发训练

64课时理论 + 实战闭环

NLP基础词向量、分类、语言模型

LLM应用RAG、Agent、LangChain

工程实战微调、多模态、AI编码

Course Overview

面向AI研发与大模型应用工程的系统化课程

课程从自然语言处理基础出发，逐步进入深度学习框架、Transformer、BERT及其变体、向量数据库、LangChain 1.0、智能体开发、RAG、QLORA、大模型微调和多模态模型训练。

课程强调理论学习与实战案例结合，帮助学员建立从模型理解、数据处理、框架开发、工程部署到项目落地的完整知识结构。

深度学习和AI大模型研发实战浅色科技主视觉 — 主视觉覆盖 Transformer 架构、RAG 工作流、LangChain Agent、向量数据库、训练流水线、微调评估、多模态和代码研发平台。

Program Info

课程信息一览

课程适合希望进入深度学习、NLP、大模型开发和智能体应用工程的技术人员。

课程安排

8天课程，64课时，小班精讲，配合案例分析、操作演示、练习实践和课堂答疑。

学员对象

适合开发者、数据分析师，以及对AI深度学习、NLP和大模型研发感兴趣的人群。

基础要求

需要具备Python编程能力，熟悉核心语法和数据分析方法，并理解统计、机器学习与深度学习基本概念。

课后服务

1年内提供课程答疑、课件资料升级分享、录播回看和免费重修。

Course Features

课程特色：从模型原理到工程项目落地

课程不是单点工具学习，而是覆盖NLP、深度学习、LLM应用框架、智能体、多模态和微调训练的研发链路。

NLP基础扎实

从文本预处理、语言模型、词嵌入、文本分类和朴素贝叶斯进入自然语言处理。

深度学习框架实战

学习 PyTorch、TensorFlow、CNN1D、RNN/LSTM 和 GPU 环境配置。

Transformer核心模型

系统拆解注意力机制、多头注意力、编码器、解码器、BERT及变体。

LLM应用工程

覆盖 LangChain 1.0、LangGraph、LangSmith、Agent、工具调用、记忆管理和部署上线。

多模态与微调

引入LLaVA、Stable Diffusion、视觉多模态、YOLO/OCR、PEFT和垂直领域模型训练。

Technology Tracks

覆盖大模型研发的关键技术体系

从算法模型到应用框架，从数据检索到智能体工作流，从AI编码到模型微调。

AI研发全链路

课程将基础模型、应用框架、工程工具和真实项目串成一条路径，让学员理解“模型怎么来、如何用、如何调、如何落地”。

模型基础NLP、CNN、LSTM、Transformer、BERT

数据检索向量数据库、RAG、QLORA、知识库

智能体工程LangChain、LangGraph、Agently、Agent

研发工具Hugging Face、Cursor、Claude Code

NLP与词向量

文本清洗、n-gram、神经网络语言模型、Word2Vec、GloVe、文本分类。

深度学习框架

PyTorch、TensorFlow、CNN1D、RNN/LSTM、GPU配置和模型训练评估。

Transformer与BERT

自注意力、多头注意力、MLM、NSP、BERT变体与下游任务调优。

向量数据库与RAG

Pinecone、Chroma、Milvus、Faiss、检索增强生成、回答优化与事实校验。

LangChain 1.0 / Agent

模型调用、记忆管理、工具调用、Agent中间件、Deepseek-OCR和数据分析Agent。

AI编码工具

Cursor浏览器插件、AI应用开发、代码库索引、MCP Servers、Claude Code多智能体协作。

模型微调训练

预训练、微调、PEFT、超参、训练数据选择、清洗与垂直领域大模型训练。

多模态研发

LLaVA训练、Stable Diffusion、MLLM、视觉生成、3D目标、视频生成、YOLO与OCR。

8-Day Learning Path

8天课程路径

每天围绕一个研发主题推进，从NLP基础逐步过渡到大模型应用工程和微调训练实战。

Day 1

NLP基础与贝叶斯模型

建立NLP基础认知和文本建模方法。

NLP定义、现实应用、挑战与限制。
文本预处理、文本清洗、语言模型概述。
n-gram、神经网络语言模型及其应用。
Word2Vec、GloVe、词向量应用。
文本分类与朴素贝叶斯分类器。

Day 2

CNN模型与PyTorch框架

学习深度学习框架和序列卷积模型。

深度学习与PyTorch简介，动态计算图。
CNN与CNN1D概念、用途和工作原理。
卷积层、池化层、全连接层与激活函数。
PyTorch定义CNN1D结构、数据处理、训练与评估。

Day 3

LSTM、TensorFlow与Transformer入门

进入序列建模、文本生成和Transformer基础。

RNN/LSTM、语言建模、PyTorch深度学习实战。
GPU环境配置与nvidia-smi监控。
文本分类、情感分析与文本生成。
Transformer简介、输入表示、词嵌入、位置编码、自注意力。

Day 4

Transformer模型与BERT概览

系统拆解注意力机制和BERT预训练思想。

多头注意力、Q/K/V、Softmax注意力分数。
Transformer编码器、解码器、残差连接与层归一化。
训练过程、损失函数、优化器、正则化。
BERT双向特性、MLM、NSP与预训练过程。

Day 5

BERT模型与向量数据库

学习BERT应用调优和向量检索基础设施。

BERT架构、输入表示、训练策略和下游任务。
文本分类、问答系统、命名实体识别。
RoBERTa、ALBERT、DistilBERT等变体。
Pinecone、Chroma、Weaviate、Milvus、Faiss等向量数据库。

Day 6

LangChain、Agent、QLORA与RAG

进入大模型应用框架与智能体研发。

LangChain 1.0核心模块、模型调用、记忆管理、工具调用与部署上线。
LangGraph、LangSmith、多模态RAG智能体项目。
Deepseek-OCR多模态PDF解析与自动数据分析可视化Agent。
Agently框架、决策反思、自规划、翻译Agent复现。
QLORA数据预处理、查询优化、模型训练评估。
RAG索引构建、检索相关文档、生成回答、优化与校验。

Day 7

Hugging Face、Cursor与Claude Code

掌握模型生态和AI编码研发工具。

Hugging Face Transformers、Model Hub、Tokenizer、API Key与安全配置。
Cursor安装配置、浏览器插件划词翻译实战。
Cursor高级技巧：代码库索引、AI审查、代码重构、隐私模式、Rules、MCP Servers。
综合实战：用Cursor写取名字的AI应用。
Claude Code安装、Router、SaaS模型配置、MCP与多智能体协作。

Day 8

大模型微调训练与多模态研发

完成模型训练、微调、多模态和实战案例闭环。

模型训练、预训练、微调、PEFT和关键超参。
训练数据选择、准备、清洗和垂直领域大模型训练。
智能营销推荐系统、AI数字人陪练系统案例。
MLLM定义，ViT、VisualBert、CLIP、GPT-4v发展历程。
LLaVA训练数据准备与训练过程，Stable Diffusion、3D目标、视频生成、YOLO与OCR。

Practice Projects

课程中的项目实战与交付成果

课程通过真实工程项目帮助学员将模型、框架、工具和业务应用连接起来。

CNN1D文本序列建模

使用PyTorch定义、训练和评估一维卷积神经网络。

BERT下游任务调优

在文本分类、问答、NER等任务中使用并调优BERT。

Deepseek-OCR智能体

基于LangChain 1.0完成多模态PDF解析实战。

全自动数据分析Agent

构建自动数据分析和可视化Agent系统。

本地DeepSeek决策Agent

开发能够进行决策与任务执行的智能体模块。

Cursor浏览器插件

用Cursor完成划词翻译插件，并打包分享作品。

垂直领域模型训练

掌握训练数据准备、清洗、关键超参和PEFT微调流程。

多模态AI系统案例

训练LLaVA，理解Stable Diffusion、AI数字人和视觉模型应用。

从深度学习模型，到可落地的大模型研发工程

适合希望系统掌握NLP、Transformer、RAG、Agent、微调训练和多模态模型研发的开发者、数据分析师和AI应用工程师。

回到顶部学习路径