AI大模型研发工程师

Program Positioning

参加 AI 大模型前沿部署（FDE）+应用开发+算法工程师项目实训

我们以 AI 技术服务 200 多个行业客户并实现商业化，沉淀了从业务需求、模型训练到产品交付的项目经验。

面对大模型技术快速迭代与人才缺口，课程将多年人工智能项目经验融入当前就业市场需求，帮助学习者进入人工智能研发的真实工作流。

了解培养计划

Project Advantage

让技术学习靠近真实交付

从算力设备、实操场景到行业经验，课程设计围绕模型研发与企业应用的完整链路展开。

01

专业实验设备

配套大模型训练与微调所需的算力资源，实训基地配置 GPU 卡与服务器，保障每位同学拥有训练设备。

02

真实场景实操

在线下项目中直面真实问题，把理论知识转化为问题拆解、模型微调与方案落地能力。

03

紧跟行业趋势

围绕持续变化的模型、框架与应用范式更新课程内容，让学习能力保持在行业技术前沿。

04

项目经理授课

由资深大模型项目研发专家讲授成体系的微调技术与企业交付经验，理解工程决策的来由。

05

深度动手训练

用连续实操替代纯理论讲解，在构建、调试、评估与迭代中提升技术实际运用能力。

Job Capability

AI 大模型研发工程师的岗位职能

培养面向研发岗位的技术全景：模型部署、训练微调、推理服务、知识增强和智能体系统。

详细了解

模型与部署 熟悉大语言模型与多模态大模型，具备私有化部署能力。
RAG 与 Agent 使用 LangChain 等框架，理解 RAG、Agent 与思维链设计。
训练与服务 负责模型训练、服务部署，并掌握 SFT、LoRA、RLHF 等技术。
框架与算力 熟练使用 PyTorch、DeepSpeed 等深度学习与多机多卡方案。
技术演进 持续跟踪 GPT、文心一言、百川、ChatGLM、通义、LLaMA 等模型与前沿技术。

Common Questions

入门前，先把关键问题讲清楚

课程安排、学习基础、就业方向与服务支持可由课程顾问结合个人情况详细说明。

培训时间周期为多久，什么时间上课？ 01 推荐就业，大约薪资是多少？ 02 报名学习这门课，有学历要求和其他要求吗？ 03 如果没有就业，可以退学费吗？ 04

Career Growth

参与人才培养计划，你将胜任这些工作角色

面向大模型研发的典型职业发展路径，具体岗位要求与市场情况以招聘平台当天信息为准。

岗位名称工作经验岗位职能

AI大模型应用开发工程师 一年至三年

能够应用相关工具和框架进行大模型的应用开发、微调和优化。

AI前沿部署工程师（FDE） 一年至三年

驻扎在客户现场，将通用的 AI 模型与企业具体的业务需求深度结合，提供定制化的解决方案。

大模型算法高级工程师 三年以上

对大模型训练和部署有深入理解，能够独立完成相关项目。

算法专家 五年以上

熟悉机器学习与深度学习算法，具备扎实算法功底与编程能力。

技术总监 / CTO 十年以上

可组建并带领技术团队，开展研发、测试与项目交付管理。

声明：以上数据截至 2026-06-27，每天搜索查询结果可能存在差异。可直接访问 BOSS 直聘查询“AI大模型算法工程师”岗位，以当天结果为准。

Student Stories

真实优秀毕业同学的话

查看更多案例

01

温同学

有机化学博士后，毕业于中科院化学所，后进入医药公司从事结构生物学与药物研究。发现很多过去解决不了的问题可以通过 AI 技术解决，最终进入上海上市公司，从事 3D 人脸识别。

02

唐同学

信息管理与信息系统专业，曾在上海从事 DBA 工作。全职参与学习后进入阿里巴巴旗下企业，担任算法工程师。

03

张同学

内江师范学院测绘专业，毕业后从事本专业工作。通过系统学习与同伴协作，完成从零到一的转型，目前在上海某公司任职。

04

李同学

中科院光电所研究生，计算机视觉方向，研二参与项目实践，目前在上海拼多多担任算法工程师。

05

黄同学

四川外国语大学英语专业，曾从事人事工作两年，因看好 AI 行业转型，目前在上海某车企担任算法工程师。

06

阙同学

石河子大学电信专业，因同学在此学习后获得良好职业发展而决定转行，目前在上海某科技有限公司工作。

07

丁同学

青岛大学信息工程学院网络工程专业，曾在西安从事两年运维工程师，后进入上海某大厂担任算法工程师。

08

陈同学

西南民族大学本科，大学期间自学过机器学习与神经网络，为补足项目与体系化经验参与学习，目前在东莞步步高工作。

Who It Is For

适合有目标的技术进阶者

01

IT 研发工程师

移动端开发，C++ / Java 有项目研发经验、代码能力强的工程师，学习后薪资涨幅空间更高。

02

本科及以上高校学生

计算机、人工智能、软件工程、数学、电子信息等相关专业的本科及硕士人群。

03

产品经理

项目管理、产品经理或细分行业中准备进行智能化升级的业务负责人。

04

AI 领域从业者

已在 AI 领域发展，期望向大模型研发方向持续提升的从业者。

Project Showcase

实战项目演示

面向运营商、电力、医疗等行业的真实项目实践，呈现人工智能技术从识别到业务交付的落地成果。

更多项目案例，请联系获取

About The Group

关于上海交大教育集团

上海交大教育（集团）有限公司于 1999 年 8 月设立，注册资本 1.5 亿元人民币。集团传承“起点高、基础厚、要求严、重实践、求创新”的传统，秉持“严谨、务实、创新”的质量方针，充分发挥教育、人才、技术及信息资源优势，服务社会化教育事业。

Industry Collaboration

学员都去了哪些企业

服务科技、制造、金融、医药、消费与企业服务等多个行业，持续推动 AI 技术的业务落地。

Faculty Team

专职师资团队

以项目经验、模型工程和业务落地能力为核心，提供兼具技术深度与业务视角的教学支持。

AI-01

丁老师

前沿 AI 应用架构师与企业级 AIGC 实战专家。近 20 年软件研发与架构经验，曾任 Oracle 资深数据架构师、腾讯云技术专家，主导快消、医疗等行业 AIGC 项目交付。

AI-02

金老师

软件开发与 AI 实战专家。近二十年研发与教学经验，精通 Python、机器学习、大模型及企业低代码 / RPA，项目经验覆盖工业、教育和办公自动化。

AI-03

邹老师

AIGC 人工智能与数字化新媒体实战讲师，15 年互联网及 6 年新媒体经验。精通 AIGC 应用、智能体开发与新媒体营销，提供私有化大模型搭建与智能体方案。

AI-04

王老师

人工智能与大数据运维分析专家，芝加哥伊利诺伊理工学院计算机硕士。15 年以上 Python 开发与架构经验，曾任阿里巴巴大数据资深专家，擅长 LLM 调优、RAG、LangChain。

AI-05

张老师

复旦大学数学科学学院金融工程硕士，上海交大教育集团高级讲师，8 年授课实战经验。擅长机器学习、深度学习、Python 数据分析与挖掘、Power BI 可视化。

AI-06

关老师

某跨国公司 AI 架构师，金融行业 AI 大模型实战讲师，微软专家级和 SAFe 认证。16 年 Java 经验，精通 Python、LangChain、ChatGLM / LLaVA 微调，主导智能客服、AI 数字人项目。

Curriculum

课程大纲

从可选基础到企业级项目闭环，全部阶段连续展开，一目了然。

Optional Foundation

基础阶段（选修）：Python 开发和数据分析

Python 开发基础

Python 概述、语法基础、函数与内置函数。

Python 开发进阶

面向对象高级编程、模块、正则表达式、数据库编程、多进程、多线程与项目实践。

Python 数据分析

数据科学和 AI 概述、数据结构与算法、分析工具箱、数据加载存储、规范化处理、挖掘与可视化。

Stage 01

人工智能时代的定位与竞争力

技术演进与架构

从规则系统到神经网络；AI 产业格局；算力、算法、数据铁三角；PyTorch 与 TensorFlow。

大模型与 AIGC 入门

大模型定义与演进、AIGC 技术栈和企业级流水线，以及大模型体验。

企业方案与工作坊

行业解决方案、实施路线图；工作、学习、生活、社交场景提示词；专业咨询与高级提示词。

定位与竞争力

从数字体力向数字脑力转型，完成个人定位与竞争力分析。

Stage 02

意图驱动 Vibe Coding 实战

开发环境

Linux 基本操作和常用命令、Docker 基础、XShell 操作、国产操作系统部署与使用。

AI 算力配置

算力概述、本地算力使用与讲解、云端算力配置与使用。

开源大模型部署

Ollama 部署、局域网访问、单机多卡使用与主流开源模型部署。

Vibe Coding

高阶系统提示词与架构建模；使用 TRAE、Cursor、Claude 完成意图驱动开发、重构、测试与维护。

Stage 03

数据探索 EDA 与深度学习

面向大模型的 EDA

数据探索、GIGO 原则，理解数据分布如何影响训练与模型效率。

深度学习基础

多层感知机、激活函数、梯度下降、反向传播、损失函数与模型训练过程。

神经网络实战

FNN、CNN、RNN、LSTM、GRU 原理与实战，不同网络的应用场景分析。

工程化应用

预训练模型、公开数据集与竞赛，以及神经网络的 Web 服务化。

Stage 04

AI 大模型全生命周期

Transformer 与架构演进

解析 Attention is All You Need；自注意力、多头注意力、位置编码、Encoder-Decoder、Bert 与 GPT 源码。

预训练与选型

从单体 Transformer 到 MoE，预训练与微调，Bert、GPT、LLaMA、DeepSeek 架构对比与选型。

量化与高效微调

AWQ、GGUF 量化、蒸馏；PEFT、LoRA、QLoRA、IA3、LLaMA-Factory；实战微调 GPT、Bert、Qwen。

对齐与推理

RLHF、PPO、DPO；KV Cache、FlashAttention、vLLM 部署，以及 Ollama 与 vLLM 对比。

多模态与 API

交叉注意力；LLaVA、Qwen VL / TTS、DeepSeek OCR；DeepSeek 与兼容第三方 API 调用。

Stage 05

智能体系统与多 Agent 协作

LangChain 到 LangGraph

开发环境、LCEL、具备反思与计划能力的单体 Agent，用图管理循环逻辑与持久化状态。

MCP、OpenClaw 与 Skills

使用 MCP 统一企业数据库、本地文件和第三方 API；网页 / GUI 自动化 Agent；Skills 库工程化与 Function Calling 调优。

企业级低代码平台

Dify、MaxKB、Coze 部署；主从、对等多智能体协作模式；完成从需求到自动化执行的企业项目。

架构选型与生态

产品经理快速选型、按业务复杂度选择 Agent 架构；OpenClaw 与 Hermes 的安装、配置与使用。

Stage 06

知识增强架构 RAG

LlamaIndex 与 RAGAS

LlamaParse 解析复杂 PDF、表格、多模态文档；递归检索、Small-to-Big、混合检索、RRF、Reranking、查询转换与 RAGAS 评估。

GraphRAG 与 Agentic RAG

使用 Neo4j 构建实体关联；设计“检索-评估-重检索”自反思检索智能体；用 Ragas / TruLens 建立评估流水线。

企业级项目实战

完成从 0 到 1 的企业级 RAG 项目，连接真实知识库与业务流程。

Stage 07

企业级 AI 应用项目闭环

算力与部署

华为昇腾与通用算力适配；Docker 构建、Docker 部署、Docker Compose 实战。

可观测性与监控

AI 专项指标监控与普罗米修斯，建立持续运行的工程观测能力。

企业级评估体系

使用 LLM-as-a-Judge 对 RAG 和 Agent 性能量化打分，建立 HITL 人机协作反馈机制。

技术面试与沟通

基础知识、项目方案、行业信息面试指导，以及金字塔与 STAR 法则沟通训练。