Large Language Model

AI大模型研发工程师

实训课程(可参与就业推荐服务)

参加AI大模型算法工程师项目实训

我们用AI 赋能,为 200 多个行业客户提供AI 解决方案,并顺利实现了商业化,积累了丰富的经验。AI技术快速发展,尤其是大模型的出现及火爆,导致了就业市场出现了相关人才的短缺,面对此类工作岗位人才的巨大缺口,我们运用自身6年的人工智能项目经验,结合当下不断迭代的最新AI技术,研发出适合当前就业市场需求的AI大模型算法工程师课程,促使越来越多的有志之人投身于人工智能大发展的浪潮中。

学员参与就业推荐服务

✔ 上海、苏州、杭州、北京、深圳等多家AI合作企业
✔ 推荐入职上述企业的人工智能及相关研发岗位工作并提供就业保障
✔ 通过考核的学员获得上海交大教育AI大模型算法工程师培训证书
✔ 学习未达标者,提供免费重修服务

项目优势

专业的实验设备

为学员配套练习,配置大模型训练微调所需要的算力资源,实训基本花巨资购买GPU卡和服务器,让每一位同学都有至少一台训练设备;

直面真实场景实操,全面掌握实战技能

线下学习通过实际项目实操,学员能够直接面对真实场景中的问题,有助于理解理论知识在实际工作中的应用。这种实战经验对于学员的问题解决能力和模型微调技巧至关重要;

紧跟行业趋势

紧跟行业趋势,让学员所学技能不过时,提升其在职场的技术领先优势

行业资深项目经理授课

由资深大模型项目研发专家亲自执导,为您带来成体系的微调技术课程。在这里,您将直接受益于业界权威的专业知识和实战经验,深入掌握前沿的大模型微调策略。

深度体验实操练习,培训动手实战能力

我们的课程特别设计了一系列实操环节,确保学员不仅理论学习,更能亲自动手实践,深刻理解技术的来源与应用原理。通过这样的深度体验,学员将大幅提升技术的实际运用能力,增强自身竞争力。

AI大模型算法工程师的岗位职能

✔ 熟悉各类AI大语言模型和多模态大模型,能私有化部署;
✔ 熟练使用 LangChain等框架,对RAG,Agent有深入理解和思维链设计。;
✔ 负责相关产品的模型训练和服务部署;
✔ 对主流的大模型(GPT、文心一言、百川、chatGLM、通义、LLaMA等)有较丰富的使用经验和prompt微调经验;
✔ 掌握大语言模型SFT/LoRA/RLHF等技术,提升特定任务的大模型能力;
✔ 熟练掌握主流深度学习框架pytorch,LLM训练并行框架Deepspeed等多机多卡方案;
✔ 跟踪大模型领域前沿技术,提出创新思路来推动算法升级和业务发展。

参与AI大模型算法工程师人才培养计划,您将任职以下类型的工作角色

 

岗位名称 工作经验 岗位薪资 岗位职能
AI大模型算法工程师 一年至三年 1.2万-3万 能够应用相关工具和框架进行大模型的微调和优化
大模型算法高级工程师 三年以上 3万-5万 对大模型的训练和部署有深入理解,能够独立完成与大模型相关的各种项目
算法专家 五年以上 50-80万年薪 熟悉常见的机器学习和深度学习算法,具备扎实的算法功底和编程能力
技术总监/CTO 十年以上 百万年薪 管理层,组建技术团队并带领技术团队开展产品研发、测试以及保证项目顺利交付的能力
声明:以上数据截至到2024-06-27,每天搜索查询结果可能存在差异,用户可以直接访问BOSS直聘查询岗位,以当天查询结果为准。
以“AI大模型算法工程师”岗位为例,查询链接:https://www.zhipin.com/web/geek/job?query=AI大模型算法工程师

真实优秀毕业同学的话

适合人群

IT研发工程师

移动端开发,C++/Java有项目研发经验,代码能力强,学习后薪资涨幅较高。

本科及以上高校学生

计算机、人工智能、软件工程、数学、电子信息等相关的专业,本科及硕士人群。

产品经理

项目管理、产品经理、或者细分行业准备做智能化升级的负责人。

想进入AI领域发展的人群

想转行进入AI领域,IT相关职位优先。

实战项目演示

关于上海交大教育集团简介

上海交大教育(集团)有限公司于1999年8月4日设立,注册资本1.5亿元人民币,股东为上海交大产业投资管理(集团)有限公司和上海新南洋昂立教育科技股份有限公司。集团以独立法人经济实体的形式对外发展终身教育事业,传承 “起点高、基础厚、要求严、重实践、求创新”的醇厚传统,秉持“严谨、务实、创新”的质量方针,为打造社会化教育平台,充分发挥自身在教育、人才、技术及信息方面的资源和优势并服务于社会。

长期合作的企业

专职师资团队

陈老师

中国信息通信研究院华东分院人工智能与大数据事业部主任,东华大学控制工程与科学博士后,高级工程师,牵头上海市人工智能产业公共服务平台、上海市大数据产业分析平台、医疗人工智能共训练平台等多个专项平台建设工作,学术会议,协助众多行业做人工智能项目可行性评估

秦老师

某一线人工智能研发企业CTO,硕士研究生企业导师,人工智能训练师一级证书;曾就职于上海复旦光华,杭州阿里巴巴等,后合伙创立多家数据科技公司;16年人工智能算法研发经验,擅长机器学习,深度学习等主流人工智能技术,完成众多商业项目,方向涉及医疗,工业检测,数据中心等;

张老师

高级算法工程师/人工智能金牌讲师,拥有6年AI算法研发经验,3年AI教学经验,人工智能训练师一级证书,丰富的模型加速、模型优化、模型部署经验,在CV领域的目标检测、目标分类、姿态估计和NLP领域的问答、多轮对话方面经验丰富,参与多个大模型项目微调实施。

陈老师

高级算法工程师/人工智能金牌讲师,曾参与中国移动、华为、大唐电信等企业的项目研发、系统集成等相关工作,主攻机器视觉算法,多模态大模型研究和应用经验丰富。

唐老师

人工智能高级工程师,电子科技大学计算机科学与技术专业;四川省人工智能研究院专家,四川省人工智能学会理事,成都蓉漂人才发展学院特聘专家,YOCSEF成都24-25学术秘书;8年人工智能行业经验;擅长人工智能技术与行业结合及应用落地,解决行业实际问题;

冷老师

高级算法工程师/人工智能金牌讲师,柳林商学院AI实战讲师,10万粉丝科普IP主理人,上海交大教育集团智能信息技术研究院AI人才基地特聘专家顾问,多家知名企业数字化品牌营销顾问。

课程大纲

第一阶段:人工智能认知提升

课程内容 课程大纲
人工智能大模型技术的过去、现在与未来 (1)人工智能的发展史——人工智能1.0到3.0时代
(2)大模型的发展史
(3)人工智能的基本原理
大模型应用全景速览 (1)大模型企业应用案例
(2)企业拥抱大模型的痛点与解决方案
体验大模型 体验大模型
大模型工具使用 (1)大模型能力的边界认知
(2)提示词工程

项目:结构化提示词编写与实践

项目:思维导图快速生成

项目:Markdown格式文档快速生成

第二阶段:大模型开发环境部署

课程内容 课程大纲
环境搭建与使用 (1)Linux基本操作和常用命令
(2)Docker基础
(3)XShell操作
(4)人工智能相关基础库介绍与安装
开源大模型部署 (1)Ollama介绍与安装

单机多卡私有化部署开源大模型

(2)常见的开源大模型部署

第三阶段:AI大模型应用开发平台基础

课程内容 课程大纲
AI大模型应用开发平台 (1)Dify平台的介绍与安装
(2)Dify配置基础大模型
(3)Dify创建聊天机器人
(4)Dify创建知识库
(5)Dify创建Agent
(6)Dify创建工作流

项目:意图识别客服机器人

项目:长篇故事生产机器人

第四阶段:大模型研发基础

课程内容 课程大纲
IDE环境搭建 (1)Vscode安装与配置
(2)Jupyter介绍
python编程复盘 (1)Python核心语法
(2)Python文件操作
(3)Python多进程与多线程
数据科学计算库实战 (1)Pandas实战
(2)Numpy实战
人工智能开发框架Pytorch基础 (1)张量基础
(2)全连接神经网络

激活函数、MSELoss、CELoss、正则化L1/L2

项目:手写数字识别--tensorboard使用

(3)卷积神经网络

BatchNormal、IntanceNormal、GroupNormal、Pool、分离卷积、空洞卷积

项目:图像识别

(4)反馈神经网络

门结构、残差结构

项目:时间序列预测

(5)混合精度训练

FP16、BF16

项目:YOLO实战

大语言模型结构详解 (1)注意力机制
(2)Transformer网络结构

GQA、MQA、PE(Rope、绝对位置编码)FlashAttention、FNN、Moe

(3)Deepseek模型架构专题

Share Moe、MLA

项目:预训练模型

Embedding、词向量制作、多机多卡训练、显卡选型

(4)大模型推理

t-softmax、top-k、top-p、重复惩罚、KV-Cache

(5)Clip网络基础

Vit网络设计与训练

(6)多模态大模型网络结构

llava网络结构

第五阶段:大模型能力扩展

课程内容 课程大纲
Langchain基础 (1)Langchain开发环境搭建
(2)链与LCEL基础
(3)记忆模块基础
(4)知识增强检索基础(RAG)
(5)智能体代理基础(AGENT)

项目:Langchain调用私有化部署QWEN2.5大模型

Muti-Agents基础 (1)Muti-Agents基本概念

思维链(Cot、ToT、GoT)

(2)Langgraph基础

常见的其他Muti-Agents框架介绍crewAI和Autogen

(3)AI团队搭建

流程模式、领导者模式

项目:聊天机器人

RAG(milvus、lightRAG、Chroma)、WebSearch

项目:方案撰写专家

项目:MySQL数据库智能代理

第六阶段:大模型微调和底层技术

课程内容 课程大纲
HuggingFace基础 (1)Pipeline基础
(2)Transformers组件基础
(3)Tokenizer组件基础
(4)Datasets组件基础
(5)Evalaute组件基础
(6)Trainer组件基础
显存优化基础 (1)内存、显存基本结构与工作方式
(2)模型显存占有量计算
(3)模型在显存中的存储优化
模型微调基础 (1)大模型训练流程
(2)BitFit微调
(3)Prompt-Tuning微调
(4)P-Tuning微调
(5)Prefix-Tuning微调
(6)LORA微调
(7)IA3微调
(8)模型量化
(9)QLora微调
(10)对齐微调(RLHF\DPO)
(11)实战:微调llama3
模型推理优化基础 (1)vLLM推理框架基础
(2)Llama.cpp基础
多机多卡分布式训练基础 (1)并行基础
(2)Fairscale训练基础
(3)Accelerator训练基础
(4)Deepspeed训练基础
大模型微调实战 (1)大模型微调流程

SFT、DPO和变种、RLHF、PPO、ORPO

(2)HuggingFace/Modelscope基础

Tokenizer、模型加载与保持、模型推理

(3)Deepseek模型训练专题

强化学习(DQN、PG、DDPG、AC、PPO)、GRPO、蒸馏

(4)微调前置基础

显存优化、Adam优化器原理、Zero0/1/2/3

(5)大模型高效微调

Lora、量化、Qlora、SVD、IA3

项目:微调通义千问2.5:7b模型

deepspeed 8卡v100训练

大模型部署与评估 (1)推理框架介绍
(2)Vllm推理基础
(3)大模型评估基础

(4)评估指标解读

混淆矩阵、F1-SCORE、PR、AUC、ROC、R2等

(5)OpenCompass进行大模型评估

评估数据集

第七阶段:项目实战和入职指导

课程内容 课程大纲
智能问答专家 使用自己微调的大模型,叠加自己的知识库,开发一个专业问答专家。例如法律咨询、医疗咨询等。
报告生成能手 使用自己微调的大模型,叠加自己的知识库与智能代理,开发一个报告撰写能手。
数据智能治理专家 利用大模型从海量的、杂乱的文本数据中提取需要的信息,并结构化数据存储。
全流程内容制造者 通过大模型Agent能力对网站进行的监视与内容获取,然后自动的对内容进行分析、摘要、重写,最后自动发布到指定平台。
技术面试指导 基础知识面试指导
项目方案面试指导
行业信息面试指导

联系我们

学校地址

上海市徐汇区乐山路33号交大科技园B栋4层

开放时间

周一至周日 9:00-19:00

联系方式

400-820-7975,微信:qiu297666(张老师)