详情

AIGC生成式大模型及多模态的全方位应用技术实训高级研修班

各有关单位:

AIGC/ChatGPT等生成式大语言模型是在人工智能技术成熟应用的环境下产生的,伴随着ChatGPT与Sora等的诞生,标志着人类进入了超级人工智能时代。生成式大语言模型给人们的生活、工作带来很大便捷,但是基于大语言模型的预训练模型进行功能重建,面临着许多技术难题。基于此,我们整合现有开源项目程序与数据,以直观、便捷的形式帮助大家深入理解并学习AIGC人工智能自动生成技术,致力于将此项技术应用于学员的项目实施场景。内容主要包括生成式大模型工具在生活与工作中的应用、大模型的部署与训练过程中涉及的各方面理论与实践内容等。本期研修班将以深入浅出、通俗易懂的方式带您学习,解答您的疑惑,让大家领略不一样的实践体验。

培训对象

1、各行业企业、事业单位科研、技术人员;

2、高校、科研院所、大专院校,以及在校大学生;

3、其他对AIGC/ChatGPT感兴趣的人员。

时间地点

时间:2025年6月11-13日上午9:30-12:00,下午:13:30-17:00

地点:北京市海淀区丰贤中路7号北科产业3号楼

研修课程大纲

日期

主题

课程内容

第一天

(掌握人工智能技术背景、AIGC技术背景、生成式大模型作为工具在各个场景的应用)

人工智能技术概述

1、人工智能技术发展历程

2、人工智能技术应用场景

3、深度学习与NLP

4、语言模型技术发展历程

5、生成式大模型课程概述

生成式大语言模型概述

1、生成式大语言模型概念

2、生成式大语言模型发展历程

3、生成式大语言模型的能力

4、生成式大语言模型的特点

5、GPT在生活与工作中的应用

6、ChatGPT的发展历程

7、ChatGPT的优势与创新点

8、ChatGPT的主要技术

9、ChatGPT带来的革命性影响

10、ChatGPT面临的挑战

生成式大语言模型在线工具演示

1、国产大模型在线演示(智谱清言、通义千问)

2、大模型的语言处理功能(文本生成、文本补全、文本分类、文本校正、诗歌生成、内容创建、问答、翻译、摘要、改写、情感分析、聊天机器人等)

3、大模型智能办公(ChatPDF、ChatDOC、Copilot等)

4、大模型智慧医疗

5、大模型智慧编程(ChatGPT的程序编写功能 程序编写、程序debug、程序修改)

6、大模型智慧文案(文案创作功能方案设计、项目咨询、文学创作、撰写演讲提纲、撰写分析报告、金融分析、工业自动化、医学诊断、教育、供应链管理、销售和营销、法律应用、科学研究)7、大模型知识抽取(实体识别、关系抽取、三元组抽取、多元组抽取)

大语言模型技术原理

1、Transformer原理

2、Transformser的应用—BERT与GPT的原理与区别

3、GPT1—GPT3—instructGPT的变化

第二天

(掌握深度学习环境搭建、大模型微调运行环境部署、大模型的二次微调工具原理与应用)

人工智能方法构建环境

1、Python编程环境配置

2、基于Python的深度学习框架

3、Pytorch模块讲解

4、文本数据预处理

大语言模型的二次训练

1、ChatGLM部署流程与关键点讲解

2、ChatGLM部署流程与关键点讲解

3、微调工具Prefix-Tuning、P-tuning-v2、LoRA Finetuning、QLoRA Finetuning等的应用实践

4、ChatGLM二次训练与微调

5、AquilaChat二次训练与微调

6、数据并行与模型并行

部署模型与效果展示

1、词嵌入预训练模型(text2vec、bge、word2vec)

2、基础模型的训练

3、对话模型的训练

4、模型微调过程的参数调节与优化

5、预训练模型的改进方法

6、二次训练模型效果演示(对话、编程、翻译、绘图)

第三天

(掌握多模态大模型的原理与工具实践、大模型落地实践过程中涉及主要技术)

多模态大语言模型工具与应用效果演示

1、AIGC生成图像原理、AIGC图像生成工具介绍

2、Stable Diffusion工具与不同版本介绍

3、Stable Diffusion环境部署介绍

4、Stable Diffusion常用提示词介绍

5、Stable Diffusion工作界面介绍

6、文生图技术应用实践、图生图技术应用实践

7、流行大模型sora、Claude3、DUSt3R、Genie、Gemini、MagicVideo、PixelDance、VideoCrafter2、UniVG、I2VGen等技术介绍

8、语音合成引擎

9、文本数据准备与音频格式选择

10、语音转换模型

11、语音图像生成技术

12、动画生成技术

大模型实用方面涉及技术

1、大语言模型Prompt提示词工程

2、提示学习与指令精调

3、大模型处理长文本

4、针对生成内容的质量评估与控制

5、基于人类反馈的强化学习(RLHF)

6、大模型agent技术

7、大模型思维链

8、模型量化技术与加速推理

关于模型训练的硬件技术

1、高性能计算理论基础

2、GPU加速技术

3、基于高性能计算的模型训练

4、人工智能平台设计与模型的云端部署

大语言模型发展趋势与应用展望

1、ChatGPT引领的新AI范式

2、ChatGPT、AIGC和元宇宙的关系

3、大模型的技术进展

4、大模型与自然语言处理

5、大模型与知识图谱

6、大模型面临的挑战

培训师资

刘老师,博士,研究员,入选北京市百千万人才计划,全国专业标准化技术委员会软件工程分技术委员会委员,北京市经信委专家咨询委员会专家,中关村协同创新服务平台创业导师,中国互联网协会理事。长期从事人工智能、大数据等方面的研发工作,在智慧政务、智慧城市等领域有多个成熟应用案例。

裴老师,博士,研究员,主要研究方向:基因组、生物信息学、人工智能。具有较丰富的数据分析、处理与高性能计算机的运用、程序开发及数据库平台构建工作经验。发表国内外科学论文30余篇、多项专利和软件著作。科研与项目申报经验丰富,讲课通俗易懂,互动性强。

张老师,博士,副研究员,北京市计算中心算法工程师。神户大学系统信息专业博士毕业,主要研究方向为深度学习、数据挖掘、图像识别算法构建等。主要从事深度学习与图像处理算法的理论与技术落地研究。项目实战经验丰富,授课受到众多学员好评。

刘老师,博士,副研究员,主要研究方向:文化遗产数字化、文物三维扫描、文物数字化修复方向,具有丰富的虚拟博物馆、文物建筑数字化、数字保护技术等方面科研与实战经验。参与北京市地方标准DB11/T 1796-2020《文物建筑三维信息采集技术规程》起草。

陶老师,北京市计算中心人工智能助理研究员,图像算法工程师。主要从事人工智能图像处理方面内容,擅长根据实际问题设计cv算法解决方案,熟练掌握包括数据标注、建模、部署等步骤的全流程工程化工作。有丰富的训练深度学习及机器学习模型,并完成部署,集成到软件系统中供客户使用的项目经验。

培训费用

培训费4500元/人(含培训费、资料费、证书费、餐费等)。同一单位3人以上报名,每人优惠300元。

 

咨询请联系

张老师: 18618295767(微信同号)

郭老师: 18976866894

QQ  号: 3498448850

邮  箱: bcc_peixun@163.com

北京市计算中心有限公司

2024年12月