日程
培训内容
课程内容
教学方式
第一天
开班仪式
领导致辞
理论+研讨
本次培训整体规划、目标及要求
AI类专业建设发展趋势报告
新品发布
教学实验平台、人工智能虚拟仿真平台
大数据技术未来发展
介绍数据科学基础、行业发展趋势及全球大数据、人工智能应用案例剖析。
理论
Python编程基础
1.函数:定义函数、匿名函数、lambda表达式;2.面向对象:面向对象编程简介、实践;.Python常用模块
理论
第二天
基于Python实现店铺零售业绩统计分析案例(1/2)
通过项目式教学,掌握基于Python实现数据统计分析的全流程,内容包括:爬虫采集、数据库采集、数据清洗、店铺销售统计分析、会员消费统计分析以及数据可视化。知识点:Python基础、正则表达式、爬虫、可视化技术等
理论
基于Python实现店铺零售业绩统计分析案例(2/2)
通过项目式教学,掌握基于Python实现数据统计分析的全流程,内容包括:爬虫采集、数据库采集、数据清洗、店铺销售统计分析、会员消费统计分析以及数据可视化。
理论/实践
第三天
Hadoop生态圈介绍
介绍Hadoop分布式框架的相关组件,包括:HDFS、MapReduce、Hive、HBase等。并结合教学平台讲述课程的相关性。
理论
Hadoop系列课程介绍
1.Hadoop分布式文件系统HDFS
理论
2.Hadoop分布式计算框架MapReduce
.数据仓库Hive
4.分布式数据库HBase
5.Hadoop性能优化
基于MapReduce实现酒店客房出租率分析实战案例
通过项目式教学,掌握基于MapReduce实现酒店客房出租率分析案例的全流程,内容包括:web爬虫采集、数据库采集、数据清洗、酒店信息统计以及数据可视化。
动手实战
第四天
Spark技术方向
主要介绍分布式计算框架Spark目前在行业内的趋势以及未来的技术走向。
理论
Spark基础
1.Spark产生背景,包括mapreduce缺陷,多计算框架并存等
理论/实践
2.Spark基本特点
.Spark版本演化
4.Spark核心概念,包括RDD,transformation,action,cache等
5.Spark生态系统,包括Spark生态系统构成,以及与Hadoop生态系统关系
6.Spark集群搭建,包括测试集群搭建和生产环境中集群搭建方法,并亲手演示整个过程
7.背景知识补充介绍
Spark进阶
1.Spark运行模式剖析:深入分析spark运行模式,包括local,Standalone以及sparkonyarn
理论/实践
2.Spark运行流程剖析:包括spark逻辑查询计划,物理查询计划以及分布式执行
.Sparkshuffle剖析:深入介绍sparkshuffle的实现,主要介绍hash-based和sort-based两种实现
4.Spark源码阅读:Spark源码构成以及阅读方法
第五天
Spark性能调优
1.数据存储格式调优
理论/实践
2.资源调优
.程序参数调优
4.程序实现调优
基于Spark实现汽车行业精准营销分析案例
通过项目式教学,掌握基于Spark实现汽车行业精准营销分析案例的全流程,内容包括:数据采集、数据匹配、行为统计、推荐模型预测。
动手实战
第六天
专业建设研讨
讨论、答疑、交流
考试
综合考试
理论+实验
四、培训对象合作院校推荐教师、以及对本次培训感兴趣的合作院校及非常合作院校人工智能、数据科学与大数据技术、大数据管理与应用、大数据技术与应用、商务智能、数据分析等相关专业教研室主任;大数据学科负责人、大数据教学及科研的骨干选派教师。五、培训时间和形式1.培训时间:年1月18日-2日2.上课安排:上午9:00-12:00,下午14:00-17:00.培训形式:线上直播六、培训费用本次培训全程免费,限50人,先到先得。因名额有限,为不浪费培训名额,请报名完成后联系工作人员预付元作为参加培训保证金,培训完成后作为证书工本费,考核不成功的退回。七、培训证书对经学校有关部门推荐参加培训的教师,考评合格后由信息技术新工科产学研联盟颁发“新工科联盟大数据综合实战师资培训班”结业证书,将在培训结束后将纸质证书邮寄给参训学员。对参加培训获得证书的教师,所在学校应承认其接受培训的经历,计入继续教育学时。证书颁发需满足以下要求:1.每天上午下午签到,缺勤次数不能超过两次。2.每天的作业按时完成,每天作业不低于70分。.最后的综合考试60分以上。八、报名方式1.请于每期培训班开班前三天提交报名材料,报名联系或联系人霍老师。霍老师手机:;邮箱:qq.