TA的每日心情 | 开心 2019-9-4 10:30 |
---|
签到天数: 4 天 [LV.2]小吧熟人

永久VIP
- 积分
- 111
|
发表于 2019-9-3 12:25:32
1286 浏览 18 回复
大数据-基于Spark的机器学习-智能客户系统项目实战价值699
本帖最后由 mars_wu 于 2019-9-3 12:53 编辑
项目背景:
1、现在很多平台客户关系管理系统都是使用传统的CRM,所有的信息全靠手工录入,用户寻找上下游企业或者信息只能靠手工去查找并且标注。
2、大数据时代的到来,人工智能,云计算,先进的分析,用机器去替代人工的部分,从 2016 年趋势看,机器学习和人工智能 (AI) 将在未来几年内将会彻底改变 CRM。
因此我们对CRM进行了改造,主要有如下部分:
1、企业信息、商品信息来自互联网,机器学习去自动统计分析并且分类。
2、用户录入的商品信息和新从互联网爬来的商品信息全部通过机器学习计算的模型去分类。
3、机器学习自动计算企业和供求信息上下游。
4、机器学习每隔一段时间自动去优化计算模型。
根据图识,项目将分为三个部分。整个项目基本思路是如何通过爬虫爬取大量数据放到Hbase,然后通过ETL工具初步转化筛选将数据存到mongodb,抽取mongodb的数据进行清洗处理算出模型放到hdfs。后续进来数据通过模型运算出数据的类型。项目系统主要包括前端+后端+机器学习,前端采用React Native,Native,后端采用Dubbo+Spring+java,机器学习采用Spark进行实现,本项目机器学习-spark代码运行在mesos上。
本课程我们只针对以上图示的浅蓝色部分内容(即与机器学习相关的内容),通过用真实的智能客户项目系统作为案例(案例附带源码,可以直接做二次开发),主要根据项目实例穿讲机器学习以及相关知识,包括有:数据提取,数据清洗以及分词,数据特征值提取、机器学习模型计算、数据分类等等,进行详细讲解。
本课程所需掌握的技术:java、scala、IK、Hdfs、Spark ml、Spark Streaming、Spark SQL、Kafka、Zookeeper、Mongodb、Spring-Data-Mongodb,由于每个技术需要掌握的程度不一样,对于我们用到的一些开源技术,课程中将会是简单介绍如何使用,不会着重讲解。课程重点讲解spark ml、spark Streaming,以及如何使用这些技术进行项目的实战,贯穿项目系统并且最后串联所有技术。spark基于2.0.1版本讲解
课程大纲
第1章 第一章
第1讲 项目介绍以及在本课程中能学到什么东西、如何应用到实际项目中 免费 00:09:43
第2讲 scala和IDE的安装以及使用以及maven插件的安装 免费 00:07:04
第3讲 Centos环境准备(java环境、hosts配置、防火墙关闭) 免费 00:06:24
第4讲 scala基础知识讲解-1 免费 00:08:51
第5讲 scala基础知识讲解-函数和闭包-2 免费 00:30:07
第6讲 scala基础知识讲解-数组和集合-3.1 免费 00:48:33
第7讲 scala基础知识讲解-数组和集合-3.2 免费 00:14:16
第8讲 scala基础知识讲解-类和对象-4 00:23:06
第9讲 scala基础知识讲解-特征和模式匹配-5 00:13:46
第10讲 scala基础知识讲解-正则表达式和异常处理-6 00:12:41
第11讲 scala基础知识讲解-知识回顾 00:15:58
第12讲 nosql数据库mongodb安装 00:04:57
第13讲 spring data for mongodb-简单连接mongodb 00:07:52
第14讲 spring data for mongodb-spring配置+CRUD操作(不实现repo,默认操作) 00:36:20
第15讲 spring data for mongodb-实现repo接口+mongoTemplate+CRUD操作 00:36:17
第16讲 spring data for mongodb-分页查询 00:13:32
第17讲 zookeeper集群安装 00:13:41
第18讲 zookeeper基本介绍-1 00:22:36
第19讲 zookeeper工作原理-选举流程(basic paxos算法)-2 00:24:27
第20讲 zookeeper工作原理-选举流程(fast paxos算法)-3 00:31:16
第21讲 kafka-背景及架构介绍 00:12:28
第22讲 kafka集群安装以及测试 00:14:29
第23讲 kafka数据发送与接收实现-java 00:31:28
第24讲 hdfs单机安装部署 00:18:51
第25讲 连接hdfs查询存储-java 00:35:45
第26讲 机器学习基本线性代数介绍 00:05:08
第27讲 IKAnalyzer中文分词工具介绍 00:17:54
第28讲 IKAnalyzer中文分词工具结合java应用 00:16:29
第29讲 Spark以及生态圈介绍 00:11:45
第30讲 Spark运行架构介绍及原理之job,stage,task 00:26:19
第31讲 Spark编程模型RDD设计以及运行原理 00:15:48
第32讲 纯手写第一个Spark应用程序:WordCount 00:23:57
第33讲 RDD常用函数介绍 00:29:22
第34讲 Spark Sql介绍、DataFrame创建以及使用、RDD DataFrame DataSet相互转化 00:12:54
第35讲 Spark Streaming介绍 00:12:56
第36讲 Spark Streaming+Kafka集成操作 00:18:44
第37讲 avro结合maven使用,实现序列化和反序列化 00:21:07
第38讲 Spark ML(机器学习)介绍(监督学习、半监督学习、无监督学习) 免费 00:13:59
第39讲 特征抽取:TF-IDF原理介绍 免费 00:17:49
第40讲 特征提取:TF-IDF代码实现计算 免费 00:26:37
第41讲 聚类算法:KMEANS原理介绍 00:20:55
第42讲 聚类算法:KMEANS代码实现计算 00:20:03
第43讲 其它Spark ML算法简单介绍 00:03:48
第44讲 Spark连接Mongodb代码实现 00:13:08
第45讲 Mesos总体架构介绍 00:08:25
第46讲 Mesos安装部署 00:12:04
第47讲 Spark on Mesos安装部署 00:11:12
第48讲 系统整体架构再次介绍+技术串联介绍(将学习的技术全部整合到项目中) 00:03:57
第49讲 项目代码:父类工程,管理各个jar的版本 00:03:47
第50讲 项目代码:avro序列化jar,用于客户端和机器学学习实现序列化和反序列化 00:04:46
第51讲 项目代码:kafka发送数据jar,给app调用并实现切词并发送数据到kafka 00:06:23
第52讲 项目代码:工具类jar,实现操作hdfs、切词以及操作mongodb 00:03:28
第53讲 项目代码:操作类jar,调用工具类具体进行切词以及数据清洗并且存储到Hdfs 00:05:34
第54讲 项目代码:机器学习集合jar,主要用来存放record 00:02:56
第55讲 项目代码:机器学习算法jar,主要进行tf-idf以及kmeans计算,主要实现企业上下游、供求上下游模型计算 00:07:11
第56讲 项目代码:流式计算jar,主要是接受客户端发送到kafka的数据加载模型进行计算 00:04:35
第57讲 项目代码:测试模拟jar,主要模拟实现用户加载avro序列化jar写数据到kafka 00:01:51
第58讲 Spark on Mesos部署提交参数介绍 00:08:17
第59讲 Spark代码提交到Mesos运行(Spark-submit) 00:07:13
第60讲 项目整体流程跑通,结果展示 00:06:54
第61讲 Spark调优介绍 00:08:01
第62讲 基于Spark的机器学习项目-智能客户系统实战课程总结 00:04:12
第63讲 实际工作及面试注意问题 00:03:45
下载地址:
|
|
|
|
|
|
|
TA的每日心情 | 开心 2020-11-10 16:31 |
---|
签到天数: 7 天 [LV.3]偶尔看看

永久VIP
- 积分
- 2177
|
发表于 2020-7-9 18:48:40
|
|
|
|
|
|
TA的每日心情 | 开心 2022-3-6 23:28 |
---|
签到天数: 54 天 [LV.5]初驻小吧

永久VIP
- 积分
- 3275
|
发表于 2020-7-27 19:37:14
|
|
|
|
|
|
TA的每日心情 | 开心 2022-8-28 19:39 |
---|
签到天数: 103 天 [LV.6]普通吧粉

永久VIP
- 积分
- 4144
|
发表于 2020-8-30 11:50:38
|
|
|
|
|
|
TA的每日心情 | 怒 2021-3-23 09:51 |
---|
签到天数: 58 天 [LV.5]初驻小吧

永久VIP
- 积分
- 3243
|
发表于 2020-9-3 20:55:58
|
|
|
|
|
|
TA的每日心情 | 开心 2022-3-18 09:39 |
---|
签到天数: 130 天 [LV.7]超级吧粉

永久VIP
- 积分
- 4693
|
发表于 2020-9-26 15:15:30
大数据-基于Spark的机器学习-智能客户系统项目实战价值699 |
|
|
|
|
|
|
TA的每日心情 | 怒 2021-9-9 16:44 |
---|
签到天数: 110 天 [LV.6]普通吧粉

永久VIP
- 积分
- 5277
|
发表于 2020-10-10 15:55:55
|
|
|
|
|
|
TA的每日心情 | 开心 2022-5-9 23:27 |
---|
签到天数: 234 天 [LV.7]超级吧粉

永久VIP
- 积分
- 8477
|
发表于 2020-10-19 07:45:55
|
|
|
|
|
|
TA的每日心情 | 奋斗 2022-7-18 14:57 |
---|
签到天数: 83 天 [LV.6]普通吧粉

永久VIP
- 积分
- 9048
|
发表于 2020-11-3 11:25:16
|
|
|
|
|
|
TA的每日心情 | 开心 2020-12-28 12:19 |
---|
签到天数: 9 天 [LV.3]偶尔看看

永久VIP
- 积分
- 2522
|
发表于 2020-12-21 15:46:22
|
|
|
|
|
|
TA的每日心情 | 开心 2021-11-13 08:22 |
---|
签到天数: 20 天 [LV.4]常来常往

永久VIP
- 积分
- 2608
|
发表于 2020-12-22 14:51:32
|
|
|
|
|
|
TA的每日心情 | 奋斗 2022-9-8 21:49 |
---|
签到天数: 59 天 [LV.5]初驻小吧

永久VIP
- 积分
- 3279
|
发表于 2020-12-30 21:35:05
|
|
|
|
|
|
TA的每日心情 | 开心 2022-5-28 23:39 |
---|
签到天数: 111 天 [LV.6]普通吧粉

永久VIP
- 积分
- 9578
|
发表于 2021-1-25 22:39:01
大数据-基于Spark的机器学习-智能客户系统项目实战价值699 |
|
|
|
|
|
|
TA的每日心情 | 无聊 2022-8-16 14:36 |
---|
签到天数: 265 天 [LV.8]狂热吧粉

永久VIP
- 积分
- 7283
|
发表于 2021-1-26 17:23:17
|
|
|
|
|
|
TA的每日心情 | 衰 2022-7-22 11:56 |
---|
签到天数: 45 天 [LV.5]初驻小吧

永久VIP
- 积分
- 4351
|
发表于 2021-5-24 12:53:15
|
|
|
|
|
|
TA的每日心情 | 郁闷 2022-9-15 11:24 |
---|
签到天数: 81 天 [LV.6]普通吧粉

永久VIP
- 积分
- 3510
|
发表于 2021-7-19 09:37:16
|
|
|
|
|
|
TA的每日心情 | 开心 2022-1-4 17:08 |
---|
签到天数: 31 天 [LV.5]初驻小吧

永久VIP
- 积分
- 2876
|
发表于 2021-12-14 18:29:33
|
|
|
|
|
|
TA的每日心情 | 开心 2022-9-9 07:44 |
---|
签到天数: 47 天 [LV.5]初驻小吧

永久VIP
- 积分
- 3091
|
发表于 2022-2-10 21:07:02
大数据-基于Spark的机器学习-智能客户系统项目实战 |
|
|
|
|
|
|
TA的每日心情 | 擦汗 2022-9-15 23:12 |
---|
签到天数: 137 天 [LV.7]超级吧粉

永久VIP
- 积分
- 6492
|
发表于 2022-8-2 14:18:38
|
|
|
|
|
|
登录或注册
官方QQ群
825348618(程序员教程吧互助群)
扫一扫快速加入

程序员教程吧-更新最快的IT教程网 本站资源源自互联网收集及网友分享-如有侵权请发邮件到admin@cxyjc8.com联系删除!
|