请选择 进入手机版 | 继续访问电脑版

AdvertCN - 广告中国

 找回密码
 立即注册

QQ登录

只需一步,快速开始

 谷歌+Bing+TT+MSN官方代理 
⚡️按条S5代理⚡️静态⚡️独享⚡️5G⚡️最干净<Wifi住宅+5G移动>IP代理泰国仓储,本土仓发货2-3元/单
指纹浏览器,就用AdsPower谷歌/FB/Bing/Yahoo代理商开户7200W全球动态不重复住宅IP代理全球优质流量,选TrafficStars
出售Facebook,友缘号,FB广告号,insFB/TT/KW 加白开户比Adplexity还好用的Spy工具ADPLEXITY + ADVERTCN
FB不限额广告号MediaGo+Taboola+Ob开户百度国际MediaGo⚡️让产品狂奔全球百度国际,高点击转化,快速放量
百度国际MediaGo,独家原生流量虚拟信用卡+独立站收款行业首创新型指纹Cloak, 谷歌奇效!BINOM TRACKER 60% OFF!
Kookeey⚡️100%独享⚡️原生住宅IP⚡5000W动态住宅全场8折⚡全球虚拟卡, 支持U充值谷歌/Outbrain/Taboola⚡️一键开户
FB极速下户/白名单/不收费Affiliate站外引流服务⚡️极速出单免账户投放 FB 广告(送项目)2024做什么 - Media buy 项目库
免费黑五教程(持续更新、欢迎交流)Facebook 批量上广告Facebook账号1块一个各种主页、账单户、BM户(优势)
⚡️个人户,bm户不限额,账单户Adsterra 的CPA/CPM/CPC 网站流量在线注册美国/英国/香港等海外公司EU KETO/CBD - Jumbleberry
【YouTube】油管获利号交易平台三不限/账单户/BM不限额/直播主页FB二三解1元/个9Proxy ⚡️ $0.04/IP, 无限带宽
最佳Health和Beauty联盟广告位出租全球低价纯净住宅/移动IP-免费试用广告代投, 东南亚物流, 虚拟信用卡
VMLogin指纹浏览器+多账号防关联   
查看: 7144|回复: 6

大数据分析手段精准营销spark技术

[复制链接]

5

主题

14

广告币

93

积分

初级会员

Rank: 2

积分
93

社区QQ达人

发表于 2017-1-3 17:11:59 | 显示全部楼层 |阅读模式
adsterra
Chapter 1: Getting Started with Apache Spark 1
Introduction 1
Installing Spark from binaries 3
Building the Spark source code with Maven 5
Launching Spark on Amazon EC2 7
Deploying on a cluster in standalone mode 12
Deploying on a cluster with Mesos 16
Deploying on a cluster with YARN 18
Using Tachyon as an off-heap storage layer 21
Chapter 2: Developing Applications with Spark 27
Introduction 27
Exploring the Spark shell 27
Developing Spark applications in Eclipse with Maven 29
Developing Spark applications in Eclipse with SBT 33
Developing a Spark application in IntelliJ IDEA with Maven 34
Developing a Spark application in IntelliJ IDEA with SBT 36
Chapter 3: External Data Sources 39
Introduction 39
Loading data from the local filesystem 40
Loading data from HDFS 41
Loading data from HDFS using a custom InputFormat 45
Loading data from Amazon S3 47
Loading data from Apache Cassandra 49
Loading data from relational databases 54
ii
Table of Contents
Chapter 4: Spark SQL 57
Introduction 57
Understanding the Catalyst optimizer 60
Creating HiveContext 63
Inferring schema using case classes 65
Programmatically specifying the schema 66
Loading and saving data using the Parquet format 69
Loading and saving data using the JSON format 72
Loading and saving data from relational databases 74
Loading and saving data from an arbitrary source 76
Chapter 5: Spark Streaming 79
Introduction 79
Word count using Streaming 82
Streaming Twitter data 83
Streaming using Kafka 88
Chapter 6: Getting Started with Machine Learning Using MLlib 95
Introduction 95
Creating vectors 96
Creating a labeled point 98
Creating matrices 99
Calculating summary statistics 101
Calculating correlation 102
Doing hypothesis testing 104
Creating machine learning pipelines using ML 105
Chapter 7: Supervised Learning with MLlib ?Regression 109
Introduction 109
Using linear regression 111
Understanding cost function 113
Doing linear regression with lasso 118
Doing ridge regression 120
Chapter 8: Supervised Learning with MLlib ?Classification 121
Introduction 121
Doing classification using logistic regression 122
Doing binary classification using SVM 128
Doing classification using decision trees 131
Doing classification using Random Forests 138
Doing classification using Gradient Boosted Trees 143
Doing classification with Na飗e Bayes 145
iii
Table of Contents
Chapter 9: Unsupervised Learning with MLlib 147
Introduction 147
Clustering using k-means 148
Dimensionality reduction with principal component analysis 155
Dimensionality reduction with singular value decomposition 161
Chapter 10: Recommender Systems 167
Introduction 167
Collaborative filtering using explicit feedback 169
Collaborative filtering using implicit feedback 172
Chapter 11: Graph Processing Using GraphX 177
Introduction 177
Fundamental operations on graphs 178
Using PageRank 179
Finding connected components 181
Performing neighborhood aggregation 184
Chapter 12: Optimizations and Performance Tuning 187
Introduction 187
Optimizing memory 190
Using compression to improve performance 193
Using serialization to improve performance 193
Optimizing garbage collection 194
Optimizing the level of parallelism 195
Understanding the future of optimization ?project Tungsten 196
Index 199





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
相关帖子
回复

使用道具 举报

2

主题

676

广告币

726

积分

中级会员

Rank: 3Rank: 3

积分
726
发表于 2017-1-3 20:30:02 | 显示全部楼层
回复 支持 反对

使用道具 举报

6

主题

116

广告币

202

积分

初级会员

Rank: 2

积分
202

社区QQ达人

发表于 2017-1-3 20:40:05 | 显示全部楼层

文档打不开
回复 支持 反对

使用道具 举报

36

主题

664

广告币

1647

积分

高级会员

Rank: 4

积分
1647

社区QQ达人

发表于 2017-1-3 23:42:56 | 显示全部楼层
spark这种技术 aff圈会用吗
回复 支持 反对

使用道具 举报

16

主题

1095

广告币

2354

积分

高级会员

Rank: 4

积分
2354
发表于 2017-1-4 08:09:38 | 显示全部楼层
spark是什么技术?
回复 支持 反对

使用道具 举报

5

主题

14

广告币

93

积分

初级会员

Rank: 2

积分
93

社区QQ达人

 楼主| 发表于 2017-1-4 09:15:10 | 显示全部楼层
OReilly.Learning.Spark.2015.1.pdf  看这里!不知道为什么传上去打不开了 重新传了一份在这里,,

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复 支持 反对

使用道具 举报

1

主题

277

广告币

377

积分

初级会员

Rank: 2

积分
377

社区QQ达人

发表于 2018-5-5 03:44:55 | 显示全部楼层
下来看看的
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们|联系我们|DMCA|广告服务|小黑屋|手机版|Archiver|Github|网站地图|AdvertCN

GMT+8, 2024-3-29 15:59 , Processed in 0.053659 second(s), 15 queries , Gzip On, MemCache On.

Copyright © 2001-2023, AdvertCN

Proudly Operating in Hong Kong.

快速回复 返回顶部 返回列表