大数据技术原理与应用 - (2). 大数据处理框架 Hadoop
【第一篇】 - 大数据基础, 《大数据技术原理与应用, 林子雨》
本篇介绍大数据 (Big Data) 的基本概念、影响、应用领域等,还介绍了大数据处理框架 Hadoop。
- 第1章 - 大数据概述
- 第2章 - 大数据处理框架 Hadoop
第二章介绍了 Hadoop 特性、应用现状,还介绍了 Hadoop 生态系统及其各个组件。
【第一篇】 - 大数据基础, 《大数据技术原理与应用, 林子雨》
本篇介绍大数据 (Big Data) 的基本概念、影响、应用领域等,还介绍了大数据处理框架 Hadoop。
第二章介绍了 Hadoop 特性、应用现状,还介绍了 Hadoop 生态系统及其各个组件。
【第一篇】 - 大数据基础, 《大数据技术原理与应用, 林子雨》
本篇介绍大数据 (Big Data) 的基本概念、影响、应用领域等,还介绍了大数据处理框架 Hadoop。
第一张章介绍了大数据的基本概念、影响、应用领域、关键技术等等内容。
统计学习方法笔记总结。haven’t finished yet
回归:在数据中找到与某个点(目标)最近的k个点,k个点的均值为目标点的预测值。
优点:
缺点:
This is my review note of the DME course (Data Mining and Exploration (INFR11007), 2019) at the University of Edinburgh. The note include every steps to develop machine learning models and related knowledge, e.g., Exploratory Data Analysis (EDA), Data Preprocessing, Modeling and Model Evaluations. Remeber to read the ‘Lab’ section of each chapter
Non-robust Measure
Robust Measure
Median:
$$ median(x) = \begin{cases} x_{[(n+1)\mathbin{/}2]}& \text{; if $n$ is odd}\\ \frac{1}{2}[x_{(n\mathbin{/}2)}+x_{(n\mathbin{/}2)+1}]& \text{; if $n$ is even} \end{cases} $$Mode: Value that occurs most frequent
Numpy和Pandas对python中的数据处理很重要。尤其对于数据分析/挖掘,Pandas几乎不可或缺。写tutorial的起因是因为一次面试中被问到numpy中去重用哪个函数,发现自己对numpy的不熟悉,所以希望以此加深印象…(haven’t started yet)
Update your browser to view this website correctly.&npsb;Update my browser now