每天学习笔记分享

学习笔记分享-0001 2016-01-19

主题：免费的在线git版本控制工具的使用

内容概述

oschina 提供免费的git版本控制工具，介绍如何在上面新建自己的帐号，新建自己的项目，上传源码或资料，进行版本控制
解决实际需求

伴随知识和技术的积累，以后会在工作和生活中，遇到越来越多的同类或相似的问题需要面对和解决，如果没有很好的分类整理这些解决方法或方案供以后复用，那么将会是无休止的重复做以前同样的事情，10遍，100遍，是很正常的事情，这将严重影响工作效率和个人能力的体现。所以需要版本控制工具对项目或功能源码，笔记，电子书等各种资源进行分类管理和版本控制。

详细地址：https://opensourceteam.gitbooks.io/bigdata/content/tools/version/gitoschinanet.html
（坚持每天做一次学习笔记分享，厚积薄发，坚信技术大咖就是这样日复一日，年复一年练就的,大家互免）

------------------------

学习笔记分享-0002 2016-01-19

主题：分布式集群环境中SSH免密登录之脚本化

内容概述

通过脚本在集群环境中的主节点机器上执行一次，所有集群中的节点，完成免密登录操作，缺点(未完成功能)，目前还要在主节点上对每台机器输入一次密码，进行验证
解决实际需求

分布式集群环境中经常需要进行节点之间的数据的通信，相互之前访问经常需要输入密码是一种很麻烦而且不易于编程化使用，所以我们需要进行配置，进行免密登录。

详细地址：https://opensourceteam.gitbooks.io/bigdata/content/ubuntu/userd/sshmian_mi_deng_lu_ff0d_ji_qun.html

（坚持每天做一次学习笔记分享，厚积薄发，坚信技术大咖就是这样日复一日，年复一年练就的,大家互免）

------------------------------------

学习笔记分享-0003 2016-01-20

主题：分布式集群环境中部署==>spark maven

功能概述

分布式计算，HDFS文件系统上的一个目录（目录下的所有文件）或一个文件的内容，各单词的统计个数，（单词之间以空格来分隔）
scala或java 语言开发 spark程序
通过maven 打包 spark 项目
通过maven 打包后,都可以直接在 idea 工具中直接运行项目,把应用部署到集群中去
也可以直接运行 spark-submit.sh 部署工具
maven scala 打包命令
java执行:mvn clean compile package -DskipTests
scala执行:mvn clean scala:compile compile package -DskipTests
解决实际需求

分布式集群环境之所以效率高，讲究的是多台机器并行运算，整合集群中的硬件资源进行最大化运算，分别部署到每台机器上去执行相应的应用程序是一件很麻烦头疼的事情，所以用各框架自带的工具，自动、打包、部署应用程序到集群环境中去
源码下载 scala 版：https://git.oschina.net/opensourceteams/spark-maven-scala-idea.git
源码下载 java 版 https://git.oschina.net/opensourceteams/spark-maven-java-idea.git
更多资料分享： https://opensourceteam.gitbooks.io/bigdata/content/notes/share/mei_tian_xue_xi_bi_ji_fen_xiang.html
坚持每天做一次学习笔记分享，厚积薄发，坚信技术大咖就是这样日复一日，年复一年练就的,大家互免

=============================================================================

学习笔记分享-0004 2016-01-21

主题：系统环境变量引发的问题

提出的观点

能写在配置文件中的，绝对不配置环境变量
为了方便命令的使用，可以在用户根目下建一个文件夹如(~/run),然后把各执行命令写进该文件夹中
解决实际需求
- 由于现在硬件成本不断降低，企来生产环境配置很高，光内存就起步就是几十个G的内存，动则一，二百G的内存，硬盘也是T级别的起步
- 丰富的硬件配置导致，单台机器也不可能只跑单个应用程序，就是说一台机器可能会给一项目组或几个项目组用的，会跑很多应用程序，包括历史应用程序，而历史程序大都应用的版本比较低，如Java就普通是1.6,但是很多现在的新功能，都是1.7以上的才支持，所以会冲突，导致不可用 *特别是 java 框架太多，版本又很多，特别是各种多版本的集成问题，往往会不兼容，导致很难维护，很容易出错，并且相互影响
看看 hadoop,spark,那些框架依赖的变量，都是直接写在配置文件中，这样完全不会影响别的操作，因为文件中变量的作用域，就是这一次任务执行开始到结束就没了
系统环境变量引发的问题：https://opensourceteam.gitbooks.io/bigdata/content/ubuntu/configuration/huan_jing_bian_liang_pei_zhi_wen_ti.html
更多资料分享： https://opensourceteam.gitbooks.io/bigdata/content/notes/share/mei_tian_xue_xi_bi_ji_fen_xiang.html
坚持每天做一次学习笔记分享，厚积薄发，坚信技术大咖就是这样日复一日，年复一年练就的,大家互免

=============================================================================

学习笔记分享-0005 2016-01-22

主题：maven 编译，打包工具的使用说明

解决实际需求

自动化，编译，打包，部署
解决各种jar包的依赖，方便维护，管理
节省资源，只在本地仓库中有一份依赖的jar文件，各项目中使用的只是引用仓库中的地址
很方便维护，因为在各项目中引用maven中的jar依赖只要很少很简单的xml说明描述符就可以
maven-安装:https://opensourceteam.gitbooks.io/bigdata/content/buildtool/maven/mavenan_88c5-_ti_huan_guo_nei_jing_xiang.html
maven-搭建本地仓库(适用 windows,mac,linux):https://opensourceteam.gitbooks.io/bigdata/content/buildtool/maven/mavenda_jian_ben_di_cang_5e9328_shi_yong_windows_,.html
maven-多源文件夹配置:https://opensourceteam.gitbooks.io/bigdata/content/buildtool/maven/mavenduo_yuan_wen_jian_jia_pei_zhi.html
更多资料分享： https://opensourceteam.gitbooks.io/bigdata/content/notes/share/mei_tian_xue_xi_bi_ji_fen_xiang.html
坚持每天做一次学习笔记分享，厚积薄发，坚信技术大咖就是这样日复一日，年复一年练就的,大家互免

=============================================================================

学习笔记分享-0006 2016-01-22

主题：hadoop 2.6.0集群安装

安装好 jdk 1.8 64位以上
安装好集群ssh免密登录
hadoop 安装包 hadoop-2.6.0.tar.gz
操做系统 ubuntu 15 64位

集群环境如下

  各节点分布
  s0为master主控制节点
  192.168.0.110 s0
  192.168.0.111 s1
  192.168.0.112 s2
  192.168.0.113 s3
  192.168.0.114 s4

集群配置说明先在s0上配置完成所有配置信息，然后同步到所有集群每一个节点上，所有配置包括安装路径是一样的
*详细: https://opensourceteam.gitbooks.io/bigdata/content/hadoop/install/hadoop_2_6_0_ji_qun_an_zhuang.html
了解更多资料：http://weibo.com/thinktothings
坚持每天做一次学习笔记分享，厚积薄发，坚信技术大咖就是这样日复一日，年复一年练就的,大家互免