首页 \ 问答 \ redis rdb和aof的区别

redis rdb和aof的区别

更新时间:2023-12-28 16:12

最新回答

在windows上安装与配置spark

本节介绍在windows系统上安装spark的过程。在windows环境下需要安装cygwin模拟linux的命令行环境来安装spark。

(1)安装jdk

相对于linux、windows的jdk安装更加自动化,用户可以下载安装oracle jdk或者openjdk。只安装jre是不够的,用户应该下载整个jdk。

安装过程十分简单,运行二进制可执行文件即可,程序会自动配置环境变量。

(2)安装cygwin

cygwin是在windows平台下模拟linux环境的一个非常有用的工具,只有通过它才可以在windows环境下安装hadoop和spark。具体安装步骤如下。

1)运行安装程序,选择install from internet。

2)选择网络最好的下载源进行下载。

3)进入select packages界面(见图2-2),然后进入net,选择openssl及openssh。因为之后还是会用到ssh无密钥登录的。

另外应该安装“editors category”下面的“vim”。这样就可以在cygwin上方便地修改配置文件。

最后需要配置环境变量,依次选择“我的电脑”→“属性”→“高级系统设置”→“环境变量”命令,更新环境变量中的path设置,在其后添加cygwin的bin目录和cygwin的usr\bin两个目录。

(3)安装sshd并配置免密码登录

1)双击桌面上的cygwin图标,启动cygwin,执行ssh-host-config -y命令,出现如图2-3所示的界面。

2)执行后,提示输入密码,否则会退出该配置,此时输入密码和确认密码,按回车键。最后出现host configuration finished.have fun!表示安装成功。

3)输入net start sshd,启动服务。或者在系统的服务中找到并启动cygwin sshd服务。

注意,如果是windows 8操作系统,启动cygwin时,需要以管理员身份运行(右击图标,选择以管理员身份运行),否则会因为权限问题,提示“发生系统错误5”。

(4)配置ssh免密码登录

1)执行ssh-keygen命令生成密钥文件,如图2-4所示。

2)执行此命令后,在你的cygwin\home\用户名路径下面会生成.ssh文件夹,可以通过命令ls -a /home/用户名 查看,通过ssh -version命令查看版本。

3)执行完ssh-keygen命令后,再执行下面命令,生成authorized_keys文件。

cd ~/.ssh/ 
cp id_dsa.pub authorized_keys 
这样就配置好了sshd服务。

(5)配置hadoop

修改和配置相关文件与linux的配置一致,读者可以参照上文linux中的配置方式,这里不再赘述。

(6)配置spark

修改和配置相关文件与linux的配置一致,读者可以参照上文linux中的配置方式,这里不再赘述。

(7)运行spark

1)spark的启动与关闭

①在spark根目录启动spark。

./sbin/start-all.sh 
②关闭spark。

./sbin/stop-all.sh 
2)hadoop的启动与关闭

①在hadoop根目录启动hadoop。

./sbin/start-all.sh 
②关闭hadoop。

./sbin/stop-all.sh 
3)检测是否安装成功

正常状态下会出现如下内容。

-bash-4.1# jps 
23526 jps 
2127 master 
7396 namenode 
7594 secondarynamenode 
7681 resourcemanager 
1053 datanode 
31935 nodemanager 
1405 worker 
如缺少进程请到logs文件夹下查看相应日志,针对具体问题进行解决。
之前一直纠结怎么在Eclipse下调试用Java编写的spark程序,这里给大家讲一下步骤。实际上,没有几步,但是在网络上面不好找,几乎没有这样的文章或者技术贴。
在Eclipse下调试spark程序时,通常会用两种错误,第一种是hadoop的winUtils.exe有问题,第二种是序列化问题,错误表现是akka连接不上。
工具/原料
winUtils.exe
spark
方法/步骤
设置环境变量:HADOOP_HOME,在windows下调试Eclipse时,并不需要在windows下安装hadoop,只需要配置一下环境变量就好了,然后HADOOP_HOME执行的位置的bin下要有winUtils.exe,设置环境变量的方式不用讲了吧!

在Eclipse项目中添加spark-assembly-1.4.1-hadoop2.4.0.jar,这里添加你需要的版本。
注意,不要使用spark的分散的jar包,这一点主要是maven时需要注意,因为maven时它会下载好多jar,这里会引进第二个问题,序列化问题,应该是scala的问题。

设置环境变量SPARK_CLASSPATH,这个环境变量不是必须的,你看一下你的服务器是不是设置了。
其实这一步和下面的一步本质作用是一样的,都是告诉spark依赖的jar,而告诉spark依赖jar的方法有两种,一种是设置环境变量,另一种是addJar方式。作者是这样认为,如果公用的jar,那么就通过设置环境变量的方式,如果是算法私有的jar,就通过addJar方式。
注意,环境变量SPAKR_CLASSPATH的值是unix方式,就是跟服务器设置的一样,不要用win的方式“;”,为啥呢?作者认为,通过设置环境变量的方式时,在初始化spark上下文时,并没有分发jar到各个worker,所以需要指定jar在服务器的位置。(有问题的话,请留言,嘴拙)

addJar方式,上面讲过了。与环境变量的方式区别在于,驱动程序启动,初始化上下文时,需要分发jar到各个worker,所以针对私有的jar,最好使用addJar方式。

到了这里,应该全部配置完成了,如果我讲述的比较清晰的话,你应该可以随意调试了。
如果存在问题,请指正。如果有疑问,请留言。

END
注意事项
SPAKR_CLASSPATH,如果不知道怎么弄,那么就不要设置了,全用addJar方式

相关问答

更多
  • 好的,我知道了。 执行程序的数量实际上并不是Spark属性本身,而是驱动程序用于将作业放在YARN上。 因此,我使用SparkSubmit类作为驱动程序,并且它有适当的--num-executors参数,这正是我所需要的。 更新: 对于一些工作,我不再遵循SparkSubmit方法。 我不能主要为Spark作业只是其中一个应用程序组件(甚至是可选的)的应用程序执行此操作。 对于这些情况,我使用spark-defaults.conf连接到集群配置和spark.executor.instances属性。 这种方 ...
  • 有几个地方你可以设置它。 如果要基于每个作业启用它,请在每个应用程序中设置以下内容: conf.set("spark.dynamicAllocation.enabled","true") 如果要为所有作业设置if,请导航到spark.conf文件。 在Hortonworks发行版中它应该是 /usr/hdp/current/spark-client/conf/ 将设置添加到spark-defaults.conf并且应该很好。 There are several places you can set it ...
  • 由于您在本地模式下运行Spark,因此设置spark.executor.memory将不会有任何影响,正如您所注意到的那样。 这样做的原因是工作人员在您启动spark-shell时启动的驱动程序JVM进程中生活,并且使用的默认内存为512M 。 您可以通过将spark.driver.memory设置为更高,例如5g来增加 。 你可以这么做: 在属性文件中设置它(默认为spark-defaults.conf), spark.driver.memory 5g 或通过在运行时提供配置设 ...
  • Spark执行器被设置为3个区域。 存储 - 为高速缓存保留的内存 执行 - 为对象创建保留的内存 执行器开销。 在Spark 1.5.2及更早版本中: spark.storage.memoryFraction设置为1和2设置的内存比率。默认值为.6,因此为分配的执行程序内存的60%保留用于缓存。 根据我的经验,我只发现数量减少了。 通常,当开发人员遇到GC问题时,应用程序在对象中具有较大的“流失”,并且优化的第一个位置之一是更改memoryFraction。 如果您的应用程序不缓存任何数据,那么将其设置为 ...
  • 在提交到对象存储库时运行Spark猜测通常是一个非常糟糕的主意,这取决于查看下游数据和一致性模型的内容。 来自Netflix的Ryan Blue有一个很好的(非常有趣的)谈话,它解释了原因: https : //www.youtube.com/watch?v = BBHrff5yAQo 根据你的描述判断,我怀疑你正在写Parquet。 TL; dr版本是在S3中,重命名操作实际上是副本和删除,这具有一致性含义。 通常在Spark中,输出数据将写入临时文件位置,并在计算完成时重命名。 这意味着如果推测执行已启 ...
  • 找到了解决方案: 您为List控件的布局设置horizontalScrollPosition或verticalScrollPosition,而不是List控件本身。 例如 MXML AS3 listLayout.verticalScrollPosition=30; Found a solution: You set either horizontalScrollPosition or ve ...
  • 您需要设置样式,如下所示: @namespace s ...
  • 尝试在您的课程路径中包含Scala Jar 。 如果您不使用Maven,请下载jar并将其包含在Project构建属性中。 Try also to include Scala Jar at your class path. If you do not use Maven, download the jar and include it in the Project build properties.
  • 要调整应用程序,您需要了解一些事情 1)你需要监视你的应用程序,不管你的集群是否被利用或者你的应用程序使用了多少资源 可以使用各种工具进行监控,例如。 Ganglia从Ganglia你可以找到CPU,内存和网络使用情况。 2)基于对CPU和内存使用情况的观察,您可以更好地了解应用程序需要何种调整 形式火花点你 在spark-defaults.conf中 您可以指定需要哪种类型的序列化,即使您可以更改垃圾收集算法,您的应用程序也需要多少驱动程序内存和执行程序内存。 以下是几个示例,您可以根据您的要求调整此参数 ...
  • 在创建spark上下文时: sparkContext = { val conf = new SparkConf() .setAppName("Appname") .set("spark.storage.memoryFaction", "someval") new SparkContext(conf) } 或者在做火花提交时,添加: --conf spark.storage.memoryFaction=1 Either while creating th ...

相关文章

更多

最新问答

更多
  • 获取MVC 4使用的DisplayMode后缀(Get the DisplayMode Suffix being used by MVC 4)
  • 如何通过引用返回对象?(How is returning an object by reference possible?)
  • 矩阵如何存储在内存中?(How are matrices stored in memory?)
  • 每个请求的Java新会话?(Java New Session For Each Request?)
  • css:浮动div中重叠的标题h1(css: overlapping headlines h1 in floated divs)
  • 无论图像如何,Caffe预测同一类(Caffe predicts same class regardless of image)
  • xcode语法颜色编码解释?(xcode syntax color coding explained?)
  • 在Access 2010 Runtime中使用Office 2000校对工具(Use Office 2000 proofing tools in Access 2010 Runtime)
  • 从单独的Web主机将图像传输到服务器上(Getting images onto server from separate web host)
  • 从旧版本复制文件并保留它们(旧/新版本)(Copy a file from old revision and keep both of them (old / new revision))
  • 西安哪有PLC可控制编程的培训
  • 在Entity Framework中选择基类(Select base class in Entity Framework)
  • 在Android中出现错误“数据集和渲染器应该不为null,并且应该具有相同数量的系列”(Error “Dataset and renderer should be not null and should have the same number of series” in Android)
  • 电脑二级VF有什么用
  • Datamapper Ruby如何添加Hook方法(Datamapper Ruby How to add Hook Method)
  • 金华英语角.
  • 手机软件如何制作
  • 用于Android webview中图像保存的上下文菜单(Context Menu for Image Saving in an Android webview)
  • 注意:未定义的偏移量:PHP(Notice: Undefined offset: PHP)
  • 如何读R中的大数据集[复制](How to read large dataset in R [duplicate])
  • Unity 5 Heighmap与地形宽度/地形长度的分辨率关系?(Unity 5 Heighmap Resolution relationship to terrain width / terrain length?)
  • 如何通知PipedOutputStream线程写入最后一个字节的PipedInputStream线程?(How to notify PipedInputStream thread that PipedOutputStream thread has written last byte?)
  • python的访问器方法有哪些
  • DeviceNetworkInformation:哪个是哪个?(DeviceNetworkInformation: Which is which?)
  • 在Ruby中对组合进行排序(Sorting a combination in Ruby)
  • 网站开发的流程?
  • 使用Zend Framework 2中的JOIN sql检索数据(Retrieve data using JOIN sql in Zend Framework 2)
  • 条带格式类型格式模式编号无法正常工作(Stripes format type format pattern number not working properly)
  • 透明度错误IE11(Transparency bug IE11)
  • linux的基本操作命令。。。