首页 \ 问答 \ 与Hadoop一起理解Spark(Understanding Spark alongside Hadoop)

与Hadoop一起理解Spark(Understanding Spark alongside Hadoop)

在我的设置中,Hadoop和Spark都在同一网络上运行,但在不同的节点上运行。 我们可以将Spark作为单独的服务启动,与现有的Hadoop集群一起运行。 它会显示性能有任何改善吗?

我有大约10 GB的数千个文件加载到HDFS中。

我有8个节点用于Hadoop,1个主节点和5个工作用于Spark


In the set up I have, both Hadoop and Spark are running on the same network but on different nodes. We can run Spark alongside your existing Hadoop cluster by just launching it as a separate service. Will it show any improvement in performance?

I have thousands of files around 10 GB loaded into HDFS.

I have 8 nodes for Hadoop, 1 master and 5 workers for Spark


原文:https://stackoverflow.com/questions/26867910
更新时间:2023-06-13 22:06

最满意答案

好的,对不起,以上实际上工作正常 - 这是我的程序中的一个错误。


Ok, sorry, the above actually works fine-- it was a bug in my program.

相关问答

更多
  • 尝试这个: ?q=-id:["" TO *] Try this: ?q=-id:["" TO *]
  • 目前, .NET REST和Java REST工具包中没有内置的Lookback API支持。 另请参阅此文章作为一个不完美的解决方法,请参阅此帖提及解析修订。 您可以查询故事并获取RevisionHistory,Revisions和Description,并迭代结果解析“SCHEDULE STATE changed”字符串的各个修订的描述。 There is currently no built-in support for Lookback API in .NET REST tookit and in ...
  • 好的,对不起,以上实际上工作正常 - 这是我的程序中的一个错误。 Ok, sorry, the above actually works fine-- it was a bug in my program.
  • 哎呀,我最后的简单错误,但我会发布它,以防其他人试图做同样的事情:项目OID必须与你试图查询的版本中的项目相同。 或者更好的是,只需删除项目参数! Oops, simple mistake on my end but I'll post it just in case anyone else is trying to do the same thing: the project OID has to be the same as the project which is in the release you ...
  • 你是对的。 removeUnauthorizedSnapshots过滤当前的pagesize结果集,这意味着当所有结果都是或者曾经与不允许用户访问的项目相关联时,它实际上可能会返回一个结果为0的页面。 当你得到更多结果时,我不确定结果。 额外的过滤器应该只限制结果的数量,当我使用类似的代码时,我看到进一步减少。 但我想建议对Parent属性的过滤器进行语法更改。 根本没有在Lookback API中存储空,所以任何!= null或== null查询都有点误导。 在你的代码中它可以工作,但是在Parent = ...
  • 回顾工具包是一个实验工具包,并不完全支持。 https://github.com/RallyTools/Rally-Lookback-Toolkit 我怀疑它是否包含对api密钥的支持。 根据文档,你应该只使用setCredentials https://github.com/RallyTools/Rally-Lookback-Toolkit#rally-lookback-api-toolkit .setCredentials("username", "password") The lookback to ...
  • 该错误表示查询触及了用户无权查看的项目。 将_ProjectHierarchy添加到条件会更改范围并将结果限制为该层次结构中的项目。 例如,一个查询,如: { "PlanEstimate" : 5 } 将尝试返回工作区中的所有快照,计划估计值为5.将其更改为: { "PlanEstimate" : 5, "_ProjectHierarchy" : 1234 } 将结果更改为项目1234中的所有快照或其计划估计值为5的子项之一,可能是一组非常不同的结果。 如果用户可以访问工作区中的所有项目,那么他们就不应该得 ...
  • 正确的格式是: var testresults = teamProject.TestResults.Query("SELECT * FROM TestResult WHERE DateCompleted < '2017-05-24 07:41:44.137'"); 字段为DateCompleted ,时间格式为2017-05-24 00:00:00.000 。 注意: 存储在数据库中的DateCompleted使用UTC时间,因此当您运行查询时,应将本地时间转换为UTC时间以获得更准确的结果 The co ...
  • 当然,只需在_Type:{$in:["Defect","HierarchicalRequirement"]}添加_Type:{$in:["Defect","HierarchicalRequirement"]}即可。 所有工作项类型都存储在同一个集合中。 您还可以获取后代任务和测试任务。 Sure, just add _Type:{$in:["Defect","HierarchicalRequirement"]} to the query. All of the work item types are sto ...
  • 亚历杭德罗,你要求的是字段的变化,而不是字段的值。 这是对回顾api的常见误解。 有一种特殊的方法可以获得Agile Central中可用的帮助页面中显示的当前值。 返回的任何信息实际上都保存在“原始”和“数据”下面的对象中。 如果在拍摄快照时没有对这些字段进行“更改”,则每个值都可能不包含任何值。 Alejandro, you are asking for the changes in the fields, not the values of the fields. This is a common m ...

相关文章

更多

最新问答

更多
  • 您如何使用git diff文件,并将其应用于同一存储库的副本的本地分支?(How do you take a git diff file, and apply it to a local branch that is a copy of the same repository?)
  • 将长浮点值剪切为2个小数点并复制到字符数组(Cut Long Float Value to 2 decimal points and copy to Character Array)
  • OctoberCMS侧边栏不呈现(OctoberCMS Sidebar not rendering)
  • 页面加载后对象是否有资格进行垃圾回收?(Are objects eligible for garbage collection after the page loads?)
  • codeigniter中的语言不能按预期工作(language in codeigniter doesn' t work as expected)
  • 在计算机拍照在哪里进入
  • 使用cin.get()从c ++中的输入流中丢弃不需要的字符(Using cin.get() to discard unwanted characters from the input stream in c++)
  • No for循环将在for循环中运行。(No for loop will run inside for loop. Testing for primes)
  • 单页应用程序:页面重新加载(Single Page Application: page reload)
  • 在循环中选择具有相似模式的列名称(Selecting Column Name With Similar Pattern in a Loop)
  • System.StackOverflow错误(System.StackOverflow error)
  • KnockoutJS未在嵌套模板上应用beforeRemove和afterAdd(KnockoutJS not applying beforeRemove and afterAdd on nested templates)
  • 散列包括方法和/或嵌套属性(Hash include methods and/or nested attributes)
  • android - 如何避免使用Samsung RFS文件系统延迟/冻结?(android - how to avoid lag/freezes with Samsung RFS filesystem?)
  • TensorFlow:基于索引列表创建新张量(TensorFlow: Create a new tensor based on list of indices)
  • 企业安全培训的各项内容
  • 错误:RPC失败;(error: RPC failed; curl transfer closed with outstanding read data remaining)
  • C#类名中允许哪些字符?(What characters are allowed in C# class name?)
  • NumPy:将int64值存储在np.array中并使用dtype float64并将其转换回整数是否安全?(NumPy: Is it safe to store an int64 value in an np.array with dtype float64 and later convert it back to integer?)
  • 注销后如何隐藏导航portlet?(How to hide navigation portlet after logout?)
  • 将多个行和可变行移动到列(moving multiple and variable rows to columns)
  • 提交表单时忽略基础href,而不使用Javascript(ignore base href when submitting form, without using Javascript)
  • 对setOnInfoWindowClickListener的意图(Intent on setOnInfoWindowClickListener)
  • Angular $资源不会改变方法(Angular $resource doesn't change method)
  • 在Angular 5中不是一个函数(is not a function in Angular 5)
  • 如何配置Composite C1以将.m和桌面作为同一站点提供服务(How to configure Composite C1 to serve .m and desktop as the same site)
  • 不适用:悬停在悬停时:在元素之前[复制](Don't apply :hover when hovering on :before element [duplicate])
  • 常见的python rpc和cli接口(Common python rpc and cli interface)
  • Mysql DB单个字段匹配多个其他字段(Mysql DB single field matching to multiple other fields)
  • 产品页面上的Magento Up出售对齐问题(Magento Up sell alignment issue on the products page)