引言：我们维护 Hadoop系统的时候，必不可少需要对HDFS分布式文件系统做操作，例如拷贝一个文件/目录，查看HDFS文件系统目录下的内容，删除HDFS文件系统中的内容（文件/目录），还有HDFS管理信息，单独启动停止 namenode datanode jobtracker tasktracker等等一系列的操作。大家跟着做一遍呢！就会对HDFS的体系架构有更加深入的理解，不多说我们开始吧。
环境
操作系统： CentOS 6.0
hadoop版本：0.20.2
部署目录：/home/grid/hadoop-0.20.2
名称节点元数据位置：/home/grid/hadoop-0.20.2/tmp
数据节点数据位置：/home/grid/hadoop-0.20.2/data
master节点：h1
slave节点：h2 h4
master 和 slave 节点进程状态，现在进程都在启动着
[grid@h1 bin]$ jps
5182 Jps
4600 NameNode
4791 JobTracker
4728 SecondaryNameNode
[grid@h2 ~]$ jps
4471 Jps
3935 DataNode
4012 TaskTracker
[grid@h4 ~]$ jps
4001 TaskTracker
4508 Jps
3924 DataNode
[grid@h1 grid]$ mkdir input linux命令，创建一个input目录
[grid@h1 grid]$ ll
总用量 44
drwxr-xr-x. 14 grid hadoop 4096 9月 2 20:29 hadoop-0.20.2
drwxr-xr-x. 2 grid hadoop 4096 9月 16 19:56 input
drwxr-xr-x. 7 grid hadoop 4096 10月 22 2009 vmware-tools-distrib
drwxr-xr-x. 2 grid hadoop 4096 9月 1 13:55 公共的
drwxr-xr-x. 2 grid hadoop 4096 9月 1 13:55 模板
drwxr-xr-x. 2 grid hadoop 4096 9月 1 13:55 视频
drwxr-xr-x. 2 grid hadoop 4096 9月 1 13:55 图片
drwxr-xr-x. 2 grid hadoop 4096 9月 1 13:55 文档
drwxr-xr-x. 2 grid hadoop 4096 9月 1 13:55 下载
drwxr-xr-x. 2 grid hadoop 4096 9月 1 13:55 音乐
drwxr-xr-x. 3 grid hadoop 4096 9月 2 18:50 桌面
[grid@h1 grid]$ cd input/ linux命令，进入目录
[grid@h1 input]$ echo "hello leonarding" > test1.txt linux命令，把字符串"hello leonarding"重定向到test1.txt
[grid@h1 input]$ echo "hello world" > test2.txt linux命令，把字符串"hello world"重定向到test2.txt
[grid@h1 input]$ cat test1.txt linux命令，查看test1.txt文件内容
hello leonarding
[grid@h1 input]$ cat test2.txt linux命令，查看test2.txt文件内容
hello world
[grid@h1 input]$ cd ../hadoop-0.20.2/ linux命令，进入hadoop-0.20.2目录
[grid@h1 input]$ cd /usr/java/jdk1.6.0_25/bin
[grid@h1 bin]$ jps 直接输入jps=java进程统计
28037 NameNode 名称节点
32455 Jps
28220 SecondaryNameNode 辅助名称节点
28259 JobTracker 作业跟踪器

相关问答

hadoop搭建完全分布式完成，可是不会用[2023-08-27]

1、能搭好环境说明水平还不错。 2、下边应该分以下几步走：一，依据示例程序，自己手写wordcount之类的示例程序，以此充分了解m/r和hdfs的简单原理。二，针对某些知识点，如hadoop应用场景、hadoop的简单应用等，去百度一下搞定，这样的问题最关键、最需要做的。三，深入阅读hadoop的源码，把框架的数据流或说工作流搞个大致清楚。四，试着用hadoop解决一些实际问题和项目应用。参考下吧。
linux 分布式系统都有哪些？[2022-07-23]

常见的分布式文件系统有，GFS、HDFS、Lustre 、Ceph 、GridFS 、mogileFS、TFS、FastDFS等。各自适用于不同的领域。它们都不是系统级的分布式文件系统，而是应用级的分布式文件存储服务。 GFS（Google File System） -------------------------------------- Google公司为了满足本公司需求而开发的基于Linux的专有分布式文件系统。。尽管Google公布了该系统的一些技术细节，但Google并没有将该系统的软件部分作为 ...
关于分布式Hadoop在WINDOWS上操作问题[2023-11-29]

若在windows的Eclipse工程中直接启动mapreduc程序，需要先把hadoop集群的配置目录下的xml都拷贝到src目录下，让程序自动读取集群的地址后去进行分布式运行(您也可以自己写java代码去设置job的configuration属性)。　　若不拷贝，工程中bin目录没有完整的xml配置文件，则windows执行的mapreduce程序全部通过本机的jvm执行，作业名也是带有“local"字眼的作业，如 job_local2062122004_0001。这不是真正的分布式运行mapred ...
hadoop搭建完全分布式完成，可是不会用[2022-04-01]

搭建的文本，很久了，现在更新的最新版本搭建更加简单，建议你去看看黑马里边的教程，免费的
hadoop 集群和 hadoop 分布式怎么理解啊[2022-02-07]

hadoop集群指的是一群机器在一起提供一个hadoop的集群的服务。 hadoop分布式指的是hadoop支持任务分布式运行，因为有hadoop集群提供服务，所以hadoop将任务分发到集群的多台机器运行，所以叫做分布式。一个是服务器架构，一个是任务运行架构。
用 java遍历hadoop分布式文件系统中某个目录下的全部文件,我的hadoop是单节点的[2024-03-01]

原因：你访问的是本地文件系统而非hdfs ，因为Configuration默认的是在core-default.xml中的属性fs.default.name默认值是file:///，表示本地文件系统。在我们new Configuration();时会默认加载core-default.xml文件，所以根据这个文件的fs.default.name值使用了本地文件系统。解决方法：一般安装hadoop时都是修改core-site.xml文件，这个文件设置的属性值一般使用来覆盖core-default.xml这 ...
菜鸟求助阿！快疯了！Hadoop分布式系统下文件路径的问题[2023-10-09]

这个很简单啊，你在写路径的时候必须是绝对路径所有前面肯定有"/home"的啊，所以你在使用路径前先拼接个workDir Path workDir = h.getWorkingDirectory();// h是你得到的hdfs文件系统的句柄
是否可以在没有HDFS的情况下以伪分布式操作运行Hadoop？(Is it possible to run Hadoop in Pseudo-Distributed operation without HDFS?)[2022-09-21]

是的，这是可能的，虽然我使用0.19.2。我对0.18.3不太熟悉，但我确信它不应该有所作为。只要确保将fs.default.name设置为默认值（这是file:/// ），并将mapred.job.tracker设置为指向托管jobtracker的位置。然后使用bin / start-mapred.sh启动守护进程。您不需要启动namenode或datanode。在这一点上，你应该能够使用bin/hadoop jar ...来运行你的map / reduce作业bin/hadoop jar .. ...
solocloud on hadoop是什么意思？(What does solrcloud on hadoop mean?)[2022-03-08]

Solr（主要）用于存储和搜索，Hadoop（主要）用于分布式处理。他们解决不同的问题。最常见的是使用Solr和HDFS来存储/加载其索引文件，以便使用HDFS集群中的现有功能，或者允许通过Solr搜索已处理的Hadoop结果。如果您在Google上进行一些搜索，您会发现很多用例，演示文稿和库，例如LucidWorks的Hadoop集成， Solr + Hadoop或Hortonworks的索引以及在Apache Solr中搜索数据。 Solr is (mainly) for storage ...

知识点

相关文章

最近更新

Hadoop HDFS分布式文件系统

相关问答

hadoop搭建完全分布式完成，可是不会用[2023-08-27]

linux 分布式系统都有哪些？[2022-07-23]

关于分布式Hadoop在WINDOWS上操作问题[2023-11-29]

hadoop搭建完全分布式完成，可是不会用[2022-04-01]

hadoop 集群和 hadoop 分布式怎么理解啊[2022-02-07]

用 java遍历hadoop分布式文件系统中某个目录下的全部文件,我的hadoop是单节点的[2024-03-01]

菜鸟求助阿！快疯了！Hadoop分布式系统下文件路径的问题[2023-10-09]

是否可以在没有HDFS的情况下以伪分布式操作运行Hadoop？(Is it possible to run Hadoop in Pseudo-Distributed operation without HDFS?)[2022-09-21]

solocloud on hadoop是什么意思？(What does solrcloud on hadoop mean?)[2022-03-08]

知识点

相关文章

最近更新

Hadoop HDFS分布式文件系统

相关问答

hadoop搭建完全分布式完成，可是不会用[2023-08-27]

linux 分布式系统都有哪些？[2022-07-23]

关于分布式Hadoop在WINDOWS上操作问题[2023-11-29]

hadoop搭建完全分布式完成，可是不会用[2022-04-01]

hadoop 集群 和 hadoop 分布式 怎么理解啊[2022-02-07]

用 java遍历hadoop分布式文件系统中某个目录下的全部文件,我的hadoop是单节点的[2024-03-01]

菜鸟求助阿！快疯了！Hadoop分布式系统下文件路径的问题[2023-10-09]

是否可以在没有HDFS的情况下以伪分布式操作运行Hadoop？(Is it possible to run Hadoop in Pseudo-Distributed operation without HDFS?)[2022-09-21]

solocloud on hadoop是什么意思？(What does solrcloud on hadoop mean?)[2022-03-08]

hadoop 集群和 hadoop 分布式怎么理解啊[2022-02-07]