知识点
相关文章
更多最近更新
更多nucth2.0 导入eclipse中
2019-03-27 01:13|来源: 网路
参照官网给的指导,RunNutchInEclipse 过程比较麻烦,也总是不能成功,而官网上给推荐的Build Nutch 2.0 in Eclipse 由于需要FQ,懒得没看。
为了能将nutch2.0 成功导入eclipse,前段时间我简单看了一下nutch的ant编译过程,简单分析了一下build.xml脚本,大致了解了一下整个ant编译过程,进而了解了在此过程中各个工作的依赖关系:
同时简单看了一下runtime/local/bin/nutch脚本,大致了解了一下执行时的调用过程。
nutch的主要源代码在src/java里面,而这些源文件需要依赖src/pulgin下面的代码生成的一些插件和ivy标记的一些jar包资源。
这些plugin文件的编译打包过程是在nutch的核心代码(src/java下的代码)编译之前进行的,并作为core部分的依赖项,而这部分的内容我不需要修改,所以,为了方便自己,我可以直接使用这部分的编译结果,而不必管它这些plugin的源代码,所以,在下面的过程中没有导入plugin的源代码,而是直接使用了这些代码的编译结果。
简单描述一下过程,以后会逐渐完善。
第一步:新建普通Java工程
第二步:将Nutch源码(路径是:Nutch根目录下“src/java/”下所有的文件)拷贝到java工程中的src目录下。
第三步:将Nutch运行依赖包加到class path中去。依赖包可以在Nutch根目录下runtime/local/lib文件夹中找到, 切记不可全选,请排除apache-nutch-2.1.jar ,否则当运行的时候,会首先去apache-nutch-2.1.jar中寻找配置文件。可能会报http.agent.name异常。(直接当依赖jars包导入工程即可)
第四步:将runtime/local/下的conf和plugins文件夹拷贝到java工程中去。此时,文件结构大致如下所示:
第五步:右键工程-》Properties-》Build Path-》选择Libraries-》点击Add Class Folder-》选择conf文件夹-》点击确定
第六步:右键Crawl.java文件-》Run As-》Run Configurations-》切换到Arguments选项卡-》加入运行参数,我的是官方例子中的参数,既:
因为我在早先配置好了solr,所以我的参数中带有solr的地址,大伙儿可以自行配置所需参数。
第二步:将Nutch源码(路径是:Nutch根目录下“src/java/”下所有的文件)拷贝到java工程中的src目录下。
第三步:将Nutch运行依赖包加到class path中去。依赖包可以在Nutch根目录下runtime/local/lib文件夹中找到, 切记不可全选,请排除apache-nutch-2.1.jar ,否则当运行的时候,会首先去apache-nutch-2.1.jar中寻找配置文件。可能会报http.agent.name异常。(直接当依赖jars包导入工程即可)
第四步:将runtime/local/下的conf和plugins文件夹拷贝到java工程中去。此时,文件结构大致如下所示:
第五步:右键工程-》Properties-》Build Path-》选择Libraries-》点击Add Class Folder-》选择conf文件夹-》点击确定
第六步:右键Crawl.java文件-》Run As-》Run Configurations-》切换到Arguments选项卡-》加入运行参数,我的是官方例子中的参数,既:
因为我在早先配置好了solr,所以我的参数中带有solr的地址,大伙儿可以自行配置所需参数。
最后附带两个链接,以后可能用得着,备份一下:
转自:http://www.cnblogs.com/chenying99/articles/3139613
相关问答
更多-
android 3d游戏开发 所需要的软件[2023-10-23]
eclipse -
怎么用eclipse导入sql server中的表格数据[2022-01-13]
这个sql文件是mysql的脚本,需要把 .sql导入到mysql数据库中,然后使用config.properties配置文件中的配置参数来链接mysql数据库 -
怎样将Weka的资源包导入到Eclipse中[2022-07-20]
http://wenku.baidu.com/view/d8d7a4254b35eefdc8d33303.html 建议你看看这个资料吧。 -
安卓应用程序开发使用哪个开发工具最好?[2022-11-21]
eclipse -
安卓手机编程现在用什么软件?并求下载地址。[2022-05-06]
eclipse -
在Windows上,您可以使用: Ctrl + shift + o这是组织导入的快捷方式 在Mac上,它是Command + Shift + O (Thanks orip) On Windows you can use: Ctrl+shift+o which is a shortcut to Organize imports On Mac it is Command+Shift+O (Thanks orip)
-
尝试通过以下菜单项清理项目: Project > Clean... 如果这不起作用,请尝试从构建路径中删除jar并再次添加。 I found the problem. It was the hibernate3.jar. I don't know why it was not well extracted from the .zip, maybe corrupt. A good way to check if jars are corrupt or not is navigating through th ...
-
将使用Maven生成的项目导入Eclipse Indigo的问题(Issue with importing projects generated with Maven into Eclipse Indigo)[2023-09-09]
好的,我发现了问题所在。 Maven不应该受到责备,这是一个Eclipse的事情。 这里有一个关于它是否是一个bug的讨论: https : //bugs.eclipse.org/bugs/show_bug.cgi?id = 344337 答案是:在工作区中的新SUBDIRECTORY中查看项目文件。 然后一切正常,项目名称正确导入。 如果您在工作区中签出,构建和导入项目文件,Eclipse将忽略.project文件中的项目名称。 Ok, I found out what the problem was. ... -
如何在Eclipse中添加sbt和Play 2.0可以看到的依赖项(How to add dependencies in Eclipse which sbt and Play 2.0 can see)[2023-02-14]
我只是通过sbt添加它们并从Play控制台重新生成eclipse项目。 I simply add them via sbt and regenerate the eclipse project from the Play console. -
你需要为build.sbt文件中的sbt导入maven的spark存储库 libraryDependencies += "org.apache.spark" % "spark-core_2.10" % "2.0.0" 同样可以在maven,gradle等的以下链接中找到https://mvnrepository.com/artifact/org.apache.spark/spark-core_2.10/2.0.0 you need to import maven repository of spark, l ...