首页 \ 问答 \ java 实现网络爬虫用哪个爬虫框架比较好

java 实现网络爬虫用哪个爬虫框架比较好

更新时间:2023-10-01 17:10

最满意答案

可以使用Jsoup 或者httpclient,还有完全成熟的框架webmagic等等

其他回答

你好!

有的,现成的开源框架一大堆

仅代表个人观点,不喜勿喷,谢谢。

相关问答

更多
  • 楼主可以去flash路上问问,那儿是专门培训flash设计的,老师都是业内的一些知名设计师。 不过是要收学费的,虽然不贵。
  • 可以使用Jsoup 或者httpclient,还有完全成熟的框架webmagic等等
  • java 爬虫怎么做[2021-07-26]

    网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。 传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。对于垂直搜索来说,聚焦爬虫,即有针对性地爬取特定主题网页的爬虫,更为适合。 以下是一个使用java实现的简单爬虫核心代码: public void crawl() throws Throwable { while (continueCrawling()) { Craw ...
  • 多看看书 看看类似的视频吧 建议你去看尚学堂的视频 挺不错的!
  • Think in JAVA 不错的书,侯捷编译的
  • 你问的应该是手机程序吧 编写java程序工具有很多 现在用的最多的就是MyEclipse和Eclipse 两者差不多 当然只用一个记事本也可以编写的 呵呵 java制作出来的东西也不是所有的手机都能用的 如果你手机比较老 java版本低估计很多应用都用不了 而且java应用程序还与手机的屏幕大小有关系 要下就下与自己手机屏幕大小一样的 想学java的话个人感觉最好还是可以去培训机构 那样学起来简单也快很多 自学太麻烦
  • 要系统学习的话非《java编程思想》莫属
  • C语言视频教程 谭浩强编,曾怡教授讲解的! 一共28课,一共1.74G,用迅雷下,挺快的,我就在看,打开要用科建播放器下载地址(华军软件园: http://p2s.newhua.com/down/XPR1242327.exe 太平洋软件: http://dlb.pchome.net/multimedia/media/XPR1081127.exe) http://download.anqn.com/anqn.com-051008-c28.rar http://download.anqn.com/anqn.co ...
  • 其实我不建议楼主找视频,并不是说视频方面一定出不了好的教学视频,但是目前真正牛X的教程一般都是书籍!!!楼主最好是针对一个领域找经典的教程来看。我也是计算机专业的,最好的老师绝对是兴趣以及书籍!一定要学会看书,否则举步维艰。世上无难事,只怕有心人.小学文化也完全可以学会编程,兴趣是最好的老师.编程是人做出来的,哪有人学不会的?可以找我交流,24259 79 960

相关文章

更多

最新问答

更多
  • 获取MVC 4使用的DisplayMode后缀(Get the DisplayMode Suffix being used by MVC 4)
  • 如何通过引用返回对象?(How is returning an object by reference possible?)
  • 矩阵如何存储在内存中?(How are matrices stored in memory?)
  • 每个请求的Java新会话?(Java New Session For Each Request?)
  • css:浮动div中重叠的标题h1(css: overlapping headlines h1 in floated divs)
  • 无论图像如何,Caffe预测同一类(Caffe predicts same class regardless of image)
  • xcode语法颜色编码解释?(xcode syntax color coding explained?)
  • 在Access 2010 Runtime中使用Office 2000校对工具(Use Office 2000 proofing tools in Access 2010 Runtime)
  • 从单独的Web主机将图像传输到服务器上(Getting images onto server from separate web host)
  • 从旧版本复制文件并保留它们(旧/新版本)(Copy a file from old revision and keep both of them (old / new revision))
  • 西安哪有PLC可控制编程的培训
  • 在Entity Framework中选择基类(Select base class in Entity Framework)
  • 在Android中出现错误“数据集和渲染器应该不为null,并且应该具有相同数量的系列”(Error “Dataset and renderer should be not null and should have the same number of series” in Android)
  • 电脑二级VF有什么用
  • Datamapper Ruby如何添加Hook方法(Datamapper Ruby How to add Hook Method)
  • 金华英语角.
  • 手机软件如何制作
  • 用于Android webview中图像保存的上下文菜单(Context Menu for Image Saving in an Android webview)
  • 注意:未定义的偏移量:PHP(Notice: Undefined offset: PHP)
  • 如何读R中的大数据集[复制](How to read large dataset in R [duplicate])
  • Unity 5 Heighmap与地形宽度/地形长度的分辨率关系?(Unity 5 Heighmap Resolution relationship to terrain width / terrain length?)
  • 如何通知PipedOutputStream线程写入最后一个字节的PipedInputStream线程?(How to notify PipedInputStream thread that PipedOutputStream thread has written last byte?)
  • python的访问器方法有哪些
  • DeviceNetworkInformation:哪个是哪个?(DeviceNetworkInformation: Which is which?)
  • 在Ruby中对组合进行排序(Sorting a combination in Ruby)
  • 网站开发的流程?
  • 使用Zend Framework 2中的JOIN sql检索数据(Retrieve data using JOIN sql in Zend Framework 2)
  • 条带格式类型格式模式编号无法正常工作(Stripes format type format pattern number not working properly)
  • 透明度错误IE11(Transparency bug IE11)
  • linux的基本操作命令。。。