发新话题
打印

(转)用ruby写一个爬虫程序捉取《疯狂的程序员》

(转)用ruby写一个爬虫程序捉取《疯狂的程序员》

最近在CSDN的一个blog上看到一篇网络小说连载《疯狂的程序员》,看了头几篇来了兴趣,就准备都弄下来放到手机上看。小说到现在连载到50多集,前面试读的几篇都是手工复制到文本文件,虽然说手工50多次ctrl+c, ctrl+v也不是特别麻烦,但学过编程的人心理就是会觉得做这档事会不爽^^ 于是就决定用ruby写个爬虫程序来搞定这个小任务。

相关链接:
ruby的html实体转换库:HTMLEntities(http://htmlentities.rubyforge.org/)
String.scan()文档:http://www.ruby-doc.org/core/classes/String.html#M000827
String.gsub!()文档:http://www.ruby-doc.org/core/classes/String.html#M000839

源代码压缩包中有两个文件,csdn_crawler.rb是视频中用到的代码,csdn_crawler2.rb是在csdn_crawler.rb基础上处理了一写额外问题的,并加入注释,方便阅读。

    * 视频下载地址:
    * ==> 点击这里下载ruby写爬虫程序视频教程
    * ==> 点击这里下载ruby写爬虫程序源代码
    * 解压密码:www.17rumen.com

TOP

哦,哦,有没有 python的?

TOP

初来乍到

ruby会点 下来研究研究

TOP

这个程序好啊!

TOP

谁写个PYTHON的

TOP

谁有perl的啊,呵呵,好像中国的perl不是太时兴哦

TOP

发新话题