易采下载站下载nodejs 爬虫框架-哔哩搜索 v1.0—源码之家-易采下载站

下载排行|最近更新

软件
软件
文章
当前位置:首页其他源码其他源码 → nodejs 爬虫框架-哔哩搜索 v1.0
nodejs 爬虫框架-哔哩搜索 v1.0

nodejs 爬虫框架-哔哩搜索 v1.0

下载地址
  • 软件大小: 2.42 MB
  • 软件语言:简体中文
  • 更新时间:2021-04-18
  • 软件类别:国产软件
  • 软件性质:自由软件
  • 运行环境:nodejs/Mysql/Mongodb
  • 软件等级:
  • 官方网址:homepage
  • 演示地址:demo
  • 软件介绍
  • 软件截图
  • 猜你喜欢
  • 同类推荐
  • 相关文章

软件Tags:

nodejs 爬虫框架-哔哩搜索 v1.0哔哩搜索-百度网盘搜索引擎是一个以node.js进行开发的百度云分享爬虫项目。同时也是一个简单高效的nodejs爬虫模型。github上有好几个这样的开源项目,但是都只提供了爬虫部分,这个项目在爬虫的基础上还增加了保存数据,建立elasticsearch索引的模块,可以用在实际生产环境中,不过web模块还是需要自己开发。安装:安装node.js和pm2,node用来运行爬虫程序和索引程序,pm2用来管理node任务安装mysql和mongodb,mysql用来保存爬虫数据,mongodb用来保存最终的百度云分享数据,这些数据是json格式的,用mongodb保存更方便。git clone https://github.com/callmelanmao/yunsharecnpm i推荐使用cnpm命令安装npm依赖,最简单的安装方式$ npm install -g cnpm --registry=https://registry.npm.taobao.org更多安装cnpm的命令可以去淘宝NPM 镜像上面找。初始化爬虫数据(主要是url列表)都是保存在mysql数据库的,yunshare使用sequelizejs做orm映射,源文件在src/models/index.js,默认的mysql用户名和密码都是root,数据看是yun,你需要手动创建yun数据库create database yun default charset utf8密码根据自己需要进行修改,完成mysql配置之后就可以运行下面的命令gulp babelnode dist/script/init.js注意必须先运行gulp babel把es6代码编译成es5,然后运行初始化脚本导入初始数据,数据文件在data/hot.json,里面,是从页面 http://yun.baidu.com/pcloud/friend/gethotuserlist?type=1&from=feed&start=0&limit=24&bdstoken=ac95ef31d3979f6ee707ef75cee9f5c5&clienttype=0&web=1 保存下来的。启动项目yunshare使用pm2进行nodejs进程管理,运行pm2 start process.json启动所有的后台任务,检查任务是否正常运行可以用命令pm2 list,正常运行的应该有4个任务。启动elasticsearch索引elasticsearch索引程序也已经写好了,mapping文件在data/mapping.json,请确保你已经安装elasticsearch 5.0的版本之后才运行索引程序,命令pm2 start dist/elastic.js。默认的elasticsearch地址是http://localhost:9200,如果你需要修改这个地址,可以在src/ElasticWorker.js里面修改,修改任何js源码之后记得运行gulp babel,在重启pm2任务,不然修改是不会生效的。在完成elasticsearch配置之后,你也可以在process.json里面添加一项elastic任务,这样就不需要单独启动索引程序了。

展开内容

下载地址

同类推荐

推荐文章

友情链接关于我们下载帮助(?)联系我们投诉举报

CopyRight © 2010-2023 易采下载 Easck.com , All Rights Reserved 版权所有 蒙ICP备14002389号

声明: 本站所有软件和文章来自互联网 如有异议 请与本站联系

声明: