ZSKY的作者应该是比较早开始研究DHT磁力链接这块领域的人,我还记得很久前他在Hostloc上发的一系列的磁力链接程序安装和讨论相关的帖子,在我眼里,他是一个热心并且无私奉献的人~
ZSKY是他最近发布的作品,之前我也第一时间知道,但貌似有很多人安装后反应有一些问题,所以我就不急着安装啦,等作者完全都更新调试好后再来安装也不迟,这不一个多月过去了,经常更新的ZSKY现在应该已经很稳定了,所以今天LALA也来尝试搭建一番~
在开始之前我觉得有必要先稍微介绍一下ZSKY这款磁力链接搜索程序的一些特性。首当其冲我要说的是,ZSKY的爬虫只爬取:电影、音乐这些格式的资源,其他资源是不支持爬取的,我个人觉得这个设定有利也有弊,只看各位大佬怎么看了。如果你需要那种爬全网资源没有格式限制的,可以考虑使用SSBC,有关SSBC的安装方法荒岛博客之前也有文章介绍过:
ZSKY相对SSBC来说的话,主要优势在三个方面:
其一:ZSKY的性能是绝对比SSBC要好的,这点毋庸置疑,作者在性能这块做的研究是最大的。
其二:ZSKY的后台功能比SSBC更完善,并且支持一些DIY类的功能,比如添加首页的搜索推荐等等。
其三:ZSKY目前在安装和使用中能遇到的问题基本上都有一个完善的解决方案,不会掉到坑里面去爬不出来~
说了一堆废话,现在来安装吧,安装过程非常简单,作者已经提供了一键安装包,CentOS7系统依次输入下面的命令即可:
yum -y install git git clone https://github.com/wenguonideshou/zsky.git cd zsky&&sh zsky.sh
我们需要注意一下的是,在安装的过程中会提示让我们输入一个管理员的账号密码以及邮箱:
在看到如下界面的时候才表面ZSKY是完全安装完毕了:
现在可以打开你的VPS或者服务器的公网IP来访问一下站点了:
在IP后面加上/admin即可访问到ZSKY的后台:
输入我们之前设置的账号和密码登录进去可以看到当前程序的运行状态:
在爬虫爬取了一定量数据并且入库后,我们可以给首页设置一些推荐搜索关键词,设置方法如下:
先按照上图点击文件管理,上传一张和关键词相关的图片,接着复制图片地址,点击首页推荐-创建:
在弹出的新窗口中,按如图填写信息:
Keyword就是关键词,Order是排序,Pic就填写我们之前上传图片的地址,Score是评分。设置好后刷新一下首页看看变化:
不知道是我哪里设置有问题还是怎么了,图片并不能显示出来,可能还需要更改一下默认模板才行,不过我比较懒就不改啦~
参观一下搜索结果界面:
参观一下文件信息界面:
至此整个安装和体验的过程就差不多结束了~
最后附上ZSKY作者的Github项目页面:
https://github.com/wenguonideshou/zsky
你在安装和使用ZSKY的过程中可能会遇到的问题:
Q:如何给首页的推荐影片添加图片、评分?
A:后台-文件管理-上传图片(图片名不能重复),后台-首页推荐-新建, 在“图片”选项中输入/uploads/图片地址 , 以及片名、评分、显示顺序 , 在templates/index.html里调用{{k.pic}}代表图片地址,{{k.score}}代表影片评分
Q:怎么限制/提高爬取速度?
A:修改simdht_worker.py里的max_node_qsize=后面的数字,越大爬取越快,越小爬取越慢
Q:觉得数据库空密码不安全,怎么修改数据库密码?
A:执行mysqladmin -uroot password 123456!@#$%^ //123456!@#$%^是新密码
Q:修改数据库密码后怎么修改程序里的配置?
A:修改manage.py里的mysql+pymysql://root:密码@127.0.0.1、修改manage.py里的DB_PASS、修改simdht_worker.py里的DB_PASS、修改sphinx.conf里的sql_pass
Q:怎么确定爬虫是在正常运行?
A:2个方法,1.查看后台首页爬虫日志 2.执行 ps -ef|grep -v grep|grep simdht 如果有结果说明爬虫正在运行
Q:更新版本/模板后怎么立即生效?
A:执行 systemctl restart gunicorn 重启gunicorn
Q:为什么首页统计的数据远远小于后台的数据?
A:在数据量变大后,索引将占用CPU 100%,非常影响用户访问网站,为了最小程度减小此影响 默认设置为每天早上5点更新索引,你想现在更新爬取结果的话,手动执行索引 systemctl restart indexer ,需要注意的是,数据量越大 索引所耗费时间越长
Q:如何查看索引是否成功?
A:执行 systemctl status indexer 可以看到索引记录
Q:觉得索引速度有点慢,怎么加快?
A:修改sphinx.conf里面的mem_limit = 512M ,根据你的主机的内存使用情况来修改,越大索引越快
Q:想确定搜索进程是否正常运行
A:执行 systemctl status searchd ,如果是绿色的running说明搜索进程完全正常
Q:发现又升级了,想重装,直接安装新版本,如何备份数据库?
A:执行 mysqldump -uroot -p zsky>/root/zsky.sql 导出数据库 //将提示输入当前密码,直接回车即可,数据库导出后存在/root/zsky.sql
Q:数据库备份后,现在重新安装了程序,如何导入旧数据?
A:执行 mysql -uroot -p zsky
Q:怎么修改搜索结果数量,默认1000条太少了
A:修改manage.py里的max_matches=1000
Q:sitemap数量默认是100太少了,怎么修改?
A:修改manage.py里的sql语句 ‘SELECT info_hash,create_time FROM film order by create_time desc limit 100’ 里的数量
Q:我觉得这程序非常垃圾,怎么卸载?
A:执行 mysql -uroot -p 将提示输入密码,输入密码后进入mysql管理界面,执行 drop database zsky; (注意必须带分号)这样就删除了数据库,然后执行yum -y remove nginx mariadb mariadb-devel mariadb-server redis&&rm -rf /root/zsky 就成功卸载此程序了
官方项目里面移除了 安装脚本 请问有具体安装方法吗
可以参考:https://www.vmvps.com/using-zsky-and-ssbc-to-build-your-own-dht-magnet-search-engine.html