海洋cms怎么设置宝塔自动采集教程

发布时间: 访问量:15



海洋cms怎么设置宝塔自动采集,由于很多人在问这个问题所以就有了这个教程,海洋cms虽然给了脚本代码,对于刚接触海洋cms的用户们理解起来并不是那么容易了,今天就深入的细化下海洋cms利用宝塔现实自动采集的具体步骤。海洋cms怎么设置宝塔自动采集第一步:获取脚本代码。【1】下面是海洋cms官网提供的自动采集脚本代码,我们需要修改代码里面的3项后才可以使用。#!/bin/bash######################################################### 程序名称: 海洋CMS自动采集脚本# 版本信息:seacmsbot/ v2.0# 发布链接: https://www.seacms.net/post-update-92579.htm# 使用方法:直接复制代码到宝塔计划任务shell脚本内容里添加每小时任务使用# 更新时间:2019.9.26########################################################### ①请修改下面的网站域名及管理目录web_site = "http://网站域名/管理目录/admin_reslib2.php"# ②请修改下面项内容为"admin_reslib2.php"里设置的访问密码(默认为系统设置的cookie密码)web_pwd = "8888e82e85bd4540f0defa3fb7a8e888"# ③下面项内容为资源站每日采集链接地址列表,请自行修改,每行一条,可添加多个,前后需添加引号。# 每日采集链接获取方法:选择"后台-采集-资源库列表",复制资源站右边的"采集每天"的链接地址,去掉?前面的内容。web_api = (    '?ac=day&rid=1&url=https://api.iokzy.com/inc/ldg_seackm3u8s.php'    '?ac=day&rid=2&url=http://www.zdziyuan.com/inc/s_ldgm3u8_sea.php')# 模拟用户浏览器ua,请勿随意修改,以免被目标防火墙拦截!web_ua = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)Chrome / 76.0.3809.100Safari / 537.36seacmsbot / 1.2;"# 采集单页functionget_content(){    echo"正在采集第$page页..."# echo  " get_content: --->url:--->$1"cResult =$(curl - -connect - timeout 10 -m 20  -k -s   -L -A "$web_ua"  "$1")echo $cResult | grep - q"采集"# echo  -e  "$1\n$cResult"if ["$?" = "0"]; thennext_content"$cResult"elseecho - e"采集失败,请检查设置!\n失败链接-->$1\n返回信息-->$cResult\n采集结束,共0页"fi}# 采集下页functionnext_content(){    # 统计数据    Result =$(echo "$1" | tr "<br>" "\n")a =$(echo "$Result" | grep -c  "采集成功")b =$(echo "$Result" | grep -c  "更新数据")c =$(echo "$Result" | grep -c  "无需更新")d =$(echo "$Result" | grep -c  "跳过")echo"采集成功-->已更$c部,新增$a部,更新$b部,跳过$d部"letadd +=$aletupdate +=$bletnone +=$cletjmp +=$d# 检测并采集下页next_url =${1  ##*location.href=\'}next_url =${next_url % %\'*}# echo $next_urlif ["${next_url:0:1}" = "?"]thenletpage + +get_content"$web_site$next_url"elseecho"采集结束,共$page页"fi}# 脚本入口echo"海洋CMS自动采集脚本开始执行 版本:v1.2"starttime =$(date +% s)update = 0  # 更新add = 0  # 新增none = 0  # 无变化jmp = 0  # 跳过for url in ${web_api[@]};doif[[! -z $url]]thenweb_param="$web_site$url&password=$web_pwd"page=1echo "开始采集:$url"get_content $web_paramfidoneendtime=$(date + % s)echo "============================"echo "入库-->$add部"echo "更新-->$update部"echo "跳过-->$jmp部(未绑定分类或链接错误)"echo "今日-->$[none+add+update]部"echo "============================"echo  "全部采集结束,耗时$[endtime - starttime]秒"海洋cms怎么设置宝塔自动采集第二步:修改脚本【2】具体修改脚本里面的哪3项呢?下面为你一一说来。(根据上面提供的代码内容复制到记事本或是其他html编辑器来对应修改)#①请修改下面的网站域名及管理目录web_site="http://网站域名/管理目录/admin_reslib2.php"这个是需要修改成你的“网站域名”和“海洋cms后台的管理目录”。域名大家都能理解,后台的管理目录这个对于新手来说需要多讲两句,首先你要能登录你的后台才可以知道你的后台目录。举例说明:假如我的后台登录地址是 https://www.mytheme.cn/article/那么这里的article就是后台的管理目录,得到了管理目录我们直接填写到代码里即可。#②请修改下面项内容为"admin_reslib2.php"里设置的访问密码(默认为系统设置的cookie密码)web_pwd="8888e82e85bd4540f0defa3fb7a8e888"#③下面项内容为资源站每日采集链接地址列表,请自行修改,每行一条,可添加多个,前后需添加引号。#每日采集链接获取方法:选择"后台-采集-资源库列表",复制资源站右边的"采集每天"的链接地址,去掉?前面的内容。web_api=(  '?ac=day&rid=1&url=https://api.iokzy.com/inc/ldg_seackm3u8s.php' '?ac=day&rid=2&url=http://www.zdziyuan.com/inc/s_ldgm3u8_sea.php' )这个是代码里需要修改的最后一项,里面是代码里默认提供的2个采集链接地址,我们需要获取自己的采集链接地址添加到里面,具体获取链接地址看下面截图的步骤操作。如果你还没添加或是不懂怎么添加采集可以参考帮助文档-海洋cms如何添加资源库采集接口选择"后台-采集-资源库列表",根据自己的选择去复制资源站右边的"采集当天"“采集本周” “采集所有”的链接地址,去掉?前面的内容。(鼠标放在采集当天或是本周、所有上鼠标右击复制链接即可获取采集链接)比如这里是:
1
http://127.0.0.1/admin/admin_res ... /ldg_seackm3u8s.php
第二步:去掉上一步复制到的内容"?"前面的内容,结果如下:
2
?ac=day&rid=1&url=https://api.iokzy.com/inc/ldg_seackm3u8s.php
这样就得到了最终的采集网址
海洋cms怎么设置宝塔自动采集第三步:宝塔定时任务设置。【3】直接复制代码到宝塔计划任务shell脚本,内容里添加每小时任务使用。具体操作步骤如下截图。第⑤步是把我们修改好的脚本复制粘贴到脚本内容框里即可。
4】总结总的来说就是把脚本里面需要修改的几项修改完后,复制修改好的脚本到宝塔的计划任务设置下定时采集任务就可以了,任务类型不要选错。如果你对本教程不理解或是疑惑的地方可以加入社群进行讨论和询问。

更多文章