欧利优SEO技巧方法锦集

Good Luck To You!

海洋CMS采集入库及脚本自动采集详细教程

相对于其它CMS,海洋CMS自动采集一直是新手比较困惑的地方,有鉴于此,特别写了这篇文章,希望能帮到大家,不会因为这些原因而放弃使用海洋CMS,就作者个人而言,还是比较喜欢海洋CMS的。

      本方案使用了脚本实现,完美解决宝塔url只能采集单页的问题, 参考了这篇文章里的Python3代码,用shell改写,方便直接复制在宝塔的计划任务里使用。

     效果如下图:


正文:


一. 创建计划任务


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
########################################################
# 程序名称: 海洋CMS自动采集脚本
# 版本信息:seacmsbot/1.0
# 发布链接: https://www.seacms.net/post-update-92579.htm
# 使用方法:直接复制代码到宝塔计划任务shell脚本内容里添加每小时任务使用
# 更新时间:2019.9.24
##########################################################
#!/bin/bash
#请修改下面的网站域名及管理目录
web_site="https://网站域名/管理目录/admin_reslib2.php"
#请修改下面项后面内容为系统设置里的cookie加密码
web_pwd="cookie加密码"
#源站每日采集链接地址列表,请按下面提示修改
#每日采集链接获取方法:选择"后台-采集-资源库列表",复制资源站右边的"采集每天"的链接地址,去掉?前面的内容
web_api=(
     #每日采集链接地址列表,请自行修改。注意:每行一条,前后需添加引号。
    '?ac=day&rid=2&url=http://www.zdziyuan.com/inc/s_ldgm3u8_sea.php' 
    '?ac=day&rid=1&url=https://api.iokzy.com/inc/ldg_seackm3u8s.php' 
    '?ac=day&rid=5&url=http://cj.zuikzy.com/inc/seazkm3u8.php'
     
)
#下面项是设置浏览器ua标志,模拟正常用户访问,目标网站或以此为依据进行拦截或放行
web_ua="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) 
Chrome/76.0.3809.100 Safari/537.36 from https://www.seacms.net/post-update-92579.htm seacmsbot/1.0;"
 
#脚本执行代码开始,请勿修改
function get_content() {
  echo  "正在采集第$page页" 
  #echo  " get_content: --->url:--->$1"
  cResult=$(curl -s  -L  -A "$web_ua"  "$1" )
  echo  "get_content: --->return(lenght:200):--->${cResult:0:200}..."
if "$?" "0" ]; then
   echo "done!"
else
  echo "err:$1" 
fi
 next_url=${cResult##*location.href=\'}
 next_url=${next_url%%\'*}
 #echo $next_url
 if "${next_url:0:1}" "?" ]
    then
    let page++
    get_content "$web_site$next_url"
  else
    echo "采集完成,共$page页"
  fi   
   
}
echo "海洋CMS自动采集脚本开始执行"
for url in ${web_api[@]}; 
do
    if [ ! -z $url ]
     then
           web_param="$web_site$url&password=$web_pwd"
           page=1
           echo "开始采集:$url"
           get_content $web_param 
     fi   
done


1. Linux系统的定时任务

      把上面的代码按需求修改配置后另存为"/var/www/job/seacmsbot.sh"

     执行下面的代码: 

1
2
3
chmod +x var/www/job/seacmsbot.sh
echo "* */1 * * * var/www/job/seacmsbot.sh">>/etc/crontab
service crond start

时间间隔格式: */分  */时  */天  */月  */星期    单位是数字。

2.宝塔计划任务

 复制上面的代码到宝塔的计划任务,如下图:


根据实际修改下面的代码:

1
2
3
4
5
6
7
8
web_site="http://网站域名/管理目录/admin_reslib2.php"  #设置后台路径
web_pwd="系统设置cookie密码"   #设置访问密码
#设置资源站地址,方法是复制每日采集链接按下面格式修改
web_api=(
    '?ac=day&rid=2&url=http://www.zdziyuan.com/inc/s_ldgm3u8_sea.php' 
    '?ac=day&rid=1&url=https://api.iokzy.com/inc/ldg_seackm3u8s.php' 
    '?ac=day&rid=5&url=http://cj.zuikzy.com/inc/seazkm3u8.php'
)

最后,点击"添加任务"即可。

二.  添加资源库

以添加第一个资源库为例:

1. 复制资源库地址

1
http://www.zdziyuan.com/inc/s_ldgm3u8_sea.php

  如下图:


2.添加资源

   操作路径:采集-资源库管理

  如下图:




3. 分类绑定

   操作路径:采集-资源库列表

   如下图,右边-分类绑定 点进去后绑定需要的分类


 




4.添加播放器

     操作路径:系统-播放来源管理

     如上图所示,复制来源标签,最下面有个添加选项,如下图所示:

5.  完成所有资源站的添加

    重复上面3个步骤完成脚本列表中所有的资源站的添加。

6. 设置强制使用解析

    操作路径:系统-播放器设置 ,如下图所示

    把刚才添加的来源标签"zuidam3u8#ckm3u8#zkm3u8" 添加到强制转换列表使用dp播放器播放。

  

注意:因为版本关系,可能设置稍有不同,使用解析开启并设置一个解析后,播放就不会有问题的。

          强制转换列表功能只是有自动连播,剧集显示等功能。


三. 脚本添加新的资源方法

     在资源站列表的"采集当天"的链接上点击鼠标右键,选择复制链接地址,如图所示,假设这里是:

1
  https://xx.cn/admin/admin_reslib.php?ac=day&rid=1&url=https://api.iokzy.com/inc/ldg_seackm3u8s.php

删除?前面的内容,然后前后加上引号 ,就是我们需要的地址,这里是:

1
'?ac=day&rid=2&url=http://www.zdziyuan.com/inc/s_ldgm3u8_sea.php'

添加到脚本中即可,例如:

1
2
3
web_api=(
    '?ac=day&rid=2&url=http://www.zdziyuan.com/inc/s_ldgm3u8_sea.php'
)


完,祝使用愉快!


注意:如果使用异常,请执行一次,查看日志内容分析原因,也可以贴在这里。


Powered By Z-BlogPHP 1.5.2 Zero

Copyright Your WebSite.Some Rights Reserved.SEO优化方法,SEO工具,SEO攻略,SEO排名技巧,SEO白帽方法,SEO快速排名软件,世界这么大,多想去看看

召唤伊斯特瓦尔